ie里的探索之定制浏览器好助手(下)
(作者:青苹果工作室编译 2001年02月08日 14:00)
访问文档对象
现在 bho 引用了 internet explorer 的 webbrowser 控件并已经连接到浏览器 以接收它产生的事件。在 web 页面被完全下载并被正确地初始化之后,现在终于可以通过 dhtml 文档对象模型访问它了。webbrowser 的 document 属性返回一个指向文档对象的 idispatch 接口的指针:
ccomptr<idispatch> pdisp;
hresult hr = m_spwebbrowser2->get_document(&pdisp);
get_document() 方法提供的只是一个指向接口的指针。我们需要确定在 idispatch 指针后面确实是一个 html 文档对象。如果使用 visual basic,以下是等价的代码:
dim doc as object
set doc = webbrowser1.document
if typename(doc)="htmldocument" then
get the document content and display
else
disable the display dialog
end if
现在我们需要判断 get_document() 返回的 idispatch 指针的实质。internet explorer 不仅是一个 html 浏览器,还能处理任何 activex 文档 ;即任何有作为 activex 文档服务程序的应用程序支持的文档。这样一来,就不能保证查看的文档的确是一个 html 页面。
有一个解决办法就是查看 url 并检查 url 的扩展名。但该如何处理 active server pages (asp) 或一个暗含指向 html 页面的 url?如果你使用了像 about 或 res 这样的定制协议又该如何?
我们决定采取另一种方式,它和上面的 visual basic 代码性质相同。这种想法就是,如果 idispatch 指针确实指向一个 html 文档,对 ihtmldocument2 接口的访问就能成功地返回。ihtmldocument2 是综合了 dhtml 对象模型为 html 页面实现的所用功能的接口。以下代码片断说明如何进行这样的判断:
ccomptr<idispatch> pdisp;
hresult hr = m_spwebbrowser2->get_document(&pdisp);
ccomqiptr<ihtmldocument2, &iid_ihtmldocument2> sphtml;
sphtml = pdisp;
if (sphtml) {
// 取得文档的内容并显示它
}
else {
// 禁止代码窗口控件
}
如果访问 ihtmldocument2 接口失败,sphtml 指针为 null。否则,我们就可以正常访问 dhtml 对象模型的方法和属性了。
现在的问题是如何获得已显示的页面的源代码。幸好,基本的 dhtml 知识就足以做到这一点。由于 html 页面将它所有的内容包含在 <body> 标记中,dhtml 对象模型要求你首先获得指向 body 对象的指针:
ccomptr<ihtmlelement> m_pbody;
hr = sphtml->get_body(&m_pbody);
奇特的是,dhtml 对象模型不让你知道在 <body> 之前的标记,例如 <head> 的原始内容。这些内容已经被处理并被保存到一系列属性中了,但你依然不能得到一个最初的 html 文件的原始内容。然而,现在 body 能告诉我们的就足够了。我们需要将 outerhtml 属性的内容读取到一个 bstr 变量里以获得包含在 <body> 和 </body> 之间的 html 代码。
bstr bstrhtmltext;
hr = m_pbody->get_outerhtml(&bstrhtmltext);
现在,在代码窗口中显示文本的工作就是创建窗口、将字符串从 unicode 转换为 ansi,并如图 3 中所示设置编辑框。以下是完成这些工作的全部代码:
hresult cviewsource::getdocumentcontent()
{
uses_conversion;
// 获得 webbrowser 文档对象
ccomptr<idispatch> pdisp;
hresult hr = m_spwebbrowser2->get_document(&pdisp);
if (failed(hr))
return hr;
// 验证我们得到了一个指向 ihtmldocument2 接口的指针
// 我们查询 ihtmldocument2 接口 (通过灵巧指针)
ccomqiptr<ihtmldocument2, &iid_ihtmldocument2> sphtml;
sphtml = pdisp;
// 获得文档的源代码
if (sphtml)
{
// 获得 body 对象
hr = sphtml->get_body(&m_pbody);
if (failed(hr))
return hr;
// 获得 html 文本
bstr bstrhtmltext;
hr = m_pbody->get_outerhtml(&bstrhtmltext);
if (failed(hr))
return hr;
// 将文本从 unicode 转换为 ansi
lptstr psz = new tchar[sysstringlen(bstrhtmltext)];
lstrcpy(psz, ole2t(bstrhtmltext));
// 允许修改文本
hwnd hwnd = m_dlgcode.getdlgitem(idc_text);
enablewindow(hwnd, true);
hwnd = m_dlgcode.getdlgitem(idc_apply);
enablewindow(hwnd, true);
// 设置代码窗口的文本
m_dlgcode.setdlgitemtext(idc_text, psz);
delete [] psz;
}
else // 文档不是 html 页面
{
m_dlgcode.setdlgitemtext(idc_text, "");
hwnd hwnd = m_dlgcode.getdlgitem(idc_text);
enablewindow(hwnd, false);
hwnd = m_dlgcode.getdlgitem(idc_apply);
enablewindow(hwnd, false);
}
return s_ok;
}
由于我们运行这段代码以响应 documentcomplete 通知,每个新页面都会迅速地自动处理。dhtml 对象模型允许你修改显现的页面的结构,但在你按 f5 键或浏览器的 refresh 按钮刷新视图后,所有的修改会立即丢失。通过对 downloadcomplete 事件进行处理你能同时刷新代码窗口。(注意 downloadcomplete 事件比 documentcomplete 事件先到达) 这时,你应该忽略第一次下载页面时产生的 downloadcomplete 而只考虑刷新时产生的事件。一个简单的布尔成员例如 m_bdocumentcompleted 可以用来区分这两种情况。
管理代码窗口
用以显示当前页面的 html 源代码的代码窗口是 atl 的另一个基本元素,一个可以在 atl 对象向导的 miscellaneous 页里找到的对话框窗口。我们重置这个窗口的尺寸以响应 wm_initdialog 消息,并使此窗口占据桌面工作区,即屏幕的可用部分减掉任务栏可能占据位置最下面的部分。
浏览器启动时此窗口可能出现也可能不出现。默认情况下它是出现的,但可以通过清除复选框 show window at startup 禁止。如果你愿意也可以关掉它。随后,可以在任何时候按 f12 键将其召回。f12 由我们在 setsite() 中安装的键盘挂钩捕获。
启动设置完全按照 microsoft 指示保存在注册表里。读写注册表时我们没有使用 win32 函数,而是使用了新的 shell lightweight api (shlwapi.dll),这样 可以避免打开和关闭相应的注册表项的麻烦:
dword dwtype, dwval;
dword dwsize = sizeof(dword);
shgetvalue(hkey_current_user, _t("software\\msdn\\bho"),
_t("showwindowatstartup"), &dwtype, &dwval, &dwsize);
这个 dll 是在 internet explorer 4.0 和 active desktop 中引入的,从 windows 98 开始成为标准的系统组件。这些函数比相应的 win32 函数更直接,适合只进行一次读写时使用。
注册助手对象
bho 是 com 服务程序,应该同时以 com 服务程序和 bho 注册。atl 模板为你提供了完成第一项注册的注册脚本代码 (rgs) 。以下是完成 bho 注册的 rgs 代码。(clsid 是从例程序中得到的。)
hklm {
software {
microsoft {
windows {
currentversion {
explorer {
browser helper objects {
forceremove {1e1b2879-88ff-11d2-8d96-d7acac95951f}
}}}}}}}
注意 forceremove 子句使键在对象取消注册时被删除。
在 browser helper objects 键下是所有安装的助手对象。浏览器从不将这些放入缓存,所以安装并测试 bho 是一个很快的过程。
bho小结
本文中,我们介绍了浏览器助手对象,一种相对来说比较新的、在浏览器的地址空间内直接引入你的代码的有效方式。你所要做的就是编写一个 com 服务程序以支持 iobjectwithsite 接口。这里,你的模块从所有预定目的来看都是浏览器机构中的一个组件。本文中我们建立的例程序还涉及到如 com 事件、动态 html 对象模型以及 webbrowser 编程接口等内容。我们认为它演示了 bho 的功能,同时提供了一个创建你自己对象的实用平台。如果你需要知道浏览器正在显示什么,你一定需要熟悉事件并进一步了解 webbrowser。现在你知道:预先警告是为了早做准备。作为结语,我们提醒你 bho 对 windows explorer 非常有用,而且,通过 webbrowser,它能由你的代码驱动。
