手机站
网通分站
电信主站
密 码:
用户名:
当前位置 : 主页>网站运营>搜索优化>列表

google开始可以抓取框架内容

来源:互联网 作者:west263.com 时间:2008-02-22
西部数码-全国虚拟主机10强!40余项虚拟主机管理功能,全国领先!双线多线虚拟主机南北访问畅通无阻!免费赠送企业邮局,.CN域名,自助建站480元起,免费试用7天,满意再付款! P4主机租用799元/月.月付免压金!

<frame scrolling=NO noresize>
<frame src=http://b2b.sohu.com/company/coms70/yp350235.html>
</frameset><noframes>
<body>
<script language='JavaScript'>
window.top.location.replace('http://b2b.sohu.com/company/coms70/yp350235.html&#39;);
</script>
</body>
</noframes>
</HTML>

也就是在当前 A站:http://sjzxhx.sohu.net/的网页http://sjzxhx.sohu.net/index.html"index.html

"是没有内容的只有标题"河北新鸿禧文化传播有限公司"。而我们打开站点看见的包含的B网页:http:

//b2b.sohu.com/company/coms70/yp350235.html的内容!

但是返回到搜索结果你发现到他竟然抓取的内容是"河北新鸿禧文化传播有限公司是一家致力于国内、国

际文化传播,会议展览,营销策划的服务性机构。始终奉行"为客户创造最大价值"的服务宗旨。公司与

中国各地政府部门、贸促会系统、外经贸系统、商会、各行业协会、国际展览公司、各种媒体等进行了广

泛友好的 ...
"sjzxhx.sohu.net/ - 43k - 网页快照 - 类似网页

也就是B网页内容!

再次测试是否搜索的到,随便抽查一个针对此页的关键字"公司与意大利对外贸易委员会ICE和中国意大

利商会有着良好的合作关系"
http://www.google.com/search?q=鍏徃涓庢剰澶у埄瀵%

B9澶栬锤鏄撳鍛樹細ICE鍜屼腑鍥芥

忓ぇ鍒╁晢浼氭湁鐫鑹ソ鐨勫%8

8浣滃叧绯&btnG=鎼滅储&hl=zh-CN&newwindow=1
抓取的是B页面的内容,收录路径也是!

再次测试:河北新鸿禧文化传播有限公司

http://www.google.com/search?q=娌冲寳鏂伴缚绂ф枃鍖%

96浼犳挱鏈夐檺鍏徃&hl=zh-CN&newwindow=1

还是B网页内容!

再再次测试:site:sjzxhx.sohu.net

http://www.google.com/search?hl=zh-CN&newwindow=1&q=site:sjzxhx.sohu.net&btnG=Google %9

0滅储&lr=

因为"sjzxhx.sohu.net域下没有其他页所以就是这么一个结果!
但是你还是看家他爪取的内容是框架里的B页内容!

以上几个测试还是最后这个测试更具备代表性!

在百度:site:sjzxhx.sohu.net

http://www.baidu.com/s?ie=gb2312&bs=iis 中文域名&sr=&z=&cl=3&f=8&wd=site:s

jzxhx.sohu.net&ct=0

也实现了此技术!

搜索:河北新鸿禧文化传播有限公司

看见抓取的内容是B页的内容。显示的路径却是sjzxhx.sohu.net,在GOOGLE则是舍弃了sjzxhx.sohu.net

而显示的是框架里的页的绝对路径!

以上测试你发现了什么?和知道怎么去做了吗?

你需要研究下哪个筐架代码至少!

以前会发现搜索后的内容显示部分是"......"

比如:http://www.baidu.com/s?ct=0&ie=gb2312&bs=咖啡加盟&sr=&z=&cl=3&f=8&wd=%

CE尬畔⒏

至少也是"本网页使用了框架,但您的浏览器不支持框架。请下载新的浏览器观看。"

想想是不是呢?

现在你要优化框架型网页,那么你的方法该怎么执行,飘哥不用多说你也该明白了吧,有不理解的咨询QQ:19379458

转载请著明出处:http://www.piaoge.cn/article.asp?id=84

责任编辑:图王 QQ:470666

文章整理:西部数码--专业提供域名注册虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!