<frame scrolling=NO noresize>
<frame src=http://b2b.sohu.com/company/coms70/yp350235.html>
</frameset><noframes>
<body>
<script language='JavaScript'>
window.top.location.replace('http://b2b.sohu.com/company/coms70/yp350235.html');
</script>
</body>
</noframes>
</HTML>
也就是在当前 A站:http://sjzxhx.sohu.net/的网页http://sjzxhx.sohu.net/index.html"index.html
"是没有内容的只有标题"河北新鸿禧文化传播有限公司"。而我们打开站点看见的包含的B网页:http:
//b2b.sohu.com/company/coms70/yp350235.html的内容!
但是返回到搜索结果你发现到他竟然抓取的内容是"河北新鸿禧文化传播有限公司是一家致力于国内、国
际文化传播,会议展览,营销策划的服务性机构。始终奉行"为客户创造最大价值"的服务宗旨。公司与
中国各地政府部门、贸促会系统、外经贸系统、商会、各行业协会、国际展览公司、各种媒体等进行了广
泛友好的 ...
"sjzxhx.sohu.net/ - 43k - 网页快照 - 类似网页
也就是B网页内容!
再次测试是否搜索的到,随便抽查一个针对此页的关键字"公司与意大利对外贸易委员会ICE和中国意大
利商会有着良好的合作关系"
http://www.google.com/search?q=鍏徃涓庢剰澶у埄瀵%
B9澶栬锤鏄撳鍛樹細ICE鍜屼腑鍥芥
忓ぇ鍒╁晢浼氭湁鐫鑹ソ鐨勫%8
8浣滃叧绯&btnG=鎼滅储&hl=zh-CN&newwindow=1
抓取的是B页面的内容,收录路径也是!
再次测试:河北新鸿禧文化传播有限公司
http://www.google.com/search?q=娌冲寳鏂伴缚绂ф枃鍖%
96浼犳挱鏈夐檺鍏徃&hl=zh-CN&newwindow=1
还是B网页内容!
再再次测试:site:sjzxhx.sohu.net
http://www.google.com/search?hl=zh-CN&newwindow=1&q=site:sjzxhx.sohu.net&btnG=Google %9
0滅储&lr=
因为"sjzxhx.sohu.net域下没有其他页所以就是这么一个结果!
但是你还是看家他爪取的内容是框架里的B页内容!
以上几个测试还是最后这个测试更具备代表性!
在百度:site:sjzxhx.sohu.net
http://www.baidu.com/s?ie=gb2312&bs=iis 中文域名&sr=&z=&cl=3&f=8&wd=site:s
jzxhx.sohu.net&ct=0
也实现了此技术!
搜索:河北新鸿禧文化传播有限公司
看见抓取的内容是B页的内容。显示的路径却是sjzxhx.sohu.net,在GOOGLE则是舍弃了sjzxhx.sohu.net
而显示的是框架里的页的绝对路径!
以上测试你发现了什么?和知道怎么去做了吗?
你需要研究下哪个筐架代码至少!
以前会发现搜索后的内容显示部分是"......"
比如:http://www.baidu.com/s?ct=0&ie=gb2312&bs=咖啡加盟&sr=&z=&cl=3&f=8&wd=%
CE尬畔⒏
至少也是"本网页使用了框架,但您的浏览器不支持框架。请下载新的浏览器观看。"
想想是不是呢?
现在你要优化框架型网页,那么你的方法该怎么执行,飘哥不用多说你也该明白了吧,有不理解的咨询QQ:19379458
转载请著明出处:http://www.piaoge.cn/article.asp?id=84
文章整理:西部数码--专业提供域名注册、虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!




