百度站长俱乐部答问录

2019-03-08    来源:Semwatch

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

此前,由于缺少有效的沟通渠道,使得网站站长或从事搜索引擎营销的人士很难获取到直接来自百度的信息。自 4 月 7 日百度创建站长俱乐部以来,这种局面有所改善,业内几位高人已经受邀加入俱乐部,并代表站长们提出了一些针对百度在收录、链接、权重、算法等方面的问题,这些问题大都由 Zac 与柳焕斌提出或代问,百度官方用 Lee 和 kkksuper 的 ID 陆续做了回答。由于目前百度站长俱乐部采取的是邀请机制,所以无法产生大规模互动交流,SEM Watch 将其中部分摘录汇集,希望能够引起各位朋友的关注与讨论。想了解更多的内容及信息请移步至这里,同时,如果有需要向百度打探情报的朋友也请留言,因为 Zac 大侠也是常驻 SEM Watch 的。

关于网站

问:使用虚拟主机的网站会不会因为同一个 IP 或同一台服务器上有其他网站作弊被处罚而受连累,也被惩罚?

答:连坐,血统论等,是在极权社会里才出现的反人类政策。一个成熟的搜索引擎,这么蛮干的可能性很小。

问:将一个旧的 URL 进行 301 重定向处理,百度反应很慢?而且旧的 URL 会在相当一段时间内还存在于百度搜索结果中,但是网页标题是新的,缺少描述。

答:对于内容迁移,我们推荐的做法就是将旧 URL 301 永久重定向到内容对应的新 URL,这样我们会把旧 URL 积累的权值转移到新 URL 上。

为了避免种种不稳定的因素,目前我们的处理策略比较保守,新、旧 URL 会同时并存相当长的时间。最近我们意识到这样处理其实并不妥当,正在调研更迅速的处理方式,相信很快就可以完美的处理好这个问题。

问:百度对使用海外空间的中文网站有歧视吗?百度是否会抓取域名注册人的相关 whois 信息?

答:1、百度对海外站点没有歧视。但百度从国内爬出去的蜘蛛,会严格遵守国家的政策和法令,所以国内普通用户访问受限的内容,百度蜘蛛一样会搞不定。

2、任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。

问:百度如何看待伪原创?

答:“伪原创”就是“非原创”。对非原创的策略,同样适用于伪原创。归根结底,这是一个技术实现程度问题,而不是策略思路问题。

ZAC:好多人认为他们做的所谓“伪原创”挺好,应该能骗过搜索引擎,这大概低估了搜索引擎算法。还是得回到根本,内容为王。说起来容易,做起来难,很少人会认真去做。

问:百度如何对待过期域名?谷歌对过期的域名很长一段时间还有收录, 而百度却很快就会将其清空。

答:过期域名也是域名,所以,适用于新域名的策略,也一样适用于过期域名。只是过期域名在历史上累积的与现有网站无关的权重,会被剥离掉,这也是很容易理解的。

关于收录

问:大概在 4 月 1 日前后,很多站长用 site 查看自己在百度的收录数量,发现狂降,现在好像又恢复了,那是怎么回事?

答:我们也注意到了这种说法,其实收录方面没什么变动,只是我们在上线新策略的过程中短暂影响了结果数估算算法,大家只要关注一下流量即可知道,那段时间从百度获得的流量并没有变化,如果收录数真的发生了大的变动,肯定会影响流量。

另外,相信大家在用 site 语法查询结果数时,也看到了搜索结果最上方的“找到的相关网页数是估算值,不代表真实结果数,仅供参考的提示”的提示,我们的搜索结果数估算算法是针对正常用户的关键词检索而设计,没有针对site语法检索做过优化,它得出的搜索结果数只能做为一个参考,建议关注网站从百度获得的流量有没有变动更直接。

问:网站用 site: 查询,只有首页收录,请问是什么机制造成的?

答:两种情况:

1、新站点,具体内容还没来得及抓取和索引。

2、老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。

后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。呵呵。

问:一般来说,网站所有者不是太希望 https 的网页被收录。如果收录了,如果处理?把 https 的网页 URL 更换成 http 形式的?还有一种情况,就是 ip 地址形式的URL被收录。

答:如果不希望被收录,常规的做法是设置 robots 文件。

https 主要的出发点是安全,并没有太多考虑搜索引擎。从用户角度,很多采用了 https 的站点(尤其是首页),也是需要被搜索到的,比如支付宝,贝宝等。通常情况下,搜索引擎对这类网页并不做内容解析,而只是将 URL 进行索引。

IP 地址的 URL 被收录,除了 spider 在机制上的不完善之外,通常站点设计上也有一些缺陷。一般情况下,这类问题是可以被规避的。

问:百度数据更新的周期大概是多长?

答:如果是一个变化频繁的入口索引页面,相信这个变化周期会很短;而是相对稳固的内容型页面,周期则会相对较长。站长们观察一下蜘蛛的爬取日志,发现的规律会比这边的说明更有价值。

此外,搜索结果页上的那个时间,一直很让人confusing,我们正在考虑修改。

关于权重

问:百度是否跟踪 JS 链接并传递权重?因为有的时候某些页面得到太多权重没什么意义,比如用户登录、注册页面之类的。是否可以用简单的 JS 阻挡链接传递权重?

答:javascript 的解析,是很多搜索引擎正在做的事情;同理,对 flash 的解析。毕竟有那么多应用 javascript 或者 flash 的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写 robots 文件。

问:百度目前支持链接的 nofollow 属性吗?

答:百度现在支持 nofollow 标签。带 nofollow 标签的链接,我们会忽略掉它绝大部分的作用。

nofollow主要用在用户留言等不受站长控制的地方,这些地方的投票不是站长的意志,告诉搜索引擎不要给他投票是合适的。

问:百度对子域名如 news.domain.com 和主域名 www.domain.com 权重怎么处理?是当作两个不同的网站还是子域名会继承主域名的权重?

答:怎样处理是合乎逻辑的,策略上就会采用那个合乎常理的处理手段。或者这样讲,如果你是负责这个权重处理的,你觉得怎样做是最合理的?那么很可能百度就是如你所想的。呵呵。

搜索引擎理解起来并不复杂,站在用户角度考量,很容易揣摩搜索引擎的策略思路。

标签: 百度贴吧 站长俱乐

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:当你的网站优化过度了你应该怎么做呢?

下一篇:谷歌CN跳转HK对网站SEO影响