很多站长在维护客户网站的时候往往会遇到这样的问题,站长工具查询我们网站的收录量,为什么收录量会变化?到底是哪些因素影响的这个变化呢?
所以首先我们得知道的是百度会收录哪些网页,收录的目的是什么?
(1)寻找用户体验更好的网页?答案是No
(2)寻找综合质量更高的网页?答案也是No
蜘蛛抓取时其实并不知道内容的质量,因此蜘蛛抓取内容之后,得先保存到服务器上,以后再进行计算和更新,进行“取其精华 去其糟粕”的过程。
(3)其实真正的目的在于为了更好建立筛选的机制。
蜘蛛抓取内容,只能起到筛选的作用,把大概符合要求的网站选出来,收录你的网站的原因,不是因为体验好,内容好,而是页面本身达到了百度的收录要求,虽然体验和内容很重要。
说到这里,可能有人会问,那百度的筛选机制到底是什么样的呢?我们又该注意什么呢?
设定这个筛选机制就相当于给我们设定了一个门槛,达到条件的通过,没达到的就要淘汰。我们网站的内容是否收录与文章是不是原创无关,设定筛选机制的目的在于淘汰垃圾的内容、重复同质化的内容,从而保留优质的内容,从而节约时间和资源成本。因为百度服务器的空间是有限的,因此只能筛选并收录符合要求的页面。