【官方说法】百度蜘蛛抓取流量暴增的原因_技术分享网

【官方说法】百度蜘蛛抓取流量暴增的原因

2016-12-30 来源：技术分享网作者：编辑员浏览次数：194

导读：

Spider对网站抓取数目突增往往给站点带来很大烦恼，纷纷找平台想要Baiduspider IP白名单，但实际上BaiduSpider IP会随时变化，所以并不敢宣布出来，担心站长设置不及时影响抓取效果。百度是怎么计算分配抓取流量的呢？站点抓取流量暴增的原因有哪些呢？

　　总体来说，Baiduspider会根据站点规模、历史上网站天天新产出的链接数目、已抓取网页的综合质量打分等等，来综合计算抓取流量，同时兼顾站长在抓取频次工具里设置的、网站可承受的最大抓取值。

　　从目前追查过的抓取流量突增的case中，原因可以分为以下几种：

　　1， Baiduspider发现站内JS代码较多，调用大量资源针对JS代码进行解析抓取

　　2，百度其他部分（如贸易、图片等）的spider在抓取，但流量没有控制好，sorry

　　3，已抓取的链接，打分不够好，垃圾过多，导致spider重新抓取

　　4，站点被攻击，有人仿冒百度爬虫（推荐阅读：《如何准确识别BaiduSpider》）

　　假如站长排除了自身题目、仿冒题目，确认BaiduSpider抓取流量过大的话，可以通过反馈中央来反馈，切记一定要提供具体的抓取日志截图。

【官方说法】百度蜘蛛抓取流量暴增的原因