当前位置：学校资讯 > 行业新闻

浅析各大搜索引擎蜘蛛的那些事

发布日期：2023-03-31来源：武汉北大青鸟武汉校区作者：admin

　　做SEO每天打交道多的就是搜索引擎放出来的小机器人，也叫搜索引擎蜘蛛，我们要做的事情就是把它们伺候好，顺其意投其好。

　　一、列举一下各大搜索引擎蜘蛛的名字

　　google蜘蛛： googlebot，百度蜘蛛：baiduspider，搜狗蜘蛛：sogou spider，搜搜蜘蛛：Sosospider，yahoo蜘蛛：slurp，alexa蜘蛛：ia_archiver，msn蜘蛛：msnbot，altavista蜘蛛：scooter，lycos蜘蛛： lycos_spider_(t-rex)，alltheweb蜘蛛： fast-webcrawler，inktomi蜘蛛： slurp，有道蜘蛛：YodaoBot和OutfoxBot，热土蜘蛛：Adminrtspider 。当然这里只是象征性的列一下，就算我们分析日志的时候看到了也不要太奇怪，又或者你想禁止它们爬你的站点也是可以的。

　　二、一句话总结蜘蛛的习惯

　　google蜘蛛：不太爱爬，但爱收录。

　　百度蜘蛛：爬谨慎，收录更谨慎。

　　搜搜蜘蛛：爱爬图片，经常绕在动态地址里出不来。

　　雅虎蜘蛛：恪守规则，每次都是先爬robots.txt。

　　其他的没有太多留意，就不多说了。

　　三、对于robots.txt的支持程度

　　部分析可能也不现实，这里拿Disallow: /*?*分析(禁止动态页面抓取)。

　　google表现：写了禁止就不再爬，会在谷歌站长工具中列出来它想爬被你阻止了，如下图：

　　百度的表现：写了禁止之后很少爬，但是偶尔也会爬，相信是起作用了，因为越来越少，以前一天几次现在几天一次。

　　搜狗蜘蛛：可以说是基本不听话，也不知道是不是不吃这个规则，说它完不吃它也吃了一点，只是把动态地址的问号拿掉了，然后照爬，一爬就是一大片，这不知道它能爬出什么东西，如下图：

　　搜搜蜘蛛跟雅虎蜘蛛好像差不多，感觉还是挺有效的，禁止之后没有再有它爬过的痕迹。

　　文章铭睿(http://www.iyoov.com)原创分享，说的不是很面，只分析了动态的禁止，有些文件夹的禁止总体感觉跟上述的差不多，还有后缀的禁止没有试过，望后来者给予补充。

上一篇：网站建设何去何从？下一篇：新浪微博推搜索独立页微搜索时代或将来临

武汉北大青鸟

仅剩4人

浅析各大搜索引擎蜘蛛的那些事

热门信息

热点关注

热门课程