今日发帖:3903 | 昨日发帖:56727 | 新会员:棐武杵艳 
搜索 勋章中心 帮助
主题 : robots.txt的解释
级别: 荣誉版主
UID: 234828
精华: 8
发帖: 2394
馒头: 2561 个
包子: 9 个
注册时间: 2007-11-19
最后登录: 2011-06-08


查看该会员的广告店铺
0  发表于: 2007-12-16   

robots.txt的解释

怎么写robots.txt文件?
robots.txt是个很简单的文本文件,您只要标明“谁不能访问哪些链接”即可。
在文件的第一行写:
User-Agent: YodaoBot
这就告诉了爬虫下面的描述是针对名叫YodaoBot的爬虫。您还可以写:
User-Agent: *
这就意味着向所有的爬虫开放。需要注意的是一个robots.txt文件里只能有一个"User-Agent: *"。
接下来是不希望被访问的链接前缀。例如:
Disallow: /private
这就告诉爬虫不要抓取以"/private"开头的所有链接。包括/private.html,/private/some.html,/private/some/haha.html。如果您写成:
Disallow: /
则表明整个站点都不希望被访问。您也可以分多行来指定不希望被抓取的链接前缀,例如:
Disallow: /tmp
Disallow: /disallow
那么所有以"/tmp"和"/disallow"开头的链接都不会被访问了。

最后形成的robots.txt文件如下:
User-Agent: YodaoBot
Disallow: /tmp
Disallow: /private

请注意,如果您的robots.txt文件里有中文等非英语字符,请确定该文件是由UTF-8编码编写。
清空我的评分动态本帖最近评分记录: 共1条评分记录
libby 馒头 +4 2007-12-16 谢谢分享
隐藏评分记录
级别: 小学四年级
UID: 63096
精华: 1
发帖: 3183
馒头: 359 个
包子: 0 个
注册时间: 2007-09-29
最后登录: 2011-06-06


查看该会员的广告店铺
1  发表于: 2007-12-16   
学习................
级别: 小学六年级
UID: 16842
精华: 2
发帖: 802
馒头: 1169 个
包子: 1 个
注册时间: 2007-08-26
最后登录: 2012-02-06


查看该会员的广告店铺
2  发表于: 2007-12-17   
好萜
级别: 大学三年级
UID: 12706
精华: 0
发帖: 92
馒头: 46659 个
包子: 0 个
注册时间: 2007-08-23
最后登录: 2011-08-04


查看该会员的广告店铺
3  发表于: 2007-12-17   
该写的语句是


网站重地,蜘蛛止步。

它就不会来了
级别: 小学五年级
UID: 73909
精华: 2
发帖: 1469
馒头: 488 个
包子: 1 个
注册时间: 2007-10-04
最后登录: 2011-04-23


查看该会员的广告店铺
4  发表于: 2007-12-17   
不错,支持一下
呵呵
级别: 小学四年级
UID: 15650
精华: 0
发帖: 3
馒头: 281 个
包子: 0 个
注册时间: 2007-08-25
最后登录: 2009-04-06


查看该会员的广告店铺
5  发表于: 2007-12-17   
学习
级别: 小学三年级
UID: 283644
精华: 0
发帖: 34
馒头: 108 个
包子: 0 个
注册时间: 2007-12-07
最后登录: 2009-10-05


查看该会员的广告店铺
6  发表于: 2007-12-19   
Robots.txt 文件书写错误的检查工具

http://www.pageseo.com/seo-tools/Robots-Spider.php
级别: 荣誉版主
UID: 234828
精华: 8
发帖: 2394
馒头: 2561 个
包子: 9 个
注册时间: 2007-11-19
最后登录: 2011-06-08


查看该会员的广告店铺
7  发表于: 2007-12-19   
嘿嘿 美女大MM
级别: 小学四年级
UID: 299648
精华: 0
发帖: 398
馒头: 349 个
包子: 0 个
注册时间: 2007-12-14
最后登录: 2008-08-16


查看该会员的广告店铺
8  发表于: 2007-12-19   
好象是GOOGLE帐户里的吧,我的GOOGLE帐户里就有robots.txt文件

级别: 小学六年级
UID: 74485
精华: 0
发帖: 807
馒头: 802 个
包子: 0 个
注册时间: 2007-10-04
最后登录: 2009-05-21


查看该会员的广告店铺
9  发表于: 2007-12-19   
学习中!谢谢了
来自:yb4321.cn      5339252.cn
级别: 小学三年级
UID: 259421
精华: 0
发帖: 57
馒头: 126 个
包子: 0 个
注册时间: 2007-11-26
最后登录: 2011-06-22


查看该会员的广告店铺
10  发表于: 2007-12-20   
也研究过一段时间,很是不错!!!
描述
快速回复

按"Ctrl+Enter"直接提交