深圳易捷网络科技注册咨询网-jiujiuya.com.cn 返回首页

深圳seo教你玩转robots协议

信息来源:深圳市易捷网络科技有限公司
信息发布时间:2025-6-20

robots爬虫协议,相信很多SEOer或个人站长都不会感到陌生,即使刚入行的SEO小白也略有耳闻。对于SEO小白来说,只是听过robots爬虫协议并不了解robots协议真正意义和用法。今天深圳seo就来带大家一探究竟,并教你玩转robots协议。


什么是robots协议
robots(中文翻译为机器人),robots协议即搜索引擎爬虫协议,它是搜索引擎爬虫与网站站点沟通的“桥梁”。网站站点通过robots文件中的声明规则明确告知搜索引擎爬虫哪些文件/目录可以抓取,哪些文件/目录不可以抓取。
注意:如果网站站点存在不希望搜索引擎爬虫抓取收录的内容是,才有必要创建robots.txt文件;如果您希望搜索引擎收录网站上所有内容,则无需建立robots.txt文件。
robots.txt文件的存放位置
通常,网站的robots.txt文件放置在网站根目录下,便于搜索引擎爬虫****时间抓取该文件。
robots.txt文件格式
1、robots文件通常包含以一条或多条User-agent开始,后面加上若干条Disallow或Allow。
2、User-agent:用来描述搜索引擎robot的名字。
3、如果存在多条User-agent记录说明有多个robot会受到"robots.txt"的限制,至少要有一条User-agent记录。
4、如果User-agent的值设为*,则对任何robot均有效,且"User-agent:*"这样的记录只能有一条。
5、如果有"User-agent:SomeBot"和若干Disallow、Allow行,那么搜索引擎爬虫名为"SomeBot"只受到"User-agent:SomeBot"后面的Disallow和Allow行的限制。
6、Disallow:用来描述不希望被访问的一组URL。
7、这个值可以是一条完整的路径,也可以是路径的非****缀,以Disallow项的值开头的URL不会被robot访问。
8、比如:"Disallow:/help"这条规则表示的是禁止robot访问/help.html、/helpabc.html、/help/index.html等。
9、比如:"Disallow:/help/"这条规则表示的是允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。
10、"Disallow:"说明允许robot访问该网站的所有url,robots.txt文件中,至少要有一条Disallow记录。
11、如果网站根目录下robots.txt不存在或者为空文件,则对于所有的搜索引擎爬虫来说,该网站都是开放的。
12、Allow:用来描述希望被访问的一组URL。
13、与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL是允许robot访问的。
14、比如:"Allow:/hibaidu"这条规则表示的是允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。
15、使用"*"and"$":Baiduspider支持使用通配符"*"和"$"来模糊匹配url("*"匹配0或多个任意字符,"$"匹配行结束符)。
深圳SEO如何玩转robots协议
1、禁止所有搜索引擎爬虫访问网站的任何内容
User-agent:*
Disallow:/

2、允许所有搜索引擎爬虫访问网站的任何内容
User-agent:*
Allow:/
3、仅禁止baidu搜索引擎爬虫访问网站的任何内容
User-agent:Baiduspider
Disallow:/
User-agent:*
Allow:/
4、仅允许baidu搜索引擎爬虫访问网站的任何内容
User-agent:Baiduspider
Allow:/
User-agent:*
Disallow:/
5、仅允许baidu及google爬虫访问网站的任何内容
User-agent:Baiduspider
Allow:/
User-agent:Googlebot
Allow:/
User-agent:*
Disallow:/
6、仅允许baidu及360搜索引擎爬虫访问网站内容,并且禁止抓取所有图片和php网页内容
User-agent:Baiduspider
Allow:/
Disallow:/*.jpg$
Disallow:/*.jpeg$
Disallow:/*.png$
Disallow:/*.gif$
Disallow:/*.bmp$
Disallow:/*.php$
User-agent:360Spider
Allow:/
Disallow:/*.jpg$
Disallow:/*.jpeg$
Disallow:/*.png$
Disallow:/*.gif$
Disallow:/*.bmp$
Disallow:/*.php$
User-agent:*
Disallow:/
其他的robots爬虫协议规则,深圳seo就不在这里给大家一一举例了。大家可以自己去练习并理解,robots爬虫协议也是很重要的。

相关行业资讯

1、推广优化策略利弊力量有限的现状缺陷_深圳网站建设公司
2、如何成为一个合格的HTML5动画
3、互联网运营数据分析十个经典方法
4、网站优化中外链建设中裸链介绍
5、seo网站中外链优化怎么做?
6、HTML5网页设计自适应手机的方法
7、网站建设对于企业来说有什么重要作用呢?
8、论2898站长资源平台微博、微信公众号营销推广的优势
9、网站建设如何做长尾关键词优化
10、新手推广优化网站经验分享
11、网站建设中的优化3步曲
12、网站整站优化和关键词优化有什么不同
13、哪些弊端会导致网站建设进展缓慢
14、域名解析教程看懂了,推广优化菜鸟也能变高手
15、SEO搜索引擎优化服务真是太强大了!
16、网站排名优化中如何合理的优化网站内链结构
17、网站推广和网络推广
18、深圳网站设计的核心内容有哪些?
19、编程语言的相关信息收集和统计
20、网页设计时字体该怎样使用
21、网站建设中面包屑导航有哪些作用
22、GG扑克高手进阶掌握这些技巧让你在牌桌上所向披靡
23、应该从哪些方面着手做好网页设计?
24、网站制作Z不能忽视的就是细节
25、网站标题修改后影响大吗
26、网站建设如何修改网站
27、网站上线前的准备工作你真的做好了吗
28、网站缺少404网站页面对seo有什么影响
29、网站建设浅谈如何策划网站专题
30、推广优化外链建设无用论到底谁说的
31、制作网站时要明智对待的几个方面
32、什么是投资回报率(ROI)一个用于社会化分析的框架
33、如何解决SEOER的快照问题
34、网站建设时重点是什么的呢
35、SEO交换友情链接的八大注意要点
36、个人对长尾关键词的理解及选择长尾词的优势
37、建立品牌网站的注意细节有哪些
38、如何为网站选取适合的长尾关键词
39、易捷网络谈网站建设六大注意事项及如何把握
40、怎样用搜索引擎快照突破网站内容限制
41、如何提升网站内页来源
42、网站建设该怎样进行策划
43、企业网页设计不得不知道的四大要素
44、手机端的SEO优化怎么做
45、网站数据库如何避免被注入
46、做网站要如何抓住用户的心
47、网站架构团队会议如何实施
48、让您的旅游网站盈利的3个方法
49、做网站之前应考虑的几个方面
50、面向对象方法学

相关视频推荐

自动化行业网站制作焊锡机/点胶机/螺丝机网站
企业网站制作新模式全部仅需800元/年
如何提高企叫网站打开速度
公司网站到期了该怎小续费
企业为什么必须要做一网站
企业网站的导航栏一般要规划哪些栏目
国际物流FBA物流网站建设深圳易捷网站公司公司
银制品金银器网站建设深圳易捷网站公司
包装印刷行业网站设计
膜结构公司网站设计
工商财务公司网站设计
购买一个域名需要多少钱
企业网站建设云虚拟主机需要多少钱
财务公言的网站怎么做才能显示在搜索引擎的首页
网站建设一站式服务
深圳网站建设公司网站排行榜
深圳市易捷网络科技有限公司版权所有    粤ICP备2022153140号