深圳易捷网络科技注册咨询网-jiujiuya.com.cn 返回首页

深圳seo教你玩转robots协议

信息来源:深圳市易捷网络科技有限公司
信息发布时间:2018-9-30 16:41:29

robots爬虫协议,相信很多SEOer或个人站长都不会感到陌生,即使刚入行的SEO小白也略有耳闻。对于SEO小白来说,只是听过robots爬虫协议并不了解robots协议真正意义和用法。今天深圳seo就来带大家一探究竟,并教你玩转robots协议。


什么是robots协议
robots(中文翻译为机器人),robots协议即搜索引擎爬虫协议,它是搜索引擎爬虫与网站站点沟通的“桥梁”。网站站点通过robots文件中的声明规则明确告知搜索引擎爬虫哪些文件/目录可以抓取,哪些文件/目录不可以抓取。
注意:如果网站站点存在不希望搜索引擎爬虫抓取收录的内容是,才有必要创建robots.txt文件;如果您希望搜索引擎收录网站上所有内容,则无需建立robots.txt文件。
robots.txt文件的存放位置
通常,网站的robots.txt文件放置在网站根目录下,便于搜索引擎爬虫****时间抓取该文件。
robots.txt文件格式
1、robots文件通常包含以一条或多条User-agent开始,后面加上若干条Disallow或Allow。
2、User-agent:用来描述搜索引擎robot的名字。
3、如果存在多条User-agent记录说明有多个robot会受到"robots.txt"的限制,至少要有一条User-agent记录。
4、如果User-agent的值设为*,则对任何robot均有效,且"User-agent:*"这样的记录只能有一条。
5、如果有"User-agent:SomeBot"和若干Disallow、Allow行,那么搜索引擎爬虫名为"SomeBot"只受到"User-agent:SomeBot"后面的Disallow和Allow行的限制。
6、Disallow:用来描述不希望被访问的一组URL。
7、这个值可以是一条完整的路径,也可以是路径的非****缀,以Disallow项的值开头的URL不会被robot访问。
8、比如:"Disallow:/help"这条规则表示的是禁止robot访问/help.html、/helpabc.html、/help/index.html等。
9、比如:"Disallow:/help/"这条规则表示的是允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。
10、"Disallow:"说明允许robot访问该网站的所有url,robots.txt文件中,至少要有一条Disallow记录。
11、如果网站根目录下robots.txt不存在或者为空文件,则对于所有的搜索引擎爬虫来说,该网站都是开放的。
12、Allow:用来描述希望被访问的一组URL。
13、与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL是允许robot访问的。
14、比如:"Allow:/hibaidu"这条规则表示的是允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。
15、使用"*"and"$":Baiduspider支持使用通配符"*"和"$"来模糊匹配url("*"匹配0或多个任意字符,"$"匹配行结束符)。
深圳SEO如何玩转robots协议
1、禁止所有搜索引擎爬虫访问网站的任何内容
User-agent:*
Disallow:/

2、允许所有搜索引擎爬虫访问网站的任何内容
User-agent:*
Allow:/
3、仅禁止baidu搜索引擎爬虫访问网站的任何内容
User-agent:Baiduspider
Disallow:/
User-agent:*
Allow:/
4、仅允许baidu搜索引擎爬虫访问网站的任何内容
User-agent:Baiduspider
Allow:/
User-agent:*
Disallow:/
5、仅允许baidu及google爬虫访问网站的任何内容
User-agent:Baiduspider
Allow:/
User-agent:Googlebot
Allow:/
User-agent:*
Disallow:/
6、仅允许baidu及360搜索引擎爬虫访问网站内容,并且禁止抓取所有图片和php网页内容
User-agent:Baiduspider
Allow:/
Disallow:/*.jpg$
Disallow:/*.jpeg$
Disallow:/*.png$
Disallow:/*.gif$
Disallow:/*.bmp$
Disallow:/*.php$
User-agent:360Spider
Allow:/
Disallow:/*.jpg$
Disallow:/*.jpeg$
Disallow:/*.png$
Disallow:/*.gif$
Disallow:/*.bmp$
Disallow:/*.php$
User-agent:*
Disallow:/
其他的robots爬虫协议规则,深圳seo就不在这里给大家一一举例了。大家可以自己去练习并理解,robots爬虫协议也是很重要的。

相关行业资讯

1、网站建设中哪些小细节会流失访客
2、请别继续忽略网站建设的价值
3、网站建设要注意四个问题
4、社交网络营销之制订“参与社交网络的规则”
5、解析页面优化的核心是什么
6、企业网站设计图片批量处理
7、企业做网站网站技术选型
8、网站外链建设资源渠道
9、建站系统的发展
10、故障隔离网站的检测和解决
11、网站开发测试都有哪些流程
12、网站建设需要注意的几个注意点
13、网站建设需要注意什么
14、哪些行业不能做SEO
15、企业网站建设—企业网站建设中容易被忽视哪些的问题
16、巧用论坛签名让seo优化不再复杂
17、什么是网站建设
18、教育培训行业的网站内容源解决方案
19、四个步骤学会网站外部链接建设SEO优化技巧
20、企业网站建设必须保证高端高质量
21、关于企业做网站建设的这几大步骤
22、互联网营销做SEO优化是否已经没有必要了?
23、企业网站建设的五大步骤
24、把站点优化好最直观的办法
25、网站建设之优化标准和方法
26、站内优化之pv篇
27、网站BNANER设计的方法有哪些
28、4点提升网站的优化体验度的建议
29、如何优化自己的网站结构
30、企业新做的网站为何很久都没索引量
31、浅析企业中的网站优化是什么样的呢
32、网络推广需要从哪些方面入手?
33、做好网络推广的目的是为了什么?
34、将网络推广到传统企业
35、浅谈高端网站定制
36、如何快速提升百度关键词排名
37、SEO软文标题怎么写吸引人2018标题写作套路大全
38、国外站长是怎么做seo网站优化的
39、网站制作要注意哪些要求
40、如何对网站进行修改
41、网站建设中域名转出的方式方法
42、网站计算网格的优点
43、如何查询网站备案结果
44、深圳企业网站建设的目的是什么
45、浅谈导致网站排名下降的几大因素
46、新站该如何优化 方能快速获得百度的认可?
47、网站外链建设的意义何在
48、网站SEO推广内容应该要注意事项
49、深圳网站建设对于我们与消费者的联系提供更好保证
50、浅谈网站内链布局的作用

相关视频推荐

自动化行业网站制作焊锡机/点胶机/螺丝机网站
企业网站制作新模式全部仅需800元/年
如何提高企叫网站打开速度
公司网站到期了该怎小续费
企业为什么必须要做一网站
企业网站的导航栏一般要规划哪些栏目
国际物流FBA物流网站建设深圳易捷网站公司公司
银制品金银器网站建设深圳易捷网站公司
包装印刷行业网站设计
膜结构公司网站设计
工商财务公司网站设计
购买一个域名需要多少钱
企业网站建设云虚拟主机需要多少钱
财务公言的网站怎么做才能显示在搜索引擎的首页
网站建设一站式服务
深圳网站建设公司网站排行榜
深圳市易捷网络科技有限公司版权所有     粤ICP备2022153140号
best smoke alarms australia |  vape detectors