YH533388银河官方网站
全部
All
当前位置: 首页 > 新闻资讯 > 什么是Robots协议
相关新闻
  • 数字经济将与产业互联网深度结合

    2026-04-27 11:17

    全球数字经济的发展迅速由消费互联网网站制作向产业互联网转化。2019年12月21日,信息社会50人论坛成功举办了“数字经济与产业互联网”为主题的年度盛会暨研讨会,中国经济正经历着前所未有的网

  • 网站维护人员应做好哪几方面工作

    2026-04-24 18:39

    现在互联网技术普及,甚至随便普通人,拿着黑客软件,都能拿下一个普通网站;当然,更不用说遇到空间商自身问题,例如服务器问题、数据丢失,那你辛苦做的网站建设将付诸东流。因此,对网站建设的定期备份

  • 网站维护的工作内容都包含什么?

    2026-04-04 06:44

    很多人认为网站维护是找个人,简单的在网站上发几篇文章,保证每天都更新够了。其实,网站维护远远不止这些。一个网站的维护涉及到很多方面,如:网站策划、设计、优化、运营、推广等。很多的企业对互联网

  • 建站老鸟与你分享网站建设前期应做哪些准备工作

    2026-04-03 22:37

    网站建设前期准备工作相当重要,这决定你建站的目的,以及日后维护网站,让你的网站开发发挥作用是相当的重要。在设计网站前,必须先准备好以下工作:1、网站开发风格要求在建站前必须知道网站的目的,是

  • 关于《微信平台手机号验证功能升级及收费》的相关答疑

    2026-04-02 13:25

    近期收到许多客户关于微信官方发布的《关于手机号快速验证组件升级及收费的通知》的来电咨询,现就相关问题答疑如下:一、通知要点平台将于2023年8月26日起对手机号验证能力收费,标准单价为:手机

什么是Robots协议

返回列表
发布时间:2026-04-20 20:25
Robots协议的全称是“网络爬虫排除标准”(Robots Exclusion
Protocol),网站通过Robots协议让搜索引擎知道哪些页面能抓取,哪些页面不能抓取。


公司网站设计案例


robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,可以创建和编辑它。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。


当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。



Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots
Meta标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots
Meta标签也是放在页面中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。


Robots
Meta标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。


index指令告诉搜索机器人抓取该页面;


follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;


Robots Meta标签的缺省值是index和follow,只有inktomi除外,对于它,缺省值是index、nofollow。



Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:音乐,视频等,节省服务器带宽;也可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。


Robots协议是网站出于安全和隐私考虑,防止搜索引擎抓取敏感信息而设置的。搜索引擎则会按照Robots协议给予的权限进行抓取。Robots协议代表了一种契约精神,互联网企业只有遵守这一规则,才能保证网站及用户的隐私数据不被侵犯。Robots协议是维护互联网世界隐私安全的重要规则,如果被破坏,其后果是不可想象的。