加入收藏
|
设为首页
|
会员中心
|
我要投稿
李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
首页
站长资讯
随写记事
云计算
大数据
运营中心
综合聚焦
数据库
5G
编程开发
创业
百科
营销
教程
站长学院
业界
运营
编程
创业
建站
电商
移动
创业之路
当前位置:
首页
>
创业
>
C语言
> 正文
百度搜索引擎robots.txt文件说明与用法示例
发布时间:2020-12-15 03:16:15 所属栏目:C语言 来源:网络整理
导读:
什么是robots.txt文件? 搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一
什么是robots.txt文件?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
robots.txt文件放在哪里?
robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
网站 URL
相应的 robots.txt的 URL
http://www.w3.org/
http://www.w3.org/robots.txt
http://www.w3.org:80/
http://www.w3.org:80/robots.txt
http://www.w3.org:1234/
http://www.w3.org:1234/robots.txt
http://w3.org/
http://w3.org/robots.txt
我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?
(编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
相关内容
如何建立网站地图(site?map)
详谈iPhoneX截图如何带
Amazon Web Services(AWS)12个月免费体验安装配置过程
linux服务器之LVS、Nginx和HAProxy负载均衡器对比总结
Linux下几种并发服务器的实现模式(详解)
linux 中zabbix监控安装方法
网站SEO优化推广图片优化的一些技巧
HustOJ二次开发之隐藏菜单栏
深入解析草根网(20ju.com)的盈利手法
元旦放假安排一词之分词技术探讨
推荐文章
站长推荐
VBScript 根据IE窗口的标题输出ESC
牛人分析:个人站长网络赚钱收入的级别
基于list循环删除元素,迭代器失效的问题详解
创业奇才6岁开始做销售 12岁赚足50万
填坑铺路20160908
写给新手站长:最不可取的五个坏习惯
前端模块化笔记
原来ChaNet成果网也在做淘宝客推广营销
sublime快捷键汇总
新一代网页分析将海量数据用于媒体编辑决策
热点阅读