robots.txt 是存放在站点根目录下的一个纯文本文件,设置很简单,作用却很强大。它可以指定搜索引擎蜘蛛只抓取指定的内容,或者是禁止搜索引擎蜘蛛抓取网站的部分或全部内容。那么Z-Blog博客网站中的robots.txt文件怎么设置呢?我们先来了解一下Z-Blog博客网站的文件结构。
一、Z-Blog网站文件结构
● eed.php : RSS Feed 入口文件
● index.php : 前端页面入口文件
● search.php : 搜索入口文件
● zb_install 文件夹:zblog 初始化安装文件夹,安装完毕会自动删除,或手动删除
● zb_system 文件夹:为 zblog 框架的主要文件,需要屏蔽搜索蜘蛛去它以及它所包含的内容抓取
● zb_users 文件夹:为 zblog 为用户文件夹,里面包含了主题文件夹,插件文件夹,以及附件存放文件夹。
● avatar :用户头像文件夹
● cache :缓存文件夹
● data :数据文件夹(屏蔽蜘蛛)
● emotion :表情文件夹
● language :语言包文件夹(屏蔽蜘蛛)
● logs :目志文件夹,里面文件是记录错误的(屏蔽蜘蛛)
● plugin :插件文件夹
● theme :主题文件夹
● upload :附件文件夹(图片或其它类型文件)
二、Z-Blog网站的robots文件写法
User-agent: * Disallow: /zb_system/ Disallow: /zb_users/data/ Disallow: /zb_users/language/ Disallow: /zb_users/logs/ Sitemap: https://www.zhulincat.com/sitemap.xml
注意:最后一行的Sitemap为你博客网站的地图文件,可以在Z-Blog应用中心搜索相关插件生成。
三、robots文件使用说明
1. robots.txt可以告诉百度您网站的哪些页面可以被抓取,哪些页面不可以被抓取。
2. Robots.txt 文件应该放在网站根目录下,并且该文件是可以通过互联网进行访问的。例如:如果您的网站地址是 https://www.zhulincat.com/,那么该文件必须能够通过 https://www.zhulincat.com/robots.txt 打开并看到里面的内容。
3. 您可以通过Robots工具来创建、校验、更新您的robots.txt文件。robots文件生成工具:http://tool.chinaz.com/robots/
4. Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。
5. 百度站点管理中可以查看您网站robots.txt文件在百度生效的情况。