您可以通过在网站的根目录中创建名为 robots.txt 的文本文件来配置 Apache 服务器的 robots.txt 文件。 以下是示例 robots.txt 文件的示例配置。
用户代理:*
Disallow:/private/
Disallow:/admin/
Allow:/public/
在此示例中, user 代理字段指定规则适用的搜索引擎爬虫。 通配符“*”代表所有搜索引擎。 Forbidden 字段指定不允许搜索引擎爬虫访问的目录或页面。 允许字段指定允许搜索引擎爬虫访问的目录或页面。
配置 robots.txt 文件时,您可以选择添加多个用户代理、禁止和允许字段,以满足您网站的爬虫控制需求。 创建或更新 robots.txt 文件后,请使用搜索引擎的 robots.txt 测试工具验证配置是否正确。
评论前必须登录!
注册