网络机器是连接我们网站和服务器的重要“人物”,网络机器人又被我们称作:蜘蛛、机器人、爬虫,在FOAF社区中间,更经常的称为网页追逐者,不常使用的名字还有蚂蚁,自动索引等。
网络机器人遵守的规则
虽然有可能写一个机器人,无视规则,大多数Web机器人书面服从一定的规则,在一个网站上的特定文本文件。此文件的robots.txt文件。它通常是在Web服务器的根,并作为机器人网关。它告诉他们的网站,他们可以等领域,并不能遍历。而大多数Web机器人遵循的规则,你躺在您的robots.txt文件,有的没有。如果你有敏感信息,你应该使用密码或Intranet上的控制,而不是蜘蛛它不是依靠机器人访问它。
网络漫游的使用
网络机器人常见的用途是搜索引擎的网站索引。但机器人可以使用,以及用于其他目的。一些较常见的用途是:
1、链接验证 - 机器人可以按照一个网站或网页上的所有环节,它们进行测试,以确保他们返回一个有效的页面代码。这样做的好处编程本质上是明显的,机器人可以在一两分钟访问页面上的所有环节,并提供一个比一个人可以做手动更快的结果的报告。
2、HTML验证 - 类似链接验证,机器人可以被发送到您的网站上的各种页面,以评估的HTML编码。
3、改监测 - 是在网络上会告诉你,当网页已经改变的服务。这些服务是通过机器人发送到页面定期评估的内容发生了变化。不同的是,当机器人将提交报告。
对于网络机器人,留下用户标志信息是十分重要的。这样,网络管理员在需要的时候就可以联系网络机器人的主人。