实现蜘蛛捕捉的PHP代码 (WEB爬虫)

2009-04-19,星期天 | 分类:上海SEO案例, 上海SEO相关 | 标签: | 1,183 views

另类搜索资料的方法:网络爬虫程序,WEB爬虫,网页蜘蛛,网络机器人大家比较熟悉使用各种搜索引擎,但是,还有一种更主动和专门的搜索技术:网络爬虫。
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。
  这些处理被称为网络抓取或者蜘蛛爬行。很多站点,尤其是搜索引擎,都使用爬虫提供最新的数据,它主要用于提供它访问过页面的一个副本,然后,搜索引擎就可以对得到的页面进行索引,以提供快速的访问。蜘蛛也可以在web上用来自动执行一些任务,例如检查链接,确认html代码;也可以用来抓取网页上某种特定类型信息,例如抓取电子邮件地址(通常用于垃圾邮件)。 全文阅读 »

上海SEO培训 上海SEO培训 沪ICP备06034546号 ©Copyright 2007-2011 上海SEO