“大家都知道,比尔·乔伊斯和卢克·斯托之前制作了一个软件叫做ip的文件名,从而下载。但我们要做是搜索引擎,这个搜索引擎可以自动地从网络上收集信息,经过整理过后,提供给用户进行查询的系统。所以,做这个搜索引擎的主要难点,第一是如何从网络上收集信息。第二是如何整理信息得到优质信息。我们的搜索引擎必须准确,快速,提供给用户最需要的信息!”
亨利拿起笔在黑板上画了一幅图,说道:“互联网就好比是蜘蛛网,我们要开发一个可以在蜘蛛网上自由爬行的程序,顺着web上网页的链接地址,将其一个个网页的内容读取,并将这些网页抓到系统来进行分析,放入数据库中。至于这个程序的名字,就叫网络爬虫!所以,我们当前的第一任务就是开发网络爬虫!!”(新的一周请投票支持!晚上有事,所以拖到半夜一点钟才更新,好困,码字的时候眼睛都快合上了……)
;