俄洛巴斯及模型:搜索引擎分为那几类?

来源:百度文库 编辑:高考问答 时间:2024/04/30 01:07:57
每一类举出一个实例,搜索“doc.”格式的论文,其搜索命令该如何写?

搜 索 引 擎 分 类
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

■ 全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

■ 目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

■ 元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

除上述三大类引擎外,还有以下几种非主流形式:

1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。

由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。

搜索引擎分几种,工作方式也不同,因而导致了信息覆盖范围方面的差异。我们平常搜索仅集中于某一家搜索引擎是不明智的,因为再好的搜索引擎也有局限性,合理的方式应该是根据具体要求选择不同的引擎。这里我们根据自己的经验给大家提出些建议。

我们日常信息需求大致可分为两种,一种是寻找参考资料,另一种是查询产品或服务,那么对应的搜索引擎选择就应该是全文搜索引擎(Full-Text Search Engine)和目录索引(Search Directory)。为什么?
对前一种需求来说,由于目标非常具体,而目录索引中链接条目所容纳的信息量有限,无法满足我们的要求,因此全文搜索引擎便自然成了我们的选择。按照全文搜索引擎的工作原理,它从网页中提取所有的文字信息,所以匹配搜索条件的范围就大得多,也就能满足哪怕是最不着边际的信息需求。这也就是为什么现在多数目录索引都采用其他全文搜索引擎提供二级网页搜索的原因。

相反,如果我们找的是某种产品或服务,那么目录索引就略占优势。因为网站在提交目录索引时都被要求提供站点标题和描述,且限制字数,所以网站所有者会用最精练的语言概括自己的业务范围,让人看来一目了然。而多数全文搜索引擎直接提取网页标题和正文作为链接的标题和描述。用过全文搜索引擎的人都有这样的体会,就是搜索结果显示的信息往往过于杂乱,让人无法一眼就判断出该网站的性质。就我们来说,虽然我们是百度和Google坚定的拥护者,但在搜索商业信息时还是经常用到搜狐、新浪、网易的目录搜索。

此外,当你要搜集某一类的具体生活信息或产品时,分类信息搜索引擎的分类目录就是你天然的宝库。比如优越搜索、赶集等。

那么究竟哪几个搜索引擎能够为我们所用呢?结合你的需求就能有所斩获!

http://www.baidu.com百度
http://www.google.com