会计人员责任:第三节 一些著名的搜索引擎

来源:百度文库 编辑:偶看新闻 时间:2024/05/02 07:47:27
为了让感兴趣的读者有目的的试一试,我们整理了一些当前主流的搜索引擎,包括网址,首页面图片及其介绍。在这些搜索引擎中,排在最前面的几个搜索引擎提供多语言的支持,可以满足不同母语读者的需求。
主流搜索引擎的选定参考了[Sullivan,2004],主流搜索引擎是指非常有名,或者被广泛使用的搜索引擎。为使读者有感性认识特别加入了每个网站的相关页面。
Google, http://www.google.com四次荣获Searchenginewatch[Searchenginewatch,2004]读者选举出的“最杰出搜索引擎”称号的Google作为在网络上搜索页面的首选是无愧于这个称号的。它基于搜集器2的服务既保证了能够覆盖广泛的网页,同时在查询效果上也表现得极其优秀。
为了方便的检索到所需网页,Google提供几种可供选择的方法。利用Google首页搜索框上面的标签,可以容易的检索网络上的网页,图像,网上论坛,新闻和Open Directory提供的经过人工整理后的网页目录。
Google还因为提供许多其它特性而闻名,例如网页快照,保证您在存有网页的服务器暂时出现故障时仍可浏览该网页的内容,或者可以浏览到不是最新版的该网页的内容;拼写检查,如果您查询词包含错误的拼写,它会提示正确的查询词;股票行情查询;街区地图查询等特殊功能。更多的特性可以查看Google的帮助大全。此外,Google工具条因为提供了方便存取Google和它的特性而为其赢得了一定的声誉。
Google除了提供无需付费的排序结果,还有自己的竞价排名程序。与其他提供此项服务的公司一样,依据点击才有花费,竞价排名程序在Google的返回结果中放置广告。Google还提供自己的无需付费的排序结果给其它一些搜索引擎。
Google最初起源于斯坦福大学的BackRub项目,当时是由学生Larry Page和Sergey Brin主要负责。到了1998年,BackRub更名为Google,并且走出校园成为一个公司。
AllTheWeb, http://www.alltheweb.com作为一个优秀的基于搜集器的搜索引擎,AllTheWeb提供广泛的网络覆盖与显著的相关性。除了提供网页查询,AllTheWeb还提供新闻,图像,视频和音频的检索。AllTheWeb于1999年5月推出,先是由FAST运作;2003年4月Overture收购了AllTheWeb;后来Yahoo!买下了Overture,现在的AllTheWeb由Yahoo!运作。
Ask Jeeves, http://www.askjeeves.com
Ask Jeeves最初获得名声是在1998和1999年。作为自然语言搜索引擎,能够让用户通过输入问题来得到查询结果,并且所得到的结果看起来好像是对的。事实上,技术并不是Ask Jeeves运行很好的原因。在幕后,公司曾经指定100个编辑人员监视查询日志。然后这100个人上网查找与最常用查询词最相关的网页链接。目前,Ask Jeeves仍然在使用人来参与结果的查找,但是现在编辑只有10个人左右。尽管如此,通过人的参与提供答案仍然是一个卖点,尤其对于那些新接触网络的人,他们会想使用Ask Jeeves。对于通常的查询,人工选择的匹配结果让人感觉非常的相关。如果显示出来,这些结果出现在查询结果页面的最上端。除了人工参与外,Ask Jeeves还利用基于搜集器的技术提供查询结果给用户。这些结果来自它所拥有的Teoma搜索引擎。
HotBot, http://www.hotbot.com
HotBot提供便于访问三个搜索引擎(HotBot, Google, Ask Jeeves)的入口,但是不同于元搜索引擎3,它不能将各搜索引擎的返回结果综合显示。
HotBot在1996年初次登场,因为其庞大的由Inktomi提供的基于搜集器的检索页面和质量,而成为搜索者喜欢的引擎。特别是它的不同寻常的颜色和接口,还为它赢得了有经验的网民的注意。[3 元搜索引擎又称集合型搜索引擎,是将多个独立的搜索引擎集合在一起形成的检索工具,即搜索引擎之搜索引擎。]1999年,HotBot因为采用Direct Hit的clickthrough结果作为排序列表获得了恶名。Direct Hit当年出现时是一个很热的搜索引擎。不幸的是,Direct Hit的结果与同期登场的Google不能相比。HotBot的声望开始下降。
Teoma, http://www.teoma.comTeoma是基于搜集器的搜索引擎,2001年9月被Ask Jeeves收购。它索引的网页比同样基于搜集器的竞争对手Google的少。然而对于通常的查询检索,索引网页多少并不会产生很大的分别,自从2000年Teoma出现,就因为它很好的网页相关性赢得了称赞。一些人喜欢Teoma的“相关检索”特性,您先输入一个简单词语搜索,然后,Teoma会为您提供其它相关搜索词作为参考。“专家推荐资源”部分也是Teoma的一个特色,指导用户去访问不同主题的链接。Lycos是一个资格最老的搜索引擎,1994年开始提供服务。在1999年4月它停止了自己基于搜集器的结果,取而代之的是利用LookSmart人工整理的常用查询分类结果和其它基于搜集器的搜索引擎,如:Yahoo!,Inktomi等搜集器提供的结果。那么用户为什么不直接使用其他的搜索引擎而还要使用Lycos呢?你也许是喜欢Lycos提供的一些特性。
在搜索框的下方Lycos会建议其他的与用户检索主题相关的查询词,也许正是用户想看和感觉更确切的查询词。在这之下,就是Lycos提供的与其他搜索引擎一样的既相关又广泛覆盖的结果。
Lycos属于Terra Lycos公司,它是在2000年10月由Lycos合并了Terra网络公司后形成的公司。Terra Lycos公司还有HotBot搜索引擎。WiseNut, http://www.wisenut.com
与Teoma类似,WiseNut是基于搜集器的搜索引擎,在2001年出现的时候吸引了大家的注意力。WiseNut的结果也有很好的相关性,并且有很大的数据库,几乎像Google、AllTheWeb和Inktomi一样大。然而,WiseNut的数据库更新很慢,查询结果经常是几个月前的内容。LookSmart在2002年4月并购了WiseNut。最初叫GoTo,2001年更名为Overture。Overture是一个非常流行的竞价排名搜索引擎,它提供广告给许多搜索引擎排在检索结果的上方。Overture在2003年3月购买了AllTheWeb,2003年4月又收购了AltaVista。Yahoo在2003年10月购买了Overture。Vivisimo 于2000年6月由卡耐基-梅隆大学(CMU)推出,作为不同于基于搜集器的元搜索引擎,有自己的独到之处。它把其他搜索引擎的返回结果利用自动聚类的办法来满足不同类型客户的需要。在搜索引擎上,任何人搜索同一个词的结果都是一样。这样明显不能满足访问者。科学家搜索“星球”,可能是希望了解星球的知识,但普通人可能是想找“星球大战”电影,但搜索引擎所给的都是一样的结果。如何满足这些不同类型的访问者,需要对搜索结果进行个性化处理。搜索结果排序从单一化到个性化,Vivisimo已经迈出了一步。
Baidu(百度), http://www.baidu.com
百度于2000年推出,是目前在中国最成功的一个商业搜索引擎,主要提供中文信息检索,并且为门户站点提供搜索结果服务。搜索范围涵盖了中国内地、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。拥有的中文信息总量达到1亿2千万网页以上,并且还在以每天几十万页的速度快速增长。于1997年10月开始提供服务,是中国最早的搜索引擎。它由北京大学网络与分布式系统实验室开发并维护运行,搜集了中国范围内大量的网络信息资源,尤其较全面地覆盖了中国教育科研网(CERNET)内的资源。天网目前索引的信息资源除已经超过3亿的网页外,还包括2000多万各种非网页类型的文件,是目前世界上最大的中文搜索引擎之一。在系统功能上,天网除提供通常的关键词和短语检索外,还有自动网页分类目录。本书所介绍的技术内容主要就是以天网为背景展开的。