南伦敦球队:搜索工具的选择 -- 中文搜索引擎指南网

来源:百度文库 编辑:偶看新闻 时间:2024/04/29 05:06:26
搜索工具的选择
http://www.sowang.com  2006-07-30 作者:邢志宇
搜索工具是互联网发展到一定阶段的必然产物。互联网诞生初期,信息的存取矛盾尚未出现,人们无须借助任何工具就可以利用有限的网络资源。1989年NSFNET取代ARPANET并向公众开放以后,互联网进入飞速发展时期,海量信息与对其个性化利用的矛盾日渐突出,不借助一定的工具便不能有效地获取特定的信息。人们开始认识到搜索工具(Search Tools)对网络利用的重要意义,各类针对互联网信息整序和检索的工具应运而生。
搜索工具随着网络的发展而不断地创新和完善。从实用的角度讲,目前常用的搜索工具可分为网络搜索工具、站内搜索工具和数据库检索系统。网络搜索工具具有对整个互联网络搜寻的能力,又可分为基于索引程序的全文搜索引擎(Full Text Search Engine,又称关键词搜索引擎(Keyword Engine)、通过人工标引而建立的分类搜索引擎(Directory)和调用独立搜索引擎的元搜索引擎。站内搜索工具的范围仅限于某一网站之内,通常具有关键词搜索和分类浏览查找两种功能。数据库检索系统是为检索库内信息而开发的专用工具,功能视数据库内容性质而多有不同,一般有关键词、分类、字顺、特定符号或编号等检索功能。
明确了搜索意图和制定了搜索策略之后,搜索工具的选择尤为重要,它直接影响着搜索的效率。工欲善其事,必先“选”其器,搜索工具选择得当,就会给人以愉悦的搜索体验,能够收到事半功倍的效果。
不同类型的搜索工具有着不同的功能,同类搜索工具之间也存在着性能、特色等差异。满足不同的信息需求必须使用不同的搜索工具,一定的搜索工具可以更好地满足特定的信息需求。
1、族性检索
“族”为丛聚、集合、类别之义,族性检索是对具有某种共同性质或特征的众多事物、概念的检索,分类搜索引擎是族性检索的首先选工具。
分类搜索适合查询具有同一特征的多个目标和主题范围广、概念宽泛的问题。例如,“公共图书馆”就是典型的族性概念,进行国内与美国公共图书馆网站调查及其比较研究,最有效的方法就是利用分类搜索引擎,根据分类体系,按照其类目归属,以“参考资料—图书馆—公共图书馆”或“区域—国家与地区—中国大陆—参考资料—图书馆 —公共图书馆”(雅虎中国)、“Reference—Libraries—Public Libraries—By Region— U.S. States”(YaHoo!)等路径逐级浏览查找。
由于分类体系的系统性和聚类特点,分类搜索可以方便地进行扩检或缩检,在查找某一学科或专业文献时,利用类系层层隶属、外延渐小的原理,满足不同查全和查准要求;利用类列外延相斥、同位详列的特性,进行相关查询。即类以求,触类旁通是分类搜索引擎的天然优势和显著特征。
使用分类搜索引擎需要对其分类体系、类目设置、立类原则、收录范围等有一个大致的了解,能够确定所需资源的大类归属。然而,目前常用的分类搜索引擎的分类体系各有不同,当难以把握浏览路径时,可以借助其“所有目录(the Directory)”和“此目录下(this category)”的关键词搜索功能,根据结果页面的路径指示,在相关类目中查找。
2、特性检索
“特”为唯独、只有、专门之义,特性检索是指对特定事物或概念的检索,关键词搜索引擎是特性检索的首选工具。
关键词搜索引擎多用于查找主题范围较小、明确具体的信息和交叉性、细节性问题。例如,“黄河源头”、“北京图书馆现有藏书量”就是典型的特性检索,使用“黄河 发源地”和“国家图书馆 现有 藏书 册”等关键词搜索,便可一检即得。
关键词搜索引擎的特性检索优势是明显的,但由于其智能化程度有限,不可避免地会产生较大的搜索“噪音”,人们没时间也不可能逐页翻检结果列表,只有排列靠前(通常在前三页之内)的相关结果才有可能被真正地利用。
关键词搜索引擎,除了具有强大的字、词、短语等搜索功能外,还可以进行字、词间的“与”、“或”“非”等逻辑关系搜索和标题、URL、文件类型、时间、网站、链接等多种限定搜索,其“高级搜索(Advanced Search)”还具有搜索词语控制和个性设置功能。各种专用搜索引擎,如新闻、图像、购物、音乐搜索引擎等,都属于基于索引程序的关键词搜索引擎。
3、专题搜索
专题是指范围较小、体裁单一、具有相同性质和专门用途的信息或资源,专题搜索主要使用站内搜索工具。
专题搜索不同于学科或主题搜索,因为“专题”的范围要比学科或主题的外延小得多,尽管相对完整,但缺乏系统性和稳定性,分类搜索引擎不会专门列目标引和收录专题信息或专题资源。关键词搜索引擎虽然具有一定的专题搜索能力,但其专指性的搜索很难满足专题明显的“族性”要求。
我们所说的专题信息或专题资源,是指经过网站人工整理、编辑,并为特定用途发布的信息或资源,如“北京申奥”、“2005年我国洪涝灾情”、主题教育推荐书目、特定事件的专题新闻等等。一般情况下,专题信息或专题资源多在相关网站中以超链接形式出现,分类搜索引擎对此类专题搜索无能为力,用“北京申奥 专题”、“北京申办奥运会”、“2005年 (洪水 OR 洪灾) 灾情报告”等关键词搜索,虽有相关结果,但与“专题”的要求相差甚远,即使是使用关键词进行新闻搜索,也只能得到零散的相关信息,而无法直接找到的经过整理和编辑的相关新闻专题。
进入相关网站进行站内专题搜索则更为便捷和直接,如在有关体育网站、新闻门户网站、教育网站等利用关键词搜索或浏览查找,可以一次满足上述主题搜索的要求。当然,对网络资源不太熟悉的搜索者来说,确定查找有关专题的网站可能有一定的困难,这时可以利用分类和关键词搜索引擎分别了解相关网站的信息,根据网站简介和提示信息登陆相关网站进行站内搜索。
4、 数据库检索
在线数据库是一种特殊形式的网络资源,一般的搜索引擎难以寻觅其踪迹,即使是专门的数据库网站也多有授权限制而不提供免费使用。数据库有其自身的检索系统自不待言,问题是怎样找到并利用数据库。数据库属于网络的深层结构(deep Web structure)资源,需要借助专门的搜索工具。查找数据库资源请参见《专用搜索引擎》的有关介绍,对有授权限制的数据库的利用请参见《搜索技巧》中的有关内容。