jivo皮套 怎么用:文献信息检索语言

来源:百度文库 编辑:偶看新闻 时间:2024/04/25 09:31:06

检索语言从规范、授控的情况,有 人工语言 (规范语言)(artificial language)和 自然语言(非规范语言)(natural language),
检索词是检索语言的基本成分,检索词的有序集合构成词表(thesaurus)。
自然语言:
自然语言是取其自然形态,不受控,使用非规范词(uncontrolled term)或称自由词(free term)。自然语言极其丰富、复杂和多样,存在着一词多义、多词一义及词义交叉的现象。常见的有同义词、近义词、同型异义词等。
自由词有较大的灵活性,使用随意,专指性强,查准率高。它能及时地反映最新出现的词汇,反映规范词难于表达的特定概念或新概念。在全文检索中自然语言独领风骚。大容量、高速、高性能的计算机检索系统的自动标引,使得自由词的全文检索,即自由文本检索(free-text search)占的比例越来越高。自然语言的缺点是由于它不规范,缺乏对词汇的控制能力,也无法指示概念之间的关系,影响到检索效率。
人工语言:

人工语言(规范语言)(artificial language,controlled language)受信息检索的控制,使用控制、规范词(controlled term)。人工语言的规范处理重在两个方面:一是使一个概念只用一个词汇来表达,这样就避免了多词一义的情况;二是使一个标引词只能表达一个概念,这样就排除了一词多义现象,这时,需要加上必要的限定和注释。比如"飞机"这一概念,用英语检索时,可用plane , airplane , aero plane , aircraft 等同义词,规范就是选定其中最适合的一个词汇来标引这一概念,如果选定aircraft 一词,则其余词均为非规范词。在使用aircraft规范词来检索时,其结果将包含所有有关飞机这一概念的文献,而不管这些文献中是否确切出现过aircraft这个词。
规范词语言采用特定词汇来网罗、指示宽度适当的概念,供检索选择。用户在检索时可省略对其概念的全部同义词或近义词的考虑,也避免了这些词在输入时的麻烦和出错,它提供了一种比较高效、能有效避免漏检、误检的查找。在检索中普遍使用规范语言及其词表,凡有规范词表的检索工具,在主题检索时首选的是规范词检索。
在实际检索中,检索词的选择是个复杂的问题,必须考虑表达概念的准确与完善,通常是规范语言和非规范语言交混使用来满足各种不同的需要。