关键词是指那些出现在文献的标题乃至摘要、正文中重要的、关键性的、可以作为检索入口的词语,是一种近于自由词的自然语言。它源于英文"keywords", 特指单个媒体在制作使用索引时,所用到的词汇,是图书馆学中的词汇。关键词搜索是网络搜索索引主要方法之一。关键词是为了揭示学术论文的内容和适应计算机检索的需要而提出来的,位置在摘要之后,用来表达文献主题内容。它不仅用于科技论文,还用于科技报告和学术论文。
论文是科学研究中创造性思想的载体,它的首要任务是传递科研信息,同时也具有文化储存和文化积累的功能。不管从传递信息,还是储存信息的角度考虑,主题词或关键词的标引都将给文献的储存和检索带来极大的方便。
早在1963年,美国ChemicalAbstracts从第58卷起就开始采用电子计算机编制关键词索引,提供快速检索文献资料主题的途径。在科学技术信息迅猛发展的今天,全世界每天有几十万篇科技论文发表,学术界早已约定利用主题词去检索最新发表的论文。作者发表的论文如不标注关键词,文献数据库就不会进行收录,读者就检索不到。关键词选得是否恰当,关系到该文被检索的频率和成果的利用率。随着信息时代的发展,信息的表达方式也多种多样,但以自然语言形式表达信息的文本仍是一种不可替代的方式。
随着网络上文本信息的爆炸式增长,如何提高信息访问的效率成为一个越来越重要的课题。为了对海量信息进行有效的组织、压缩和检索,研究人员在自动文摘、信息检索、文本分类、文本聚类和关键词自动抽取等方面进行了大量研究。但人们想获取自已需要的文本信息不可能从大量的文本中手工得到,因此如何组织、管理、检索文本变得越来越重要。
关键词自动抽取是依靠计算机从文档中选择出反映主题的词,也称作关键词自动标引。科技论文是人类智慧的结晶和知识传承的主要载体。当今几乎所有的数字图书馆都包含大量的科技论文,在这大量的科技论文中要想迅速准确地查找到所需要的论文,就要利用关键词抽取。关键词是理解论文的最小单元,仅需要通过几个关键词就能快捷地了解论文的大意。
更多论文发表的知识,请继续关注论文畅进行了解。
更多相关文章推荐: