编者按:语言学研究向来关注具体问题,方法可谓具体研究之良具,因此,本版将陆续推出关于语言学研究的方法和方法论的文章。栏目名中“旨归”之意取自《温病合编·自序》:“其于卷帙浩繁者,必要旨归,琳琅珠璧,无美不搜……”希冀将语言学方法论之美文尽收于本栏。
20世纪后半叶以来,在信息革命和语言学转向的交互作用之下,对文本的分析和解读成为人们重要的认知方式。因此,要获得真实正确的信息和知识,就需要进行语言分析、话语分析、语义分析、语用分析等。无论是言语行为的动机、意图,还是言内言外之意,都可以从文本中获得其存在形式,也都可以通过语言分析中加以解读。在这种背景下,语料库语言学方法应运而生。
语料库方法解决信息检索难题
信息革命的最大特点是“信息爆炸”,根据“摩尔定律”,信息技术和产品大约每18个月翻一番,不仅体积缩小、功能增强,而且速度加快、性价比提高。同时,信息量的增加也远远超出了人们处理能力的极限。现在全世界每天发表的论文达13000—14000篇,在搜索引擎上即使只检索一个关键词,如“给力”,就有1.78亿个相关的网页(2011年4月22日谷歌搜索结果)。网络信息包含大量重复、转写、转帖、低水平克隆等“垃圾”。试想,如果没有语料库方法,单凭研究者一己之力,很难从这种爆炸般涌来的信息中筛选、辨别、发现和抽取有用信息,实现系统可控,使人真正成为能够“透过现象看本质”的认知主体。
……(出处:中国社会科学报 作者:盛玉麒 作者单位:山东大学文学与新闻传播学院)
《中国社会科学报》版权所有,转载请注明出处及本网站名。