2014年12月3日下午两点词典中心迎来了Mark Davies教授的第三场讲座。在这次讲座中Davies教授把重点放在了语料库的应用上,并用丰富的实例、相关的参考书目和网站对自己所做内容进行了详尽的描述。
主要内容有:在词频的基础上进行分类,词频词典的内容介绍,词频数据(以词汇表为例),链接名词的动词短语,专业英语词以及专门词汇(以维基百科的数据库为重点描述)。其中,在词频的基础上进行分类是按照类型分类(如:小说、专业等以及所属的次类别)。按照类型分类能够更加全面的涵盖正式到非正式语体词汇,以及不同主题的词汇。其中,Davies教授的COCA数据库可以下载六万词的词库。Davies教授还和Dee Gardner合作编写了词频词典,这本词频词典里包含了素描词汇、词汇固定搭配与主题词汇列表。在于eBook合作的两万词中还包括词的固定搭配与近义词。词频数据库覆盖面极广,不仅包括COCA还包括了BNC,COHA与SOAP(即泡沫剧),涵盖了不用类型、不同主题、不同时间段的不同词汇,最多达十万词。以COCA为基础的N-grams旨在用合适的动词或者动词短语连接名词。在专业英语词汇中,Davies教授把COCA与Coxhead的专业英语词汇表进行了比较,更加明确了两者的不同。维基百科数据库的优势在于用户可以建立个性化的虚拟数据库,不过,数据库的内容超过了词的范围,向不同门类的专业知识进行收集和编辑。
介绍完维基百科的数据库之后Davies教授开始回答提问,师生进行了踊跃的提问,不仅涉及COCA的内容本身,同时对于数据库信息处理、语言学相关知识都进行了交流。
(撰稿人:王燕)
活动微博同步报道:http://weibo.com/p/1001603783764168819095?from=page_100206_profile&wvr=6&mod=wenzhangmod
欢迎关注“广外词典中心”新浪微博:http://weibo.com/u/3283153934


