首页|中心简介|学术队伍|新闻中心|招生培养|教学科研|创新团队|下载|English
中心要闻
当前位置: 首页>>新闻中心>>中心要闻>>正文
美国杨百翰大学戴维斯教授讲座系列三——利用语料库建立词库
2014-12-04 14:38  

 

2014123下午两点词典中心迎来了Mark Davies教授的第三场讲座。在这次讲座中Davies教授把重点放在了语料库的应用上,并用丰富的实例、相关的参考书目和网站对自己所做内容进行了详尽的描述。

主要内容有:在词频的基础上进行分类,词频词典的内容介绍,词频数据(以词汇表为例),链接名词的动词短语,专业英语词以及专门词汇(以维基百科的数据库为重点描述)。其中,在词频的基础上进行分类是按照类型分类(如:小说、专业等以及所属的次类别)。按照类型分类能够更加全面的涵盖正式到非正式语体词汇,以及不同主题的词汇。其中,Davies教授的COCA数据库可以下载六万词的词库。Davies教授还和Dee Gardner合作编写了词频词典,这本词频词典里包含了素描词汇、词汇固定搭配与主题词汇列表。在于eBook合作的两万词中还包括词的固定搭配与近义词。词频数据库覆盖面极广,不仅包括COCA还包括了BNC,COHASOAP(即泡沫剧),涵盖了不用类型、不同主题、不同时间段的不同词汇,最多达十万词。以COCA为基础的N-grams旨在用合适的动词或者动词短语连接名词。在专业英语词汇中,Davies教授把COCACoxhead的专业英语词汇表进行了比较,更加明确了两者的不同。维基百科数据库的优势在于用户可以建立个性化的虚拟数据库,不过,数据库的内容超过了词的范围,向不同门类的专业知识进行收集和编辑。

介绍完维基百科的数据库之后Davies教授开始回答提问,师生进行了踊跃的提问,不仅涉及COCA的内容本身,同时对于数据库信息处理、语言学相关知识都进行了交流。

(撰稿人:王燕)

 

活动微博同步报道:http://weibo.com/p/1001603783764168819095?from=page_100206_profile&wvr=6&mod=wenzhangmod
欢迎关注广外词典中心新浪微博:http://weibo.com/u/3283153934

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

关闭窗口

版权所有:广东外语外贸大学词典学研究中心
Copyright © bilex.gdufs.edu.cn All rights reserved