|
|
|
|
|
|
|
词义标注语料库建设综述 金 澎, 吴云芳, 俞士汶 (北京大学 计算语言学研究所, 北京 100871) 摘 要: 词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、 词典选择、 标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍 bootstrapping策略在语料库建设方面的应用以及利用双语对齐语料库开展的相关研究。最后,针对词义标注语料库建设存在的问题提出自己的分析和思考。 下载:词义标注语料库建设综述
来源:中文信息学报
|
| [上传时间:2008-10-06] |
|
|
|
|
|
|