首 页 工作机构 法规·标准 语文工作 科研工作 学术交流 培训测试 中文信息处理 语文博物馆 网上服务 百家论坛 图片·视频
信息浏览
首页 >>>学术动态
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 学术动态 学术动态 关闭窗口 关闭窗口
    教育部、国家语言文字工作委员组织研制的语言文字信息处理国家标准《信息处理用现代汉语词类标记规范》,由国家质量监督检验检疫总局、国家标准化管理委员会于2006年9月18日发布,自2007年3月1日实施。
    该标准由教育部语言文字信息管理司提出立项,由教育部语言文字应用研究所计算语言学研究室承担,在国家社科基金“十五”重大项目《信息处理用现代汉语词汇研究》子课题研究的基础上完成。 
    词类标记是自然语言处理的基础环节。我国在词性标注方面作了不少研究,但各个系统的词类标记不统一,造成了信息交换、共享的困难。汉语语料库的深加工和汉语句法自动分析等自然语言处理领域,迫切需要制定《信息处理用现代汉语词类标记规范》,提供一套面向信息处理的、统一的现代汉语词类标记代码体系,以降低数据转换的代价。
    该标准规定了信息处理中现代汉语词类及其他切分单位的标记代码,适用于汉语信息处理,也可供现代汉语教学与研究者参考。该标准为现代汉语词类问题的深入研究留下了空间。
该标准的发布,将促进汉语信息处理系统词类标记的标准化,有利于语言资源的信息交换与共享。
    该标准已由中国标准出版社于2007年3月出版发行。

                                           (教育部语信司)




来源:--
[上传时间:2007-04-27]
相关链接:
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 学术动态 学术动态 关闭窗口 关闭窗口