首 页 工作机构 法规·标准 语文工作 科研工作 学术交流 培训测试 中文信息处理 语文博物馆 网上服务 百家论坛 图片·视频
信息浏览
首页 >>>学术动态
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 学术动态 学术动态 关闭窗口 关闭窗口

    2006年5月22日,“2005年中国语言生活状况报告新闻发布会”在北京召开。这是教育部、国家语委首次向社会发布年度语言生活状况报告。
    教育部副部长、国家语委主任赵沁平发表了书面讲话。赵沁平指出,语言生活是社会生活的重要内容。关注社会语言生活,掌握语言国情,是现代国家的一项重要任务。在社会快速前进、信息技术飞速发展的今天,需要建立对社会语言生活实时监测和规范引导的长效机制,对重要社会领域的语言文字使用状况进行监测、分析与研究,对语言国情有更及时全面的了解。教育部、国家语委陆续与相关部委和高等院校共建国家语言资源监测与研究中心及各个分中心,对平面媒体、有声媒体、网络媒体、教育教材以及海外华语等的语言状况进行分析研究;成立“中国语言生活状况报告”课题组,分领域、分专题报告年度的中国语言生活的基本状况及热点问题。此次发布的《中国语言生活状况报告(2005)》是“中国语言生活绿皮书”的第一部。“中国语言生活绿皮书”的内容有软性的规范标准,也有中国语言生活状况与分析。这些内容同正式发布的语言文字规范标准相辅相成,共同引导语言生活和谐发展。
    教育部语言文字信息管理司司长李宇明发布了2005年中国语言生活的基本状况。李宇明指出,中国语言生活充满活力,新的语言现象大量涌现,新的语言传播方式不断出现。国家通用语言文字的推广取得重大进展,城市语言文字评估取得成效。新闻出版、广播电视领域进一步加强了对语言使用的管理。在教育领域,语文课程标准及其教材更加多样化,语文高考有新变化,大学英语四、六级考试进行了重要改革,少数民族双语教育大发展,对外汉语教学发展迅猛。同时,语言文字标准化、信息化取得丰硕成果,少数民族语言文字信息处理迈开步伐,名词术语规范工作为科教兴国作出了贡献,全社会语言资源开发和利用的意识进一步增强。
    李宇明还发布了国家语言资源监测与研究中心对2005年若干媒体语言文字使用情况进行调查得到的具体数据。
    (一)汉字使用情况  调查语料分为平面媒体(15种报纸)、有声媒体(13家电视台)、网络媒体三种,共计892,034个文本文件,909,449,610字次(包括标点、符号及西文字母、数字等;不包括无法显示的字符),其中汉字出现732,162,049字次。调查结果为:
    1.字种数:指字形不同的汉字,计8,225个。
    2.与《现代汉语常用字表》比较,本次调查得出的前2500高频字中,有357字是“一级常用字”(2500字)中所没有的;前3500高频字中,有398字是《现代汉语常用字表》(3500字)中所没有的。
3.与《现代汉语通用字表》比较,本次调查得出的前7000字中,有615字是《现代汉语通用字表》(7000字)中所没有的。
    (二)词语使用情况  词语调查使用的语料和汉字调查相同,使用的分词软件是中国科学院自动化研究所研制的分词标注系统。调查结果为:
    1.分词单位总数:指由分词软件对语料切分得到的字符串的总数,计489,240,995词次。
    2.总词语数:指分词单位总数减去标点、符号、纯西文分词单位后的分词单位数量,计416,090,995词次。
    3.词种数:指除去标点、符号、纯西文分词单位后的分词单位,计1,651,749个。
    4.共用词种数:指报纸、广播电视、网络等媒体都用到的词语,计106,111个。
    5.高频词语10356条,共使用汉字2463个。
    6.在本次调查得到的165多万词语中,人名、地名、组织机构名、时间词语等占93%,但使用频次低;其他基本上是语文词,约为11万条,占总数的7%,但使用频次高。
    7.覆盖率清楚显示出高频词集中的特点。覆盖率为80%时用词4000条,覆盖率为90%时用词1.1万条,覆盖率为99%时用词13万条。其余152万条词覆盖率仅为1%。
    以上这些数据表明:第一,现代媒体的用字情况同《现代汉语常用字表》、《现代汉语通用字表》制定的年代,发生了一些变化。第二,掌握1万多条词、900多个汉字,即可阅读90%左右的出版物。
    (三)BBS用字用语情况
    通过对我国7所高校的BBS用字用语情况的调查发现:1.BBS汉字使用数量(9793)高于平面媒体(8225),标点、符号等的使用量(55.07%)高于汉字使用量(44.73%)。2.高频的前127个汉字的覆盖率达到50%;当覆盖率达到90%时,出现汉字923个,这些字还都是简化汉字。3.网络用语几年前大量出现,近年增长速度趋缓。4.网络词语具有不稳定性。
    此外,(1)对两部对外汉语教材的语言状况进行了分析,这两部教材总用字为1847个,有31个字超出了3500常用字的范围。(2)对标点和符号使用情况进行了考察,标点为14类,变体形式共有93种。(3)对2002-2005分年度发布的流行语情况做了归总。
    李宇明指出,我国的语言生活总体上是健康和谐的,其特点是主体性与多样化并存。这些年也形成了一些社会关注的热点,如:汉语的国际推广;中小学英汉双语教学,四六级英语考试;方言知识进教材,广播影视使用方言,公共行业的方言服务问题;网络语言;字母词的使用;地名牌和交通指示牌使用英文的问题;人名地名用字是否要有限制问题;濒危语言问题。这些热点问题是值得认真研究的。
    李宇明最后强调,由于我国应用语言学起步较晚,语言生活的研究成果积累不多,加之语言生活的领域广阔、错综复杂,因此,此次报告的数据不一定能够全面反映2005年中国语言生活的面貌,但这些数据都是相当有价值的。发布年度语言生活状况报告的目的,在于引起人们对语言国情的重视,积极引导语言生活向着健康和谐的方向发展,并为政策制定和学术研究提供参考。这项工作教育部、国家语委会持续做下去,不断完善工作机制,扩大报告的领域与深度,提高年度语言生活报告的水平。
    李宇明、王铁琨等几位发布人及汪磊教授就中国语言文字网、新华社、中国日报等媒体记者提出的问题分别作了回答。
    出席新闻发布会的还有中宣部、国家民委、民政部、新闻出版总署、国务院侨办、国家汉办、全国名词委等单位的领导,教育部有关司局负责人,与教育部共建国家语言资源监测与研究中心的高校领导,专家学者及语言文字研究机构、学会、出版单位的代表。



来源:--
[上传时间:2006-05-23]
相关链接:
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 学术动态 学术动态 关闭窗口 关闭窗口