首 页 工作机构 法规·标准 语文工作 科研工作 学术交流 培训测试 中文信息处理 语文博物馆 网上服务 百家论坛 图片·视频
信息浏览
首页 >>>学术动态
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 学术动态 学术动态 关闭窗口 关闭窗口

 

科学定量  合理分级

——学习《通用规范汉字表》四人谈(二)

颜逸明  范可育  高家莺  费锦昌

  范可育(华东师范大学):汉字的总数有多少?无人能准确回答,往往以工具书或字库的收字量为依据。1994年9月28日《新民晚报》报道,由中华书局和中国友谊出版公司发行的《中华字海》收字86,000多个。1999年11月17日《文汇报》报道,北京国安资讯设备公司汉字字库收录有出处的汉字字形共计91,251个。国际编码ISO-10646字符集收字将近80,000个。

  费锦昌(教育部语言文字应用研究所):汉字字数众多,但实际使用的字量有限。著名文字学家裘锡圭先生指出:“从商代到现代,一般使用的汉字的数量似乎并没有显著的变化,很可能一直在五六千左右徘徊。”当然,具体的字种,从商代到现代是有变化的,但用到的字数没有大的变化,这是受到文字作为交际工具这一基本属性的制约。这五六千字中,有的字常用,经常出现;有的字不常用,难得露面。它们在文本中的使用度和覆盖率是不同的。常用字适应人们的共同需要,非常用字满足人们的特殊需要。为了学习和使用的方便,人们总是要先学习经常用到的字。汉字的定量和分级可以说自古就有,历史上著名的蒙学课本《三字经》《百家姓》《千字文》(俗称“三百千”)就是从记录日常记事、历史叙述、姓氏人名等用字中筛选出来的。跟今天的字频统计不同的只在于,现代靠计算机,古代靠语感、字感和经验。上世纪二三十年代,著名教育家陈鹤琴曾用人工统计55万多字的书报语料,得出不同汉字4261个。这是我国最早有意识地、从教育学的角度进行的汉字字频统计工作。

  颜逸明(华东师范大学):自从计算机介入汉字研究以后,汉字字频统计工作开创了全新的局面,速度之快、精度之高是人工统计所无法比拟的。字频统计的科学性还取决于三个条件:一是语料的字量,二是语料的年代跨度,三是语料在门类、领域上的覆盖度和均衡度。

  高家莺(华东师范大学):《通用规范汉字表》根据汉字使用频率、通用程度的不同和适用对象、使用要求的差异,对收录的8105字进行合理分级。汉字分级是客观存在的反映,并非字表研制者的主观设计。分级的目的是为了增强字表的实用性,有效提高汉字学用的效率。

   费锦昌:《现代汉语常用字表》(1988年)与《通用规范汉字表》(2013年)的一级字表收录的都是常用字,字数都是3500个,二者的不同之处在于置换了103字,置换率近3%,就是每100个字中换了3个字。《现代汉语常用字表》中有103字未进入《通用规范汉字表》的一级字表,《通用规范汉字表》一级字表另外收录了103个出现频率更高的常用字。发生这种变化的原因是字频统计工作在这二十多年中科学化程度更高了。据说,按字频的高低排列,《通用规范汉字表》收录到2700多字时,覆盖率已经跟《现代汉语常用字表》3500字等同。为了尊重民众的习惯,一级字表扩充编制,仍收3500字。也就是说,掌握了《通用规范汉字表》的3500个一级字比原先《现代汉语常用字表》的3500字使用的效率更高了。

  高家莺:过去语文教学中,有的教师往往着力教那些难字、僻字,而忽略了常用字的教学,导致学生在日常使用汉字时,读错字音、写错字形、弄错字义的情况比比皆是。一届届毕业生走进社会,由于他们在校时没有学好常用字,致使社会通用层面用字的整体水平下降。在歌舞比赛扎堆的背景下,中央电视台独具慧眼,举办了“中国汉字听写大会”,警醒民众要保护汉字,弘扬汉字文化,在全社会获得良好的反响。但在决赛阶段,为了分出高下,举办者无奈地抛出大量生僻的书面语词作为试题,比如“骅骝”“愣葱”“捍蔽”“婉娈”等等,以致在比赛现场的复旦大学钱文忠教授连连惊呼:“这都是什么孩子啊!这样生僻的词语也能写出来!文曲星下凡啊!”我以为测试这些难字、僻词,偏离了语文现代化方向,客观上会对参赛者和电视机前的成千上万学生起到不良的导向作用。现在不是已有参赛者在背字典、啃古文了吗?希望下届比赛时着重测试常用和通用词语,可在试题中引进书写元素和字用元素,用这种办法来提高试题难易的区分度。

  范可育:《通用规范汉字表》三级字表收录的1605字提升了字表的“生涩度”,招来不少非议。以404个地名用字为例,字表把乡镇以上的地名用字全部收录,还收了部分村级地名和部分自然实体名称的用字,对于全国大多数人来说,这些字绝大多数是罕用字、生僻字,但这些生僻字对于当地人以及跟当地联系较多地区的百姓来说,它们又是常用字。比如“垟”(yáng,田地,多用于地名),我这个以语言文字学为专业的人平时也很少接触到,但对于浙江温州一带,特别是翁垟、黄垟的百姓来说,“垟”是天天要碰面的常用字。正因为有这样一个特性,《通用规范汉字表》把“垟”这类字收入三级字表,使它们获得了“通用规范汉字”的身份证,这样做既不会加重全国大多数民众的负担,又保证了这些特殊领域用字在电脑字库中的位置。在现今科技发达的信息时代,在电脑字库里增加若干个姓氏人名用字、地名用字、科技用字、普及文言文用字应该不是解决不了的难题。由于这些字进入了《通用规范汉字表》三级字表,将给户籍、邮政、金融、科技和旅游、办理出国护照等用字带来很大的便利。

  颜逸明:使用三级字表中的字,要注意字表的注解。如“邨”原是《第一批异体字整理表》认定的“村”的异体字,已被淘汰。《通用规范汉字表》把它收入三级字表,并在注解中限定“可用于姓氏人名”,如“钱杏邨”(著名文学理论批评家)、“马南邨”(邓拓的笔名)等。为什么注解不把“地名”也包括在内呢?我们理解,这是为了维护半个多世纪以来异体字整理工作的成果。把恢复的“邨”限制在姓氏人名,而乡村、村庄的“cūn”仍应写作“村”。可以说,三级字表里恢复的异体字,许多是有限制地使用,跟一级字表、二级字表收录的字相比,使用的条件是不同的。



来源:
[上传时间:2013-11-05]
相关链接:
· 关键字:规范
· 规范异形词 教育界先行
· 关键字:汉字表
· 《规范汉字表》有望9月底完成初稿
· 关键字:科学
· 高等学校哲学社会科学研究学术规范(试行)
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 学术动态 学术动态 关闭窗口 关闭窗口