- 政策解读
- 经济发展
- 社会发展
- 减贫救灾
- 法治中国
- 天下人物
- 发展报告
- 项目中心
视频播放位置
下载安装Flash播放器
二是语言文字信息管理工作也在深入推进。2009年发布了4项国家语委规范,有《汉字部首表》、《现代常用字部件及部件名称规范》、《现代常用独体字规范》,并且还用绿皮书的方式发布了6项规范草案,主要是两类,包括《日本汉字汉语读音规范》,还有跟语言信息处理相关的规范,比如说语料库一些原数据的规范等等。
2010-11-25 10:41:34
三是国家语委中国语言资源有声数据库建设,在江苏省进行试点,首批试点通过验收,第二批试点工作启动,其中少数民族有声数据库建设的试点工作在云南启动。为了保证这项工作有序进行,发布了中国语言资源有声数据库建设的各项技术规范与工作规范,印制出版了《中国语言资源有声数据库调查手册》。同时,中国语言资源监测与研究中心与相关单位每年都要发布主流媒体的十大流行语。在民族语言工作方面也有很大的进展,最重要的就是2009年7月份,国务院发表了一个重要文件,《国务院关于进一步繁荣发展少数民族文化事业的若干意见》,其中有4条都谈到少数民族语言文字工作。成立了全国彝语的术语标准化工作委员会,并且成立2个国家语言资源监测与研究中心下面少数民族语言研究基地,一个是维吾尔语文研究基地,一个是藏语文研究基地。同时,少数民族研究的一些重要项目完成研制工作。文化部全国文化信息资源建设管理中心还启动了康巴藏语节目的译制工作。
2010-11-25 10:42:43
四是新闻出版方面,2009年主要进行了全国教育教学辅助类报纸编校质量检查,发现教育类、辅助类报纸、全国行业类报纸的编校质量不断上升。广电总局出台了《关于严格控制电视剧使用方言的通知》,这是针对目前的语言生活的一些重要的情况。
2010-11-25 10:46:06
汉语国际传播规模稳步扩大。像孔子学院的建设,志愿者的派遣等等,这些工作有很大的影响。不仅国家语委和国家相关部门做了大量的工作,而且地方语委也做了大量的工作。比如上海、江苏、浙江等地,为了世博会的顺利召开,编制发布了公共场所的英文译写规范。天津市语言文字培训测试中心受国家语委委托,在马来西亚成功举行了两场普通话水平测试,引起了强烈的反响。朗诵水平等级考试也在上海开展。所以地方语委语言文字工作也是亮点不断。
2010-11-25 10:46:10
第三,2009年三类媒体语言文字使用的一些情况。这三类媒体是平面媒体、有声媒体、网络媒体。网络媒体主要是新闻。我们总共统计了120多万个文本文件,10亿多字次。
一是汉字使用情况。高频字使用非常稳定,字种的数量有所增加。
二是词语使用非常有意思,不同的媒体年度使用的词语相似度很小,报纸的用词、广播电视的用词和网络的用词,这三类媒体的用词差别很大。这反映了这三类媒体在语言使用上和对事件的关注点上已经各自逐渐形成自己的特点。很多高频词语的变化,体现了年度的特色,比如当年出现的一些新的事件,这说明语言对社会生活的反应非常敏感。通过语言的分析,可以如实地看到2009年我们的社会生活。
2010-11-25 10:46:18
新词语是语言生活蓬勃发展的体现,是社会发展的一种语言智慧。2009年,我们在语料中提出新词语396条,对这396条词语进行分析,发现三音节词占多数,过去我们都说汉语双音节是主要构词形式,现在看起来汉语新词的产生主要是三音节。从构成的材料来看,主要还是用汉字构成的,占主流,98%都是汉字构成的词,说明新词语还遵循了汉语构词的习惯。
2010-11-25 10:50:25
结构方式有两点值得注意,一个是偏正式构词能产性最高,这些年来经常用像后缀的构词法,比如什么门,什么族,什么客,构词仍然非常方便,而且叠加方式构词明显多。但是从使用频率来看,新词语进入高频词的不多,个别进入高频字,说明我们语言生活一些新词语还是在一般层面一些特殊人群在使用。
第四,语言生活状况报告的新闻发布已经五年了,我们对五年来的情况也做了一些比较。
首先,我们发现这五年来,高频字使用非常稳定。我们看看05年到09年使用的情况,高频字覆盖整个语料80%、90%、99%,用字数量基本上差不多。而且在最常用的3500字里面,这五年来有3358个字是相同的,说明语言生活目前用字比较稳定。
二是每年的语言生活出现一些有特色的用字。这些有特色的用字,都反映了当年的重要事件。
2010-11-25 10:53:12
三是年度用字总表与现行规范字表之间的差异。比如最常用的是《现代汉语通用字表》,这是上个世纪制定的7000通用字。但是现在媒体里面,语料来看,有661个字没有在这个字表里面出现。这种情况也说明了语言文字的规范应该根据时代的发展不断调整。同时,也说明了现在用大规模的语料统计方法看语言使用情况,提供很大的支撑。从词语来看,总体上高频字稳定使用,但是每一年高频词都有一些变化,这些变化都会体现当年的语言生活的变化的情况。
2010-11-25 10:58:34
第五,今年我们对8套小学语文教材的用字情况进行了比较分析,大陆6套、中国台湾1套、中国香港1套。这8套小学语文教材用字总共出现的字是3855个,其中生字出现最多的是人教社的新课标版,出现生字2997个,出现生字最少的是台湾的康轩版,2238个。这8套教材当中,在生字表里面都有的字是1397个,占总生字数的36.24%;有很多字是在其中一套教材里面出现,大概有505个,占13%。这个情况说明我们教材里面用字虽然差别不大,但是哪个教材用哪些字,差别很大。要知道这是小学教育,小学教育在我们的印象里面,使哪些字大致差不多,但是通过统计,我们发现情况很不一样,每一套教材里面用哪些字差别比较大。
2010-11-25 10:58:45
汉字首次出现生字教学用字中的情况。我们发现小学第二个学期、第三个学期、第四个学期是用字的高峰,也就是一年级下学期和二年级,是识字的高峰。由于各种教学方法的不同,人教社新课标版生字起伏比较大,台湾康轩版生字出现比较平稳,一个学期学多少,比较有节制。这可能是教学方法不一样产生的。
今年对2009年少数民族语言情况进行了分析,主要是藏语和维吾尔语。藏语,主要是对小学藏文语文新课标教材用词情况进行统计,这是我国首次就少数民族语言文字教育教材使用状况进行调查,为教材的客观评价提供了一些定量的参考,也为藏文的量化、字词教学来提供一些根据,为今后更好地提高藏语文教材的编写质量奠定基础,从而更好地为藏语的双语教学服务。我们调查藏语教材用的是青海民族出版社2009年5月出版的五省区语文实验教材的教科书。
2010-11-25 11:00:08
藏语文教材每一册的生词是双音节词最多,词长比例呈现不等式,双音节词、单音节词、三音节词、四音节词。
从课文用词来看,我们调查12册教材里面共出现藏语词种9000多条,词种总数97万左右。所以,课文用词的总数大大高于课文的生词总数,而且随着年级的增高,学习词种的数量不断增加,说明我们藏文小学课文的编写还是比较重视词语使用的科学性。我们还调查了高频词使用情况,特别500高频词的情况。我们还进行了其他的调查项目。
2010-11-25 11:08:21
另外,我们还调查了维吾尔文的情况,使用的主要是9大网站的语料,有新疆政府网、昆仑网、天山网、教师网、医学网等9大网站。采集语料的时间跨度是从2006年到2009年。语料的内容涉及方方面面,有政治、经济、科学研究、教育、健康等多个方面,总共的语料数量不是很多,词符种数20万条,词符频次547万次、文本数15878个。调查了符号使用情况,总共使用了38种符号。维吾尔构词非常有意思,有词干和词尾,我们对词尾的情况作了一些调查,有一个词表,很多专家觉得通过这样的调查加强对维吾尔文使用情况的了解是非常重要的。维吾尔文用词呈现出低频词种数庞大,说明维吾尔语还是充满活力的,词的数量很多。但是,使用起来还是相对集中,高频词使用集中,这些情况跟汉语的情况基本差不多。
2010-11-25 11:08:39
维吾尔文字母长度很长,1-4个字母的词比较少,使用4个字母以上的词为主。少数民族语言用词调查工作还面临着两大困难。一是资料收集困难,电子文本没有汉语电子文本多。二是少数民族语言文字信息处理技术的平台问题,在怎么分词、怎么用计算机统计方面,还需要进一步加强。但是,调查的意义重大,调查得到的语言数据都是实态的,及时地发布数据可以为少数民族语言文字的规范化、标准化和信息化提供科学的支撑,也可以为科学研究和相关单位的决策提供参考。国家语言资源监测研究中心高度重视民族语言文字的监测与研究工作,今后这项工作还要继续进行。对今年的年度生活状况报告已经开始着手分析了,到明年我们再发布今年的语言生活状况报告的情况。谢谢各位。
2010-11-25 11:08:53
谢谢李司长。国家语委对我们今天的发布会非常重视,我们语用司的张世平副司长、语信司的王铁琨副司长、相关处室的负责同志都在座,也非常的欢迎和感谢他们。下面的时间留给各位记者朋友,欢迎大家提问。
2010-11-25 11:09:11