由清华大学、内蒙古大学、内蒙古师范大学、新疆大学、西北民族大学等高校联合研发的“多体蒙古文(混排汉英)印刷文档识别暨统一平台少数民族文字识别系统”,今天在此间通过中国教育部组织的技术鉴定。该系统历时八年研制成功,全面解决了中国少数民族文字识别问题。
由中科院院士倪光南领衔的鉴定委员会认为,该系统首次在统一平台上解决了实用的多字体印刷蒙古文文档及其混排汉英的识别问题,并首次完成了在统一平台上蒙、藏、维吾尔、哈萨克、朝鲜、柯尔克孜文档识别的综合集成系统,其主要技术指标达到了国际领先水平。
主持这项研究的清华大学教授丁晓青介绍,中国需要用计算机进行处理的现行少数民族文字有三十三种,课题组将它们分为五种类型,选择其中最具代表性、最具国际影响力的蒙、藏、维、哈、朝、柯文档实用系统进行研究开发,然后以点及面,全面解决少数民族文字的识别问题。
她表示,促进少数民族信息化是国家的重大战略,文字识别技术使纸介媒体上的文字自动输入计算机,是促进信息化的重要一环。该系统全面、快速、高质、高效地解决了少数民族文字识别问题,对于促进不同民族之间的文化交流具有重要意义。
另外,该系统还支持阿拉伯文的识别,具有很大的国际市场潜力。 (记者 周兆军)
|