2015年10月31日,自治区民委、财政厅在内蒙古大学组织召开2013年度自治区蒙古语言文字信息化专项扶持项目“蒙古语语言资源建设、信息化理论与相关技术研究”结项验收会。
该项目是第一批立项实施的自治区蒙古语言文字信息化专项扶持项目,建设期为两年。项目开发内容包括蒙古语言文字信息化基础研究、蒙古语言文字资源库建设和蒙古文信息处理言语工程技术研发3项内容。主要建设成果有:基础研究方面,一是蒙古语言文字信息化基础研究—基础标准和规范的研制完善,对《信息技术 传统蒙古文名义字符、变形显现字符和控制字符使用规则》(GB 25914—2010)等七项标准进行了扩充和完善。二是在面向信息处理的蒙古语语义研究、面向信息处理的蒙古语句法研究等基础理论研究方面取得了显著成绩(起草2项国家标准文本、出版2部专著,发表20余篇论文),其成果在蒙古语自然语言处理领域有较大的理论创新。蒙古语言文字资源库建设方面,已完成的数据资源建设包括1000万词蒙古语粗加工语料库、500万词蒙古语精加工语料库和80万句对的汉蒙、蒙汉平行语料库;同时完成了“蒙古语知识词典库”(包括具有6万个词条,69个属性字段的“蒙古语语义信息词典”、 3.5万条熟语,15个属性字段,4个辅助库的“蒙古语熟语知识库”、有3万棵树的“蒙古语句法结构知识库”等)。口语语料库建设方面,已建立20个小时5个层次的标注库、5个小时的语料韵律标注20小时的“喀尔喀方言口语语料库”和“蒙古语口语韵律标注库”以及“面向言语工程的蒙古语语音数据库”。蒙古文信息处理工程技术研发方面,开发了包括蒙古语语料库自动校对软件、精加工语料库软件、词法、短语、语义自动标注软件、蒙古语语音识别、合成软件以及蒙古语标准音自动检测系统在内的蒙古语言资源加工系列软件等。
经专家组认真听取项目单位汇报、观看成果演示,听取项目监理单位监理意见,进行项目组答辩后,一致认为该项目内容涉及面广,涵盖蒙古语言文字信息化基础理论研究、标准规范研制和软件系统研发,涉及语言学、计算机科学等相关学科,工作量大,技术含量高。其研究成果具有重要的理论意义和应用价值,将对蒙古语言文字信息化事业起到有力的推动作用。
2015年10月31日,自治区民委、财政厅在内蒙古大学组织召开2013年度自治区蒙古语言文字信息化专项扶持项目“蒙古语语言资源建设、信息化理论与相关技术研究”结项验收会。
该项目是第一批立项实施的自治区蒙古语言文字信息化专项扶持项目,建设期为两年。项目开发内容包括蒙古语言文字信息化基础研究、蒙古语言文字资源库建设和蒙古文信息处理言语工程技术研发3项内容。主要建设成果有:基础研究方面,一是蒙古语言文字信息化基础研究—基础标准和规范的研制完善,对《信息技术 传统蒙古文名义字符、变形显现字符和控制字符使用规则》(GB 25914—2010)等七项标准进行了扩充和完善。二是在面向信息处理的蒙古语语义研究、面向信息处理的蒙古语句法研究等基础理论研究方面取得了显著成绩(起草2项国家标准文本、出版2部专著,发表20余篇论文),其成果在蒙古语自然语言处理领域有较大的理论创新。蒙古语言文字资源库建设方面,已完成的数据资源建设包括1000万词蒙古语粗加工语料库、500万词蒙古语精加工语料库和80万句对的汉蒙、蒙汉平行语料库;同时完成了“蒙古语知识词典库”(包括具有6万个词条,69个属性字段的“蒙古语语义信息词典”、 3.5万条熟语,15个属性字段,4个辅助库的“蒙古语熟语知识库”、有3万棵树的“蒙古语句法结构知识库”等)。口语语料库建设方面,已建立20个小时5个层次的标注库、5个小时的语料韵律标注20小时的“喀尔喀方言口语语料库”和“蒙古语口语韵律标注库”以及“面向言语工程的蒙古语语音数据库”。蒙古文信息处理工程技术研发方面,开发了包括蒙古语语料库自动校对软件、精加工语料库软件、词法、短语、语义自动标注软件、蒙古语语音识别、合成软件以及蒙古语标准音自动检测系统在内的蒙古语言资源加工系列软件等。
经专家组认真听取项目单位汇报、观看成果演示,听取项目监理单位监理意见,进行项目组答辩后,一致认为该项目内容涉及面广,涵盖蒙古语言文字信息化基础理论研究、标准规范研制和软件系统研发,涉及语言学、计算机科学等相关学科,工作量大,技术含量高。其研究成果具有重要的理论意义和应用价值,将对蒙古语言文字信息化事业起到有力的推动作用。
Copyright All rights版权所有:中共内蒙古自治区委党史和地方志研究室 未经许可不得转载
地址:内蒙古呼和浩特市兴安南路147号 电话:(0471)3292175
蒙ICP备05003250号-3
蒙公安备案:15010502000173号
政府网站标识码:1500000032
技术支持: 内蒙古传星科技有限公司 网站地图