[01136610]班智达藏文自动标注系统
交易价格:
面议
所属行业:
软件
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
《班智达藏文标注系统》是国家语委科研项目《藏语语料库切分标注规范及其辅助工具研究》的子项目,项目编号:MZ05-118,项目起止时间:2005年9月-2008年5月,成果是以光盘形式的软件产品。该软件可将藏文文本自动切分成藏语语法最小基本单位词,并标注每个词的语法信息,不但可以切分标注纯藏文的文本,而且可以切分标注含有英文、阿拉伯数字和各种符号的藏文文本。同时提供了100万字节的切分标注语料,其主要技术指标有:班智达藏文标注系统运行稳定,易操作;班智达藏文标注系统切分标注准确率达97%;班智达藏文标注系统切分标注速度快;建立语料库的切分标注准确率达99%。 随着我国加入WTO和西部大开发战略的实施,藏区需要了解世界,世界需要了解藏区,文化交流和信息交流日趋频繁和广泛,近年来藏文信息处理技术有了长足的发展。我课题组研制开发的班智达藏文标注系统为藏文字频、词频统计,词典编篡,藏语言文字规范化研究,词性标注和属性研究,藏语语法语义研究等奠定了基础,特别为汉藏翻译系统的研制提供了理论依据和技术保障。为制定国际藏文切分标准提供了参考依据。从而填补这一领域的空白。该项目的产业化必将对进一步开发国内其它少数民族语言的相关产品具有重要的示范意义。对藏语言信息系列产品在其他领域的应用,如语音输入、电话翻译等语音翻译产品具有示范和促进作用。
《班智达藏文标注系统》是国家语委科研项目《藏语语料库切分标注规范及其辅助工具研究》的子项目,项目编号:MZ05-118,项目起止时间:2005年9月-2008年5月,成果是以光盘形式的软件产品。该软件可将藏文文本自动切分成藏语语法最小基本单位词,并标注每个词的语法信息,不但可以切分标注纯藏文的文本,而且可以切分标注含有英文、阿拉伯数字和各种符号的藏文文本。同时提供了100万字节的切分标注语料,其主要技术指标有:班智达藏文标注系统运行稳定,易操作;班智达藏文标注系统切分标注准确率达97%;班智达藏文标注系统切分标注速度快;建立语料库的切分标注准确率达99%。 随着我国加入WTO和西部大开发战略的实施,藏区需要了解世界,世界需要了解藏区,文化交流和信息交流日趋频繁和广泛,近年来藏文信息处理技术有了长足的发展。我课题组研制开发的班智达藏文标注系统为藏文字频、词频统计,词典编篡,藏语言文字规范化研究,词性标注和属性研究,藏语语法语义研究等奠定了基础,特别为汉藏翻译系统的研制提供了理论依据和技术保障。为制定国际藏文切分标准提供了参考依据。从而填补这一领域的空白。该项目的产业化必将对进一步开发国内其它少数民族语言的相关产品具有重要的示范意义。对藏语言信息系列产品在其他领域的应用,如语音输入、电话翻译等语音翻译产品具有示范和促进作用。