[00281047]一种融合了越南语语言特点的PCFG模型的越南语短语树库构建方法
交易价格:
面议
所属行业:
其他教育休闲
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610242291.4
交易方式:
技术转让
技术转让
技术入股
联系人:
昆明理工大学
进入空间
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及一种融合了越南语语言特点的PCFG模型的越南语短语树库构建方法,属自然语言处理技术领域。本发明首先获取融合了越南语语言特点的PCFG模型中的语法规则概率;再制定越南语语言特征概率;将越南语语言特征概率作为语法规则概率的补充和语法规则概率一起融入到PCFG模型中,得到融合了越南语语言特点的PCFG模型;再进行初级越南语短语树库的构建;再利用短语树库校正器对新生成的越南语短语树库进行校正,最后得到最终的越南语短语树库。本发明避免了人工收集和标注越南语短语树库的过程,节省了人力和构建树库的时间;相比采用传统PCFG构建越南语短语树库和最大熵构建越南语短语树库方法准确率明显提高。
本发明涉及一种融合了越南语语言特点的PCFG模型的越南语短语树库构建方法,属自然语言处理技术领域。本发明首先获取融合了越南语语言特点的PCFG模型中的语法规则概率;再制定越南语语言特征概率;将越南语语言特征概率作为语法规则概率的补充和语法规则概率一起融入到PCFG模型中,得到融合了越南语语言特点的PCFG模型;再进行初级越南语短语树库的构建;再利用短语树库校正器对新生成的越南语短语树库进行校正,最后得到最终的越南语短语树库。本发明避免了人工收集和标注越南语短语树库的过程,节省了人力和构建树库的时间;相比采用传统PCFG构建越南语短语树库和最大熵构建越南语短语树库方法准确率明显提高。