[01080943]THOCR-94高性能汉英混排印刷文本识别系统
交易价格:
面议
所属行业:
印刷
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
THOCR-94高性能汉英混排印刷文本识别系统是国家“863计划”项目,可将印刷材料自动输入计算机进行识别,是一个功能完善、性能优异的中、英文混排印刷文本识别系统,也是目前识别率最高的多体印刷汉字识别系统。其特点是:采用“组合特征综合识别”方法,在国际上首次解决了中、英文混排文本自动识别问题。系统自动化程度高,实现了中文印刷表格的自动识别和数据的自动录入;首创了中文OCR系统中图像的全自动扫描;解决 了自动版面分析和自动倾斜校正问题。设有开放的用户自学系统结构,拓展了识别范围。同时开发了DOS版本和Windows版本,可满足不同用户的需要,具有国际化、标准化的中文应用系统。系统能识别简体汉字4230个、繁体汉字5401个,再加118个符号;英文52个大小写字 母加标点符号;识别字体包括汉字的宋、仿、黑、楷、魏碑、小姚及其多种变体和英文正体27种。识别正确率高于98.5%,对印刷质量好的文体识别正确率高于99.5%。系统具有较高的自动化和实用性能,总体上居国际领先水平。
THOCR-94高性能汉英混排印刷文本识别系统是国家“863计划”项目,可将印刷材料自动输入计算机进行识别,是一个功能完善、性能优异的中、英文混排印刷文本识别系统,也是目前识别率最高的多体印刷汉字识别系统。其特点是:采用“组合特征综合识别”方法,在国际上首次解决了中、英文混排文本自动识别问题。系统自动化程度高,实现了中文印刷表格的自动识别和数据的自动录入;首创了中文OCR系统中图像的全自动扫描;解决 了自动版面分析和自动倾斜校正问题。设有开放的用户自学系统结构,拓展了识别范围。同时开发了DOS版本和Windows版本,可满足不同用户的需要,具有国际化、标准化的中文应用系统。系统能识别简体汉字4230个、繁体汉字5401个,再加118个符号;英文52个大小写字 母加标点符号;识别字体包括汉字的宋、仿、黑、楷、魏碑、小姚及其多种变体和英文正体27种。识别正确率高于98.5%,对印刷质量好的文体识别正确率高于99.5%。系统具有较高的自动化和实用性能,总体上居国际领先水平。