[00125658]基于不确定推理的文本层次分类方法与装置
交易价格:
面议
所属行业:
软件
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:201010562470.9
交易方式:
技术转让
联系人:
南京师范大学
进入空间
所在地:江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及利用数据挖掘技术进行中文文本处理的信息技术领域,设计一种基于不确定推理的文本层次分类方法和装置。包括:a)从训练文本中提取特征;b)确定分类问题的便是框焦元;c)利用特征的权重构造基本可信度分配函数;d) 利用特征的基本可信度分配函数合成测试文本的信度分布;e) 利用信度分布根据分类规则进行分类。基本发明有以下特征:通过将非叶子类构造成虚拟的叶子类参与分类,很好的区分了父类与子类之间的不同特征;利用基本可信度分配函数,分配给非叶子类参的信度以及pignistic概率将文本的分类可信度表示为一个三角模糊数,该分类是充分地利用了不确定信息,提高了分类的准确度。
本发明涉及利用数据挖掘技术进行中文文本处理的信息技术领域,设计一种基于不确定推理的文本层次分类方法和装置。包括:a)从训练文本中提取特征;b)确定分类问题的便是框焦元;c)利用特征的权重构造基本可信度分配函数;d) 利用特征的基本可信度分配函数合成测试文本的信度分布;e) 利用信度分布根据分类规则进行分类。基本发明有以下特征:通过将非叶子类构造成虚拟的叶子类参与分类,很好的区分了父类与子类之间的不同特征;利用基本可信度分配函数,分配给非叶子类参的信度以及pignistic概率将文本的分类可信度表示为一个三角模糊数,该分类是充分地利用了不确定信息,提高了分类的准确度。