[00804953]基于XML的网络信息处理方法与应用研究
交易价格:
面议
所属行业:
智能交通
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:安徽合肥市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
为了建立有效的基于XML的数据采集机制和处理方法,通过课题组成员的共同努力,针对XML的数据采集机制,提出了一种基于模式的半结构化数据抽取方法,并按OEM数据模型进行表示。在OEM半结构化数据表示模型上,提出了对象关联模式及基于路径的结构模式知识发现方法。为了利用XML对一般半结构化数据进行研究,提出了一种基于XML存储OEM模型表示的半结构化数据的方法。针对XML文档的结构信息提取,提出了一种增量式的标记有序树模型模式发现方法IncFreqt,引入称为桥连接这一新的扩展技术,解决了现有模式发现方法要求新增数据只能加入到标记有序树的根节点处的问题,可有效处理在任意节点处新增数据的增量式结构发现问题。针对Web文档信息检索,提出了文档的低维空间索引的建立方法,并对基于角分类的文本分类算法进行了研究,提出了一种新的角分类网络。以角分类算法为学习算法的前向神经网络,在信息检索,特别是在线Web信息检索等领域有着重要的应用。
为了建立有效的基于XML的数据采集机制和处理方法,通过课题组成员的共同努力,针对XML的数据采集机制,提出了一种基于模式的半结构化数据抽取方法,并按OEM数据模型进行表示。在OEM半结构化数据表示模型上,提出了对象关联模式及基于路径的结构模式知识发现方法。为了利用XML对一般半结构化数据进行研究,提出了一种基于XML存储OEM模型表示的半结构化数据的方法。针对XML文档的结构信息提取,提出了一种增量式的标记有序树模型模式发现方法IncFreqt,引入称为桥连接这一新的扩展技术,解决了现有模式发现方法要求新增数据只能加入到标记有序树的根节点处的问题,可有效处理在任意节点处新增数据的增量式结构发现问题。针对Web文档信息检索,提出了文档的低维空间索引的建立方法,并对基于角分类的文本分类算法进行了研究,提出了一种新的角分类网络。以角分类算法为学习算法的前向神经网络,在信息检索,特别是在线Web信息检索等领域有着重要的应用。