X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
帮助中心 | 关于我们
欢迎来到辽阳市科技创新服务平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[01145802]面向软件开发自动化的半结构化文本语义表达与分类研究

交易价格: 面议

所属行业: 软件

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

在软件开发过程中,需求文档、设计文档、程序代码、测试文档等均以文本作为信息的主要载体。而这些文本的形式化表达、智能检索、分类管理等是支撑软件快速开发直至自动生成的重要基础工作。 本研究的核心思想是针对文本的半结构化特点,利用结构化稀疏理论结合最新的深度学习研究成果,实现相关文本的语义表达及分类,为软件开发的自动化提供基础性支持。同时也为高维数据的稀疏表达、快速分类算法、深度神经网络建模及优化求解等重要问题提供新的解决思路和途径。本研究是基于高维大样本数据统计分析的一个典型例子,通过本课题研究获得的理论和方法也可以应用于类似的其他领域的分析与研究中,如:基于高光谱或太赫兹的产品无损检测,智慧医疗服务,新冠疫情期间微博文本情感分析等等。 项目从文本的结构生成,特征选择,稀疏约束,语义表达,分类器改进,应用扩展等方面展开研究工作,完成情况如下: 提出了一种面向文本分类的增强判别主题稀疏表达方法。通过构造类别中心向量并结合LDA模型生成字典,之后采用L1/2正则化实现文本的增强稀疏表达。实验结果表明:除了极低维的情况外,新方法在分类性能方面均优于其它竞争方法并且更为稳定。而且其编码表达在大部分情况下也获得更好的稀疏度,这样也有利于进一步的文档语义分析。 提出了一种基于LSTM和自注意力机制的上下文语义增强注意力网络实现文本分类。通过对方面词的上下文进行充分的语义建模,解决了传统方法对方面词所处的上下文的语义信息建模不充分的问题。模型首先对“左上下文+方面词”、“方面词+右上下文”和“左上下文+方面词+右上下文”分别使用三个双向长短期记忆网络进行语义建模,将它们的结果相加之后使用注意力机制捕捉其中的关键信息。在三个基准数据集中与六个对比方法的实验结果表明,提出的方法可以进一步提高模型的分类准确性。 提出了一种基于情感倾向信息结构融合的文本情感分类算法。系统首先提取文本中的情感倾向信息,然后学习上下文语义与情感倾向信息之间的交互式表示。首先使用两个BiLSTM网络分别建模上下文语义和情感倾向信息,然后采用两种类型的注意力机制实现上下文语义与情感倾向信息的交互式学习,并捕捉序列中的关键信息,利用文本中情感倾向信息对情感极性的影响提高分类性能。在四个基准数据集中与八个对比方法的实验表明,提出的方法具有更好的分类准确性。此外,注意力权重可视化的结果也表明了情感倾向信息的有效性。 利用极限学习机的核变换构造分类器,并扩展应用到谱数据分类,实现高维小样本的有效分类;提出一种犹豫模糊-粗糙最近邻算法,挖掘医疗数据预测住院时间以实现灵活医疗;利用高维数据统计方法实现粒径分布估计建模;另外,新冠疫情对人们的生活产生重大影响。而对疫情期间的微博文本进行情感分析,科学高效地做好舆情引导工作具有重要意义。提出了一种基于情感倾向信息融合的新冠疫情微博文本情感分类方法。
在软件开发过程中,需求文档、设计文档、程序代码、测试文档等均以文本作为信息的主要载体。而这些文本的形式化表达、智能检索、分类管理等是支撑软件快速开发直至自动生成的重要基础工作。 本研究的核心思想是针对文本的半结构化特点,利用结构化稀疏理论结合最新的深度学习研究成果,实现相关文本的语义表达及分类,为软件开发的自动化提供基础性支持。同时也为高维数据的稀疏表达、快速分类算法、深度神经网络建模及优化求解等重要问题提供新的解决思路和途径。本研究是基于高维大样本数据统计分析的一个典型例子,通过本课题研究获得的理论和方法也可以应用于类似的其他领域的分析与研究中,如:基于高光谱或太赫兹的产品无损检测,智慧医疗服务,新冠疫情期间微博文本情感分析等等。 项目从文本的结构生成,特征选择,稀疏约束,语义表达,分类器改进,应用扩展等方面展开研究工作,完成情况如下: 提出了一种面向文本分类的增强判别主题稀疏表达方法。通过构造类别中心向量并结合LDA模型生成字典,之后采用L1/2正则化实现文本的增强稀疏表达。实验结果表明:除了极低维的情况外,新方法在分类性能方面均优于其它竞争方法并且更为稳定。而且其编码表达在大部分情况下也获得更好的稀疏度,这样也有利于进一步的文档语义分析。 提出了一种基于LSTM和自注意力机制的上下文语义增强注意力网络实现文本分类。通过对方面词的上下文进行充分的语义建模,解决了传统方法对方面词所处的上下文的语义信息建模不充分的问题。模型首先对“左上下文+方面词”、“方面词+右上下文”和“左上下文+方面词+右上下文”分别使用三个双向长短期记忆网络进行语义建模,将它们的结果相加之后使用注意力机制捕捉其中的关键信息。在三个基准数据集中与六个对比方法的实验结果表明,提出的方法可以进一步提高模型的分类准确性。 提出了一种基于情感倾向信息结构融合的文本情感分类算法。系统首先提取文本中的情感倾向信息,然后学习上下文语义与情感倾向信息之间的交互式表示。首先使用两个BiLSTM网络分别建模上下文语义和情感倾向信息,然后采用两种类型的注意力机制实现上下文语义与情感倾向信息的交互式学习,并捕捉序列中的关键信息,利用文本中情感倾向信息对情感极性的影响提高分类性能。在四个基准数据集中与八个对比方法的实验表明,提出的方法具有更好的分类准确性。此外,注意力权重可视化的结果也表明了情感倾向信息的有效性。 利用极限学习机的核变换构造分类器,并扩展应用到谱数据分类,实现高维小样本的有效分类;提出一种犹豫模糊-粗糙最近邻算法,挖掘医疗数据预测住院时间以实现灵活医疗;利用高维数据统计方法实现粒径分布估计建模;另外,新冠疫情对人们的生活产生重大影响。而对疫情期间的微博文本进行情感分析,科学高效地做好舆情引导工作具有重要意义。提出了一种基于情感倾向信息融合的新冠疫情微博文本情感分类方法。

推荐服务:

主办单位:辽阳市科学技术局

技术支持单位:科易网

辽ICP备16017206号-1

辽公网安备 21100302203138号

关于我们

平台简介

联系我们

客服咨询

400-649-1633

工作日:08:30-21:00

节假日:08:30-12:00

13:30-17:30