[00517168]面向大规模社会媒体的动态舆情内容安全监测关键技术研究
交易价格:
面议
所属行业:
网络
类型:
非专利
技术成熟度:
通过小试
交易方式:
其他
联系人:柯安星
所在地:福建厦门市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该项目为国家自然科学基金资助面上项目(项目批准号:61472258)。
该项目采用并基于深度学习模型的多层次语境感知的词向量特征表达学习方法,将社会 媒体数据相关的语境信息分为话语语境、社会语境、Web 语境,合理表示不同的语境信息, 并基于深度学习模型,将多层次语境信息有效整合到词向量的特征表达学习中,扩展词向量 特征表达。该思路能有效解决社会媒体数据中大量短文本导致的特征稀疏性问题,提高舆情 内容安全监测的准确度。采用非参数化的社会媒体舆情内容多视角话题情感混合模型。提出 以潜在 Dirichlet 分配、层次 Dirichlet 过程等概率模型为基础,统一表示社会媒体舆情内容的视角、话题、情感等多重因素,建立非参数 Bayesian 的多视角话题情感混合模型,同时进行话题情感分析。该思路使话题情感混合模型随多源数据的增长自适应地选择模型参数, 符合社会媒体数据来源多样、话题广泛的特点。采用基于时间依赖函数的社会媒体舆情内容 话题情感动态演变模型。考虑时间维度,提出基于时间依赖函数的社会媒体舆情内容话题情 感动态演变模型,对话题情感的产生、变化、消亡进行建模。该思路使深度学习模型和话题 情感混合模型能随着社会媒体数据的变化自动演化,符合社会评论数据动态更新的特点。采 用基于云计算框架构建大规模社会媒体舆情内容监测的在线分布式并行算法。基于变分法、采样法等近似统计推断算法以及随机梯度下降法、共轭梯度法等最优化方法,对话题情感混 合模型和深度学习进行求解,并基于 MapReduce 等云计算框架对求解算法进行在线分布式并行化,符合舆情内容安全监测中必须对动态大规模社会数据进行实时分析处理的要求。
该项目的思路既不同于已有的静态情感倾向分析,也不同于面向文本流的动态话题分析, 由于采用整合多层次语境信息的词向量特征表达,有望改善短文本引起的特征稀疏问题,有 效提高话题情感分析的准确性。并且,项目研究的算法能随社会媒体数据的增长动态更新, 具有更好的自适应性和可扩展性。该项目既是网络信息安全、数据挖掘、自然语言处理、信 息检索等多学科交叉综合的前沿研究课题,又是创新性的应用基础探索研究,具有一定应用 前景。
该项目为国家自然科学基金资助面上项目(项目批准号:61472258)。
该项目采用并基于深度学习模型的多层次语境感知的词向量特征表达学习方法,将社会 媒体数据相关的语境信息分为话语语境、社会语境、Web 语境,合理表示不同的语境信息, 并基于深度学习模型,将多层次语境信息有效整合到词向量的特征表达学习中,扩展词向量 特征表达。该思路能有效解决社会媒体数据中大量短文本导致的特征稀疏性问题,提高舆情 内容安全监测的准确度。采用非参数化的社会媒体舆情内容多视角话题情感混合模型。提出 以潜在 Dirichlet 分配、层次 Dirichlet 过程等概率模型为基础,统一表示社会媒体舆情内容的视角、话题、情感等多重因素,建立非参数 Bayesian 的多视角话题情感混合模型,同时进行话题情感分析。该思路使话题情感混合模型随多源数据的增长自适应地选择模型参数, 符合社会媒体数据来源多样、话题广泛的特点。采用基于时间依赖函数的社会媒体舆情内容 话题情感动态演变模型。考虑时间维度,提出基于时间依赖函数的社会媒体舆情内容话题情 感动态演变模型,对话题情感的产生、变化、消亡进行建模。该思路使深度学习模型和话题 情感混合模型能随着社会媒体数据的变化自动演化,符合社会评论数据动态更新的特点。采 用基于云计算框架构建大规模社会媒体舆情内容监测的在线分布式并行算法。基于变分法、采样法等近似统计推断算法以及随机梯度下降法、共轭梯度法等最优化方法,对话题情感混 合模型和深度学习进行求解,并基于 MapReduce 等云计算框架对求解算法进行在线分布式并行化,符合舆情内容安全监测中必须对动态大规模社会数据进行实时分析处理的要求。
该项目的思路既不同于已有的静态情感倾向分析,也不同于面向文本流的动态话题分析, 由于采用整合多层次语境信息的词向量特征表达,有望改善短文本引起的特征稀疏问题,有 效提高话题情感分析的准确性。并且,项目研究的算法能随社会媒体数据的增长动态更新, 具有更好的自适应性和可扩展性。该项目既是网络信息安全、数据挖掘、自然语言处理、信 息检索等多学科交叉综合的前沿研究课题,又是创新性的应用基础探索研究,具有一定应用 前景。