[00502140]异质信息网络的聚类分析研究
交易价格:
面议
所属行业:
网络
类型:
非专利
技术成熟度:
正在研发
交易方式:
其他
联系人:柯安星
所在地:福建厦门市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该项目主要研究内容如下:
1。研究了异质信息网络中的相似性度量问题,提出了 HeteSim 标准用于度量异质信息网络中任意两个节点的相关性,提出了 HRank 方法度量节点和元路径的重要性。也在大规模异质信息网络中研究相似性度量,针对现有的许多方法仅可以度量相同类型结点间的相似性, 而且度量受限于运算内存的大小,可度量的数据量非常有限,无法真正的应用到真实的网络中去的缺点,提出一个新的相似性度量算法 AvgSim 以及它的快速计算方法,AvgSim 度量方法是一种双向平均随机游走的方法,并采用 MapReduce 编程模型在 Hadoop 分布式系统上实现分块矩阵乘法的并行化,使 AvgSim 算法高效地处理海量数据。
2。提出基于网络分解的异质网络聚类方法 HeProjI 将异质信息网络分解成若干个简单的子网络后分而治之,更能适应实际网络化数据中复杂且不规则的结构。
提出基于异质信息网络的语义推荐方法 SemRec,通过带权元路径灵活地整合异质信息,同时学到个性化权重来表达用户对路径的偏好,并进一步地提出一种可解释的语义个性化推荐方法,并研制了可解释的推荐系统 RecExp。
该项目主要研究内容如下:
1。研究了异质信息网络中的相似性度量问题,提出了 HeteSim 标准用于度量异质信息网络中任意两个节点的相关性,提出了 HRank 方法度量节点和元路径的重要性。也在大规模异质信息网络中研究相似性度量,针对现有的许多方法仅可以度量相同类型结点间的相似性, 而且度量受限于运算内存的大小,可度量的数据量非常有限,无法真正的应用到真实的网络中去的缺点,提出一个新的相似性度量算法 AvgSim 以及它的快速计算方法,AvgSim 度量方法是一种双向平均随机游走的方法,并采用 MapReduce 编程模型在 Hadoop 分布式系统上实现分块矩阵乘法的并行化,使 AvgSim 算法高效地处理海量数据。
2。提出基于网络分解的异质网络聚类方法 HeProjI 将异质信息网络分解成若干个简单的子网络后分而治之,更能适应实际网络化数据中复杂且不规则的结构。
提出基于异质信息网络的语义推荐方法 SemRec,通过带权元路径灵活地整合异质信息,同时学到个性化权重来表达用户对路径的偏好,并进一步地提出一种可解释的语义个性化推荐方法,并研制了可解释的推荐系统 RecExp。