[00301883]一种基于潜在语义分析的迁移学习方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201310069560.8
交易方式:
技术转让
技术转让
技术入股
联系人:
哈尔滨工程大学
进入空间
所在地:黑龙江哈尔滨市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
摘要:本发明的目的在于提供一种基于潜在语义分析的迁移学习方法,包括以下步骤对训练数据做去停用词、词干化处理,分别计算源领域与目标领域词汇权重,得到词汇‑文本矩阵M,对矩阵M进行奇异值分解,将M中词汇与文本映射到低维潜在语义空间,去除源领域中同义词噪音影响,调整矩阵M结构,从源领域中找出与目标领域文本关联度较大的词汇作为迁移词,再对矩阵M结构进行调整,分析调整后的矩阵M中目标领域词汇,得到目标领域数据新的特征表示,在训数据集中得到最终分类器,对测试数据集S进行分类。
摘要:本发明的目的在于提供一种基于潜在语义分析的迁移学习方法,包括以下步骤对训练数据做去停用词、词干化处理,分别计算源领域与目标领域词汇权重,得到词汇‑文本矩阵M,对矩阵M进行奇异值分解,将M中词汇与文本映射到低维潜在语义空间,去除源领域中同义词噪音影响,调整矩阵M结构,从源领域中找出与目标领域文本关联度较大的词汇作为迁移词,再对矩阵M结构进行调整,分析调整后的矩阵M中目标领域词汇,得到目标领域数据新的特征表示,在训数据集中得到最终分类器,对测试数据集S进行分类。