[00331863]基于聚类的网页内容信息提取方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
通过小试
专利所属地:中国
专利号:CN201710602891.1
交易方式:
资料待完善
联系人:
福州大学
进入空间
所在地:福建福州市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
摘要:本发明提出了一种基于网页聚类的网页信息提取方法,包括网页的标题、正文和时间。该方法利用对结构相同的网页进行统一的提取操作,来提高网页正文内容抽取的准确率。本发明适用于提取来自同一网站的网页,不需要复杂的计算,简单实用。
摘要:本发明提出了一种基于网页聚类的网页信息提取方法,包括网页的标题、正文和时间。该方法利用对结构相同的网页进行统一的提取操作,来提高网页正文内容抽取的准确率。本发明适用于提取来自同一网站的网页,不需要复杂的计算,简单实用。