X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
帮助中心 | 关于我们
欢迎来到辽阳市科技创新服务平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[01821810]基于语义的Web页面信息自动获取关键技术研究

交易价格: 面议

所属行业: 智能交通

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

该课题实现了一个面向主题的网页爬行器,用以下载并收集有关网页信息;提出了一种基于TBL的中文名实体识别方法,实验表明这种改进的基于TBL的后处理技术极大地提高了中文名实体识别的识别效果,可自动学习并且不会过拟合;提出了一种基于内聚度的多文档文摘的句子排序方法,实验结果表明该方法能够较好的改善文摘的可读性;根据Web页面信息的特点,对向量空间模型的表示和相似度的计算进行了改进,提出了一种应用于Web页面中的热门话题检测与排序方法,实验结果显示此方法取得了较好的结果;提出了一种面向文件检索的高效处理方法,该方法仅通过两次迭代归并,即能建立海量倒排表,通过分析关键字段特征实现相关性排序。
该课题实现了一个面向主题的网页爬行器,用以下载并收集有关网页信息;提出了一种基于TBL的中文名实体识别方法,实验表明这种改进的基于TBL的后处理技术极大地提高了中文名实体识别的识别效果,可自动学习并且不会过拟合;提出了一种基于内聚度的多文档文摘的句子排序方法,实验结果表明该方法能够较好的改善文摘的可读性;根据Web页面信息的特点,对向量空间模型的表示和相似度的计算进行了改进,提出了一种应用于Web页面中的热门话题检测与排序方法,实验结果显示此方法取得了较好的结果;提出了一种面向文件检索的高效处理方法,该方法仅通过两次迭代归并,即能建立海量倒排表,通过分析关键字段特征实现相关性排序。

推荐服务:

主办单位:辽阳市科学技术局

技术支持单位:科易网

辽ICP备16017206号-1

辽公网安备 21100302203138号

关于我们

平台简介

联系我们

客服咨询

400-649-1633

工作日:08:30-21:00

节假日:08:30-12:00

13:30-17:30