技术详细介绍
本成果“特定类视频和图像识别关键技术及应用”是在充分调研和分析国内外智能视频和图像识别现状,针对一些专业领域,如高速网络环境下敏感视频和图像识别、智慧安监塔吊对象识别、智慧矿山视频监控等领域的监测与管理需求提出的。成果在多项省部级项目(IDC骨干网络敏感视频和图像监管系统(2010C31083)、面向互联网的图像检索中语义分类研究(Y1101073)、坚强智能电网反外力预警系统的开发与应用(2012C21020 )、基于语义层次流形的网络图像分类研究(LY15F020039))的研究基础上,通过建立基于视觉感知的视频和图像识别模型、智能化的图像分层识别策略、软硬件结合的高速数据流解析技术、多模态机器学习方法等,快速准确地从海量的视频图像资源中识别出包含有特定类别的视频和图像信息。在技术的创造性与先进性方面,构建了多模态深度神经网络架构和机器学习模型,解决具有复杂背景和特殊语义的视频和图像小样本数据鲁棒特征提取的难题;提出了一种基于层次化注意力嵌入的特定对象识别方法,提升了背景复杂、对象遮挡严重场景下对象识别结果;设计了基于视觉感知的敏感视频和图像识别模型,提高模式识别方法与精细识别算法的互补性。监控场景下多模态视频识别准确率>94%,图像识别准确率>96%。对挖掘机、塔吊等大型施工机械危害高压线缆的行为,平均识别率>90%,误报率<15%。敏感视频的正确识别率达到了94%以上,正常视频的虚警率控制在3%左右。敏感图像的正确识别率达到96%以上,比同类软件高出5%;正常图像的虚警率低于5%,比同类软件低约9%。成果技术在杭州海络信息技术有限公司、浙江卓信信息技术有限公司、浙江航天恒嘉数据科技有限公司等企业得到工业应用,表明本成果提出的特定类视频和图像识别技术先进、系统稳定可靠、识别准确率高,具备广阔的应用前景。近三年累计取得新增销售收入12740.21万元,新增利润690.01万元,新增税收1271.14万元。该技术在多家信息技术公司推广应用,节约人力成本6000万元以上。开发的特定类视频和图像识别系统可在矿山、农业等应用领域推广,经济和社会效益显著。
本成果“特定类视频和图像识别关键技术及应用”是在充分调研和分析国内外智能视频和图像识别现状,针对一些专业领域,如高速网络环境下敏感视频和图像识别、智慧安监塔吊对象识别、智慧矿山视频监控等领域的监测与管理需求提出的。成果在多项省部级项目(IDC骨干网络敏感视频和图像监管系统(2010C31083)、面向互联网的图像检索中语义分类研究(Y1101073)、坚强智能电网反外力预警系统的开发与应用(2012C21020 )、基于语义层次流形的网络图像分类研究(LY15F020039))的研究基础上,通过建立基于视觉感知的视频和图像识别模型、智能化的图像分层识别策略、软硬件结合的高速数据流解析技术、多模态机器学习方法等,快速准确地从海量的视频图像资源中识别出包含有特定类别的视频和图像信息。在技术的创造性与先进性方面,构建了多模态深度神经网络架构和机器学习模型,解决具有复杂背景和特殊语义的视频和图像小样本数据鲁棒特征提取的难题;提出了一种基于层次化注意力嵌入的特定对象识别方法,提升了背景复杂、对象遮挡严重场景下对象识别结果;设计了基于视觉感知的敏感视频和图像识别模型,提高模式识别方法与精细识别算法的互补性。监控场景下多模态视频识别准确率>94%,图像识别准确率>96%。对挖掘机、塔吊等大型施工机械危害高压线缆的行为,平均识别率>90%,误报率<15%。敏感视频的正确识别率达到了94%以上,正常视频的虚警率控制在3%左右。敏感图像的正确识别率达到96%以上,比同类软件高出5%;正常图像的虚警率低于5%,比同类软件低约9%。成果技术在杭州海络信息技术有限公司、浙江卓信信息技术有限公司、浙江航天恒嘉数据科技有限公司等企业得到工业应用,表明本成果提出的特定类视频和图像识别技术先进、系统稳定可靠、识别准确率高,具备广阔的应用前景。近三年累计取得新增销售收入12740.21万元,新增利润690.01万元,新增税收1271.14万元。该技术在多家信息技术公司推广应用,节约人力成本6000万元以上。开发的特定类视频和图像识别系统可在矿山、农业等应用领域推广,经济和社会效益显著。