技术详细介绍
1、 课题来源与背景 随着智能手机和智能硬件的兴起,人与机器进行复杂信息交换的方式产生了颠覆性变化。传统的以键盘鼠标进行复杂信息获取的方式正在被以语音为主要通道的自然交互方式逐渐替代,口语交互成为在越来越多的自然场景下人机便捷沟通的趋势。 2、 研究目的与意义 语音交互自人工智能产生以来就一直是人工智能的核心研究领域,从语音识别开始,深度感知与认知决策为基础的人机口语对话系统更是其中最重要的方向之一。尤其近年来,移动互联网和物联网的迅猛发展更把人机语音交互系统推向了科学研究和产业应用的前沿。但是,现有产品的语音交互能力在对语音的感知和认知方面存在很大的局限性。正因为如此,人机语音交互技术也成为国内外人工智能领域的必争高地。各国的研究机构和企业都在相关领域大力投入,力图在核心技术和产业化方面的取得先发优势。我国在语音交互核心技术的研发起步较晚但一直受到一定程度的重视。但我国目前在语音技术产业化方面还明显落后,基本处于照抄国外产品的状态,还没有形成自主的产业化能力。尤其是缺乏能够为人工智能产业生态提供全链路语音交互解决方案的基础性的公共服务平台。因此非常需要建立以企业为核心的产品化平台,带动相关科研单位在核心关键技术上进行突破,并快速产业化。同时,人机语音交互平台也是推动制造、教育、健康医疗、金融、生活服务、能源、交通、商业流通、社会管理等传统产业和公共服务进行人工智能改造的核心技术,能够带动多个产业集群,深刻地改变传统产业的现状,实现人工智能对传统产业的广泛改造。 3、 主要论点与论据 本课题针对语音交互技术产业化过程中存在的关键问题进行技术突破。采用先进的理论研究思路和算法实现对深度学习加大数据思路的突破,相关算法和理论突破都基于从真实用户需求中提炼出的科学问题,提供了以语音识别为基础的全链条语音交互服务。针对复杂声学环境语音识别,开展深度学习信号处理技术和环境自适应技术研发,将麦克风阵列信号处理、鲁棒语音特征提取、先进深度学习模型应用结合起来实现高性能语音识别。针对上下文及场景感知的深度语义理解、对话决策和语言生成,采用结构化深度学习技术实现上下文相关的语义理解,采用深度强化学习框架实现统计对话管理技术,并在此基础上,针对真实场景构建垂直领域对话系统,融合任务型对话、问答、聊天等不同元素,实现综合的交互式智能信息服务。 4、 创见与创新 本课题紧紧把握人机口语对话系统面临的重大技术挑战,在研究问题、技术路线和理论方法上有如下的创见与创新: 本课题的研究问题不是基于离线数据的纯理论研究,而与真实场景下的自然口语对话系统的使用紧密相关。所要解决的口语理解稳健性、统计对话管理冷启动和认知边界扩展,是目前影响对话系统大规模产业化应用的核心问题,尤其是冷启动和认知边界动态扩展问题,更是在本领域此前没有被系统研究过而又非常重要的理论问题。交互系统的研究又必须要真实用户的实际交互参与,这使得本课题的理论研究与实际应用联系极为紧密。 从技术上,提出的新型“协同优化”技术路线。通过感知与认知协同优化解决稳健口语理解,通过规则与统计模型协同优化解决统计对话管理器冷启动,通过人机协同优化解决认知边界的动态扩展,都是相关领域研究中的创新思路。从理论上,首次研究三代理强化学习在对话系统中的应用,这是人机协同思路实现的重要路径,在统计对话管理研究中开辟了一个新的方向。 5、 社会经济效益,存在的问题 课题是以人机口语对话为核心的大规模应用开发,在行业对接方面,实现了大量垂直信息服务资源的对接和海量物联网设备覆盖;在商业模式方面,依托物联网交互入口和海量用户覆盖的优势,实现物联网信息服务的新型商业模式。在技术水平和应用水平上都达到国际先进乃至领先水平,推动中国在人工智能时代实现跨越式赶超。通过思必驰公司转化,面向智能车载、智能家居、智能机器人、智能穿戴等物联网行业,提供人机对话操作系统,截止2018 年3 月1 日已与1000多家客户合作,累计注册智能终端突破3000万,累计终端访问近300亿次,覆盖用户量过亿,近3年带动经济效益超过15亿。 6、 历年获奖情况 序号 获奖时间 名称 1 2017 中国计算机学会2017杰出演讲者 2 2017.11 高交会优秀产品奖 3 2017.9 获评新华网十大信息化案例 4 2017.7 中国软件博览会金提名奖 5 2017.1 Xtecher2016年度最受欢迎科技项目 6 2016.12 高工机器人金球奖“2016年度技术创新奖” 7 2016.12 国际服务机器人行业“金萝卜”核心技术奖 8 2016 “科学中国人2016 年度人物” 9 2016.06 “金萝卜”核心技术奖 10 2016.04 CITE创新产品与应用奖 11 2015.11 高交会中国人工智能优秀产品大奖 12 2015.11 中国智能语音行业杰出贡献奖 13 2015.11 2015科博会优秀产品奖 14 2015. 2015上海市IT新锐 15 2014.11 吴文俊人工智能科学技术奖
1、 课题来源与背景 随着智能手机和智能硬件的兴起,人与机器进行复杂信息交换的方式产生了颠覆性变化。传统的以键盘鼠标进行复杂信息获取的方式正在被以语音为主要通道的自然交互方式逐渐替代,口语交互成为在越来越多的自然场景下人机便捷沟通的趋势。 2、 研究目的与意义 语音交互自人工智能产生以来就一直是人工智能的核心研究领域,从语音识别开始,深度感知与认知决策为基础的人机口语对话系统更是其中最重要的方向之一。尤其近年来,移动互联网和物联网的迅猛发展更把人机语音交互系统推向了科学研究和产业应用的前沿。但是,现有产品的语音交互能力在对语音的感知和认知方面存在很大的局限性。正因为如此,人机语音交互技术也成为国内外人工智能领域的必争高地。各国的研究机构和企业都在相关领域大力投入,力图在核心技术和产业化方面的取得先发优势。我国在语音交互核心技术的研发起步较晚但一直受到一定程度的重视。但我国目前在语音技术产业化方面还明显落后,基本处于照抄国外产品的状态,还没有形成自主的产业化能力。尤其是缺乏能够为人工智能产业生态提供全链路语音交互解决方案的基础性的公共服务平台。因此非常需要建立以企业为核心的产品化平台,带动相关科研单位在核心关键技术上进行突破,并快速产业化。同时,人机语音交互平台也是推动制造、教育、健康医疗、金融、生活服务、能源、交通、商业流通、社会管理等传统产业和公共服务进行人工智能改造的核心技术,能够带动多个产业集群,深刻地改变传统产业的现状,实现人工智能对传统产业的广泛改造。 3、 主要论点与论据 本课题针对语音交互技术产业化过程中存在的关键问题进行技术突破。采用先进的理论研究思路和算法实现对深度学习加大数据思路的突破,相关算法和理论突破都基于从真实用户需求中提炼出的科学问题,提供了以语音识别为基础的全链条语音交互服务。针对复杂声学环境语音识别,开展深度学习信号处理技术和环境自适应技术研发,将麦克风阵列信号处理、鲁棒语音特征提取、先进深度学习模型应用结合起来实现高性能语音识别。针对上下文及场景感知的深度语义理解、对话决策和语言生成,采用结构化深度学习技术实现上下文相关的语义理解,采用深度强化学习框架实现统计对话管理技术,并在此基础上,针对真实场景构建垂直领域对话系统,融合任务型对话、问答、聊天等不同元素,实现综合的交互式智能信息服务。 4、 创见与创新 本课题紧紧把握人机口语对话系统面临的重大技术挑战,在研究问题、技术路线和理论方法上有如下的创见与创新: 本课题的研究问题不是基于离线数据的纯理论研究,而与真实场景下的自然口语对话系统的使用紧密相关。所要解决的口语理解稳健性、统计对话管理冷启动和认知边界扩展,是目前影响对话系统大规模产业化应用的核心问题,尤其是冷启动和认知边界动态扩展问题,更是在本领域此前没有被系统研究过而又非常重要的理论问题。交互系统的研究又必须要真实用户的实际交互参与,这使得本课题的理论研究与实际应用联系极为紧密。 从技术上,提出的新型“协同优化”技术路线。通过感知与认知协同优化解决稳健口语理解,通过规则与统计模型协同优化解决统计对话管理器冷启动,通过人机协同优化解决认知边界的动态扩展,都是相关领域研究中的创新思路。从理论上,首次研究三代理强化学习在对话系统中的应用,这是人机协同思路实现的重要路径,在统计对话管理研究中开辟了一个新的方向。 5、 社会经济效益,存在的问题 课题是以人机口语对话为核心的大规模应用开发,在行业对接方面,实现了大量垂直信息服务资源的对接和海量物联网设备覆盖;在商业模式方面,依托物联网交互入口和海量用户覆盖的优势,实现物联网信息服务的新型商业模式。在技术水平和应用水平上都达到国际先进乃至领先水平,推动中国在人工智能时代实现跨越式赶超。通过思必驰公司转化,面向智能车载、智能家居、智能机器人、智能穿戴等物联网行业,提供人机对话操作系统,截止2018 年3 月1 日已与1000多家客户合作,累计注册智能终端突破3000万,累计终端访问近300亿次,覆盖用户量过亿,近3年带动经济效益超过15亿。 6、 历年获奖情况 序号 获奖时间 名称 1 2017 中国计算机学会2017杰出演讲者 2 2017.11 高交会优秀产品奖 3 2017.9 获评新华网十大信息化案例 4 2017.7 中国软件博览会金提名奖 5 2017.1 Xtecher2016年度最受欢迎科技项目 6 2016.12 高工机器人金球奖“2016年度技术创新奖” 7 2016.12 国际服务机器人行业“金萝卜”核心技术奖 8 2016 “科学中国人2016 年度人物” 9 2016.06 “金萝卜”核心技术奖 10 2016.04 CITE创新产品与应用奖 11 2015.11 高交会中国人工智能优秀产品大奖 12 2015.11 中国智能语音行业杰出贡献奖 13 2015.11 2015科博会优秀产品奖 14 2015. 2015上海市IT新锐 15 2014.11 吴文俊人工智能科学技术奖