广州鲜花销售联盟

科大讯飞王士进:面向自然语音交互的五大痛点与解决方案

楼主:海棠发布 时间:2019-12-13 06:10:03

霍尔开关传感器

共同把脉智能+驱动,洞悉资本市场新规则。12月8日,由九宇资本、智东西、犀牛之星、极果、六合咨询共同主办的“2016智能+未来峰会”在北京北京JW万豪酒店揭开大幕。在这场近六百人的行业盛会上,来自投资界、创业圈和产业链各方40余位大佬登台演讲交锋,围绕“新经济、新智能、新三板”主题,探讨产业变革中的投资机会、人工智能时代下的新消费模式、汽车的智能化未来等,带来最前沿的实践、思考和判断。

在下午的演讲环节中,科大讯飞研究院副院长王士进发表了名为“智能人机交互与万物互联产业浪潮”的主题演讲,详细解读了语音智能技术如何在具体场景中达到自然的人机交互。

以下为王士进演讲的要点精摘:

1.在万物互联浪潮下,人机交互需要希望提供更智能的方案来完成交互工作。早期PC时代,键盘鼠标交互;中期移动互联网时代,多点触控,手写、手势交互,比原来爽很多;现在万物互联,我们进入智能生活方式,使用语音视觉再加上手势控制。以前我们是以机器为中心进行交互,未来会以人为中心进行交互。万物互联浪潮下,人根据语音的控制,根据视觉的控制,然后配合手的操作,完成整个的交互。

2.今天在很多场景里,人们都需要智能语音交互;然而现有很多产品存在问题:

讲话要静,这是大家原来用手机很大的习惯,实际上大家知道在语音举例远的时候,会有混响和噪声很多情况干扰,所以原来有一款,最早做语音识别我们做的非常好的时候,只要距离到了一米两米,甚至更远距离的时候效果马上会下降,所以现在的设备,你看有一些产品演示的时候要保持一定的距离,否则效果不太好。

发音要标准,其实我们大部分人普通话相对来说比较标准,有一些人通过后台分析的时候,发现有一些人其实普通话并不是很标准,甚至有一些人,基本上已经听不出普通话了,怎么样让大家都能够享受到这种人机,特别语音交互带来的交互的操作,其实也是一个问题。

环境要安静,也是一样的道理,我们在语音整个的操作的里面,最难的就是噪声,大家知道只要有噪声很多原来语音识别性能很好的,或者语音交互操作很好的,都会变的很难。

不能持续对话,无法对历史与上下文进行支持与识别。所谓的智能我们是希望机器人可以有更多的一些上下文的知识,更多基于人的一些历史上的信息,所以目前来说,可能很多的这种产品还达不到这样的需求。

朋友 图片 表情 草稿箱
请遵守社区公约言论规则,不得违反国家法律法规