眼见为实 捷通华声灵云远场语音识别震撼发布

2015-11-26 14:06:05来源:威易网作者:

      灵云科技26日消息:捷通华声灵云远场语音识别技术全面升级,可获取7到8米外的语音,语音识别率仍不低于90%,从根本上改变目前市场上因各式问题导致的仅能近距离交互的方式。

灵云科技26日消息:捷通华声灵云远场语音识别技术全面升级,可获取7到8米外的语音,语音识别率仍不低于90%,从根本上改变目前市场上因各式问题导致的仅能近距离交互的方式,为智能语音技术应用于智能车载、智能家电、智能家居、机器人等灵云奠定坚实的基础,让智能硬件不再为远场语音识别的瓶颈而担忧。据悉,灵云种子已采用灵云远场语音识别技术。

灵云种子自2014年发布以来,得到了智能硬件、车载、机器人等多个领域的一致好评,特别是在机器人领域,解决了之前存在的种种人机交互困难的问题,使设备脱离了手动控制,真正让机器人实现了“能说会听、能思考、会判断”。

\

灵云远场语音识别  距离不再阻碍交流

很长一段时间以来,科大讯飞、NUANCE等语音技术公司都在努力开拓智能硬件市场,但智能硬件产品在很多场景下因语音交互体验不如人意而不能满足市场的需求,究其原因主要是受限于背景噪音、其他声音干扰、回声、混响等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,在这些问题没有解决之前,智能硬件语音交互方面将一直是一个短板。鉴于此,灵云推出远场语音识别技术,将极大推进语音识别技术在真实生活场景中的应用。

远场语音识别技术的核心有两点,一是语音前端处理:利用麦克风阵列、回声消除等技术将目标说话人的声音增强,并抑制/消除周围无用的声音(噪声+回声);二是语音识别引擎针对麦克风阵列处理后的数据进行专门优化,以使远场识别效果达到最优。

灵云远场语音识别技术,是基于多麦克风阵列的语音硬件前端方案,并利用麦克风阵列的空域滤波特性——在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,其降噪和去混响效果均为国内领先水平,并可成功实现语音唤醒;声源定位;远场识别;回声消除;语音打断等5大功能。

可以想象,基于灵云远场语音识别的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。目前的方案主要根据算法不同,可分为适用于电视机、空调、机器人等的加性麦克风阵列和适用于采访话筒、录音笔等的差分麦克风阵列。

灵云种子  智能终端交互一站式解决方案

智能硬件热炒两三年,至今未见哪个企业已经将成熟的一套方案或者说场景完整地展现出来并得到推广。总体上来说,目前很多企业设想的场景对于消费者的价值究竟是什么没有考虑清楚;外部来说,智能家居还未深入老百姓,市场还未感知到,没有爆款产品,产品形态整体传统;从内部讲,大大小小的企业都在喊着做平台,资本市场也炒的很热,但实际上参与其中的很多智能软件公司并没有一套整体的方案能拿的出手。

如果整体目前玩不转,那么先从做单品或者微场景来吸引大众眼球似乎是不错的路子,这就是智能硬件目前呈现的结果。在智能家居的部分,基本上所有推出产品的企业都在强调可以联WIFI,可以远程操控,甚至可以在一台冰箱上看视频听音乐,即所谓的娱乐化。可这些并不是真正的“智能”。目前,智能单品遇到的市场瓶颈,包括操控形式本末倒置、形式大于实际效果、存在安全性等问题。

怎么定义智能,并真正实现智能,依然为产业界,也是媒体争论的热点。越来越多的人认为,能够实现手机app控制即为智能,但是手机控制却也需要手动操作各类硬件,依然不够智能。

随着人工智能技术的应用越来越广泛,手机app控制、语音控制等多重控制方式越来越多的应用到了智能硬件上。灵云智能种子可实现通过语音识别、语音合成、自然语言理解等人工智能技术,为用户提供各种智能交互服务,用户只需要用说话的方式发布命令,就可以控制相应的系统。

例如,对着手机app说一声“我五分钟之后到家”,就会得到回复“好的,按照您的习惯,空调已经调到26度,热水器调到35度”;说一声“帮我煮杯咖啡”,咖啡机就开始工作;说一声“太热了,温度调低两度”,空调就开始调温窝在沙发上看着无聊的电视节目,说一声“我想看上周的非诚勿扰”,对应的电视台就自动搜索出来了;说一声“我要睡觉了”,空调就自动调到睡眠模式,门窗自动锁闭。用户可以通过语音来开启灯光、调整灯光的亮度、启动私人家庭影院、控制家用电器、等等,让家庭自动化的功能往前迈向了一大步。

但由于国内诸多语音厂商能力参差不齐、语义理解能力高低有别,而且语音交互仅能辨别指令及交互,仅是智能家居的一部分,并不能为家居的安防、家庭成员的辨别提供能力,因此并不能为家居提供全方位的智能服务。而国内技术厂商所推出的智能家居解决方案却往往固步在“声”的方向,无法覆盖声纹识别、人脸识别、指纹识别等生物识别能力等全套能力。

2014年,为方便智能终端厂商与集成商、开发商更好地使用灵云平台(hcicloud.com)全方位人工智能能力,捷通华声特别推出了企业级开发者专用的智能终端交互方案:灵云种子。灵云种子强化了灵云全方位人工智能平台各项人工智能技术的融合,包括灵云语音识别、语音合成、语义理解、声纹识别、人脸识别、指纹识别等全方位人工智能交互能力,并提供简单易用的开发接口,供智能家居、车载等各类智能终端进行集成调用,实现人与终端设备多种方式的自由沟通和控制。企业级开发商通过应用灵云种子,可以轻松实现智能语音交互、智能语音导航、智能语音控制、声纹解锁、手写输入、智能图像识别、安全身份认证等多种人机交互功能,满足智能家居、智能车载、智能家电、机器人及可穿戴式设备等各个行业对人工智能技术应用大量且多方位的需求。

经过与众多智能终端厂商的合作,为不断满足合作的应用需求,捷通华声“灵云种子”已经升级到2.0版,新版灵云种子新增云端和本地同时识别,并从结果中择优的功能,提高了语音识别的准确率和识别速度,优化了意图理解的几十个领域。目前,灵云种子可广泛应用在以下场景中:

语音检索:支持包括路况导航类、家居菜单智能导航类、周边服务类、生活服务类、娱乐类等多种语音检索服务;

消息提醒:人性化定制推送类别:来电提醒、短信提醒、应用提醒,并可将设置在云端;

通讯娱乐:支持短信发送,电话通讯,多媒体播放,手机操控;

健康服务:支持传感器,提供传感器数据分析,为用户提供健康图表,并结合云端服务提供定制健康指导等现有及正在研发的能力;

云平台:基于灵云平台,提供多设备数据同步,私人信息云存储,智能推荐;

这些方案类似于一个开发模版,灵云(hcicloud.com)平台将这些特定领域和场景的智能交互方案经过设计和优化后,打造出一体化的全智能人机交互解决方案——“灵云种子”。直接应用“灵云种子”配置的技术服务和内容服务,即可满足各种智能硬件的智能化需求。

在机器人方面,灵云机器人已成功应用灵云种子,全面整合捷通华声灵云平台多项人工智能技术能力,让稍显“笨拙”的物理机器人成为真正“能说会听,能写会看,能思考、会判断”,有一定分析与辨别能力的聪明、生动的智能机器人,可广泛为金融、电信、交通、教育、医疗等智能客户服务领域,也可以为教育、娱乐、家居生活等行业提供智能问答、智能聊天、智能“保姆”等服务。同时,灵云机器人具备平滑的移植性,可移植到市面上各类智能机器人硬件设备中。
据捷通华声灵云产品研发部门人员介绍,灵云种子更主要的作用是在产业中起到示范与引导作用,期望伴随灵云种子在各行各业智能硬件中的不断“生根发芽”,中国智能硬件将进入一个全新的、真智能的时代!

捷通华声灵云种子扎根智能终端  携手合作伙伴共赢

灵云平台(hcicloud.com)是捷通华声于2011年推出的首个全方位人工智能开放平台。为推动人工智能产业的广泛应用,灵云平台自推出以来一直面向产业全面开放,包括个人开发者在内的合作伙伴,都可以通过灵云平台获取智能语音、智能图像、智能语义、生物特征等技术能力。

在中国华南地区,尤其广州、深圳地区经济发达、创新力强,在智能家居、智能车载、智能家电、机器人、穿戴式设备研发与创新上拥有独特优势。为了向华南地区广大合作伙伴提供更加直接的支持与帮助,捷通华声在2015年初成立了深圳捷通华声公司,旨在依托灵云平台,利用灵云平台智能语音、智能图像、语义理解等全方位人工智能技术能力和丰富完善的智能终端交互解决方案,与华南地区硬件厂商加强合作关系,发挥华南地区智能终端设备研发和生产的优势,期望伴随灵云种子在各行各业智能硬件中的不断“生根发芽”,以推动智能终端产业长足的进步,携手智能硬件厂商互惠共赢,推动中国智能硬件进入一个全新的、真智能的时代!

未来发展,伴随人工智能产业在世界范围内的高速发展,捷通华声与清华大学共同创建清华灵云人工智能研究中心、清华海峡研究院人工智能研究中心,捷通华声将以清华大学人工智能研究力量为依托,更加专注人工智能技术研究与产业化的推广与应用,与合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中国人工智能产业的发展进步,为中国人工智能产业的发展做出应有的贡献!
 

关键词:捷通华声

赞助商链接: