智能时代,语音识别这一密钥何时才能被激活?

 作为一个时代的代名词,人工智能备受瞩目,从世界范围内参与其中的知名公司就可窥见一斑。在80年代,以数理逻辑为核心的体制瓦解后,人工智能分化出了五大独立学科。在这五大学科中,由深度学习推动,并顺利从科研实验室走到人们身边的智能语音,某种程度上承担了人工智能这两年的大部分热度。智能语音在2016年被美国权威杂志《麻省理工科技评论》评为当年的十大突破科技,根据易观·工信部数据,2017年中国语音产业规模就将突破百亿。

 
智能家居是在物联网的影响之下物联化体现。智能家居通过物联网技术将家中的各种设备(如音视频设备、照明系统、窗帘控制、空调控制、安防系统、数字影院系统、网络家电以及三表抄送等)连接到一起,提供家电控制、照明控制、窗帘控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境,提供全方位的信息交互功能,帮助家庭与外部保持信息交流畅通,优化人们的生活方式,帮助人们有效安排时间,增强家居生活的安全性,甚至为各种能源费用节约资金。
智能时代,语音识别这一密钥何时才能被激活?
说到智能语音就不能不提智能家居。在当下的智能家居行业,语音基于其交互的自然性,被认为是未来人与家居交互的主要入口路径,以致业内普遍认为,“以语音为入口连接各种服务,构建智家生态”。
  
作为人工智能应用最成熟的技术之一,目前语音交互的核心环节也取得重大突破,语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现一种整体的交互方案。自动语音识别(ASR)和前端语音处理的最新发展已使得语音控制相当成熟和有效。ASR引擎可以理解多种语言和口音,而语音生物辨识可用于辨识系统中预先登录的特定用户,以在智能家居环境中提供不同的权限。
  
不过,虽然大多数家居可以用语音开启导航,进行信息查询,实现一些诸如空调、开灯等功能控制,但距离“以语音为入口连接各种服务,构建智家生态”的理想仍然较远。目前的技术仍然限制在5公尺的范围内,并且难以在多人同时交谈或吵杂的环境中操作。
  
影响语音控制技术进入到智能家居或其他应用领域的原因很多,包括使用者的习惯是否被建立、是否提供更多“控制”功能以外的附加价值、是否有更“特别”的应用出现,以及安全性的问题。其中,安全性可说是消费者最为关注的部分。
  
就像著名电影《蜘蛛侠》中的那句台词:“力量越大,责任越重。”语音识别能量越大,就越需要安全阀门。首先是声纹的采集。不管是人工识别,还是依靠深度学习算法进行自动化识别,声纹库的建立都是进行一切行动的前提。当前,公安的声纹鉴别库最全,但如果是企业要想研究声纹识别,从公安处入手显然不可能,因而,企业智能自行收集声纹并建立声纹库,这是一项十分艰巨的任务。更重要的是,企业还要注意如何保障声纹不被非法利用。
 
其次,我们都听说过“无用输入,无用输出”的说法,但你想过这句话同样适用于负责业务的语音识别吗?企业是否有建立污染数据安全策略(它能确保攻击者不会利用篡改过的数据欺骗人工智能并让它推荐错误的决策)吗?如果设备根据错误的数据做出了错误的决策,那么,企业需要多长时间才能发现?数据污染已经是网络安全世界中的一个关注点。例如,反恶意软件根据多重来源提交的标记和样本进行工作,而反恶意软件供应商必须保持警惕,防止攻击者愚弄这一系统。
  
尽管如此,与其他生物特征相比,声纹识别的应用仍然具有特殊优势,比如声纹提取可在不知不觉中完成,因此使用者的接受程度也相对较高目前,声纹识别在全球市场中的占有率达到15.8%,仅次于指纹和掌纹识别,并呈现出不断上升的趋势,因此,我们有理由相信,声纹识别或将成为语音交互的下一个风口。
  
结语:在今天这个快节奏的社会中,语音识别技术的诞生,可以说是一次伟大的技术变革。随着高质量数据的不断积累、技术的不断突破及硬件平台算力的提升,语音识别正在向我们期待的方向快速发展。

  • 智能时代,语音识别这一密钥何时才能被激活?已关闭评论
    A+
发布日期:2019年03月03日  所属分类:消费电子