人们谈论语音识别时,经常混淆三种不同的功能,即听写功能(手机转换语音到文本),命令功能(让您通过谈话实现对手机的操作)和互联网信息搜索。这三种功能在 iphone 和 android 手机的表现不尽相同。
听写功能在这两个系统上的表现都堪称可怜,你常常会听到人们对着他们的手机大吼“我放弃!”。 android 手机和 iphone 的 siri 语音功能都会发生许多转录错误。但在考虑到说话的人的口音、说话时与麦克风的距离以及环境中的噪音影响这些因素后,错误的产生就显得情有可原了。最新的 android 版本并不需要网络连接来实现基本听写。并且当你说话的同时文本便会逐一显现在 android 屏幕上,而 siri 则是待语音完毕后转录出相应文字。另一方面,siri 能听懂“大写”、“全部大写”、“没有空格”,以及各种标点符号的语音 - “冒号”、“破折号”、“星号”、“省略号”等。 android 能听懂的只有基本的符号,如“句号”、“逗号”和“惊叹号”。
手机语音操作命令则更为成熟。这是当你说:“打电话给妈妈”,“给 emily 发短信”, “7:30 叫醒我”,“播放 billy joel 的歌”,“提醒我回家时喂猫”等等。在不触摸你的手机的情况下对其进行操作对安全性来说是非常重要的。说话的命令方式显然比触碰来得高级且安全。从便利程度来讲,说话肯定比在一屏幕的图标中寻找并打开“愤怒的小鸟”来得速度要快;说出“我的闹钟定为 8 时”比在闹钟程序中设置要快上许多。而 siri 在手机语音命令方面更为前沿。当你在驾车时听到传入消息的声音,可以说,“查看我的新的消息”,siri 便可大声读取并甚至听写你的答复,全程不需要你的眼睛偏离道路。 android 暂时无法做到这一点。两个系统都可以命令自带的应用程序完成以下动作,如“周四中午与 bob barnet 开会”(日历),“记得还钱给 harold”(笔记),“发送电子邮件给 danny cooper”(电子邮件)以及“steve alper 的住址是什么?”(联系人)。
android 在网络搜索方面则完胜 ios,这多少归功于 google 强大而迅速的搜索。两种手机都能很好地获取天气更新(“周末底特律的天气怎样?”),时间(“比利时现在几点?”),股票价格,体育信息(“下场牛仔比赛是什么时候?”),转换(“32 欧元兑多少美元?”),计算(“还有几天是情人节?”)以及各类网络搜索查询(“一块 hershey 巧克力有多少卡路里?”,“下一次日食是什么时候?”,“怎么拼写 schadenfreude?”,“1985 年雪佛莱的图片”,等等)。
android 特别惊人的是语音拨号(“呼叫 34 街的 macy's 百货”)和查询方向(“去拉瓜迪亚机场的公共交通”),因为它的地图应用程序为此打下了坚实的基础。同时 android 面对一个接一个的连串发问也更聪明。如果你的第一个问题是,“谁是希拉里•克林顿?”,你可以跟进问,“她的丈夫是谁?”
google 有一个内置的类似 shazam 的音乐识别功能。点击语音识别图标,让手机听任何正在播放的歌曲,即可识别歌曲和歌手。
android 有一个致命的弱点:要发出语音命令,你必须在 google 搜索栏点击麦克风图标,且只有在主屏幕上或 google now 屏幕上(从底部向上轻扫)。所以,你无法在手机被锁定或正在使用另一个应用程序时发出命令,除了例如摩托罗拉的 moto x 这样的新产品可以在任何时间进行侦听。而在 iphone 上,按住 home 按钮或你的耳机绳上的按键,即便在手机休眠和使用其它应用程序是也可实现语音指令功能。
siri 在餐厅和电影方面应用更全面。两款手机都能听懂 “附近好一点的印度餐馆”或“呼叫在 daleford 路上的 olive garden。”但 siri 由于整合了 opentable.com 可以帮你预订,例如 “预约星期六晚上 7 点不那么贵的意大利餐厅。”同样,siri 提供电影类的更加综合的答案,“这周有什么新电影上映”,“《the way, way back》的影评如何”,或“今天《蓝精灵 2》的放映时间是什么”。android 相比只是显示 google 的搜索结果。
就是产品个性的问题:siri 很有个性,android 则冷冰冰的。我是指关于互动中的俏皮话、笑话、态度及称呼。如果你问 siri:“谁是你爸爸?”,她会回答:“你是。我们能回去工作了吗?”问“请把我发射上太空 siri”,她答“请脱掉你的腰带、鞋子和外套,掏空你的口袋。”问“对我说脏话”,她答“腐殖质。堆肥。浮石。淤泥。砾石。”
在苹果和 google 的粉丝大战中,幽默可没有立足之地。当你夸赞 siri 的个性,苹果的仇敌会这样反应:“也就是个登不了大堂的没用把戏!你听上去蠢极了好么,我只是忍住没说而已。”于是,你得被逼着在两个不同的哲学阵营中做出选择。 (虽然有 windows phone 和黑莓,但他们的语音识别比较初级。)粉丝们何不各自放下手中的剑,花点时间研究一下这两个系统呢。(这里是一个很好的 android 的语音命令列表:http://j.mp/12kefdo 这个是 siri 的:http://j.mp/16yy4yy)
siri 有自身的优势, 但差距已经大幅缩减,两个系统都在迅速提高。android 近期才添加了手机控制功能,之前只有网络搜索。今年秋季即将更新的 ios 7 会使 siri 获得更舒服的说话声音,更快的搜索和通过语音改变手机设置(“打开飞行模式”, “调高亮度”,“打开蓝牙”)的能力 。
可以明确的是:手机语音识别完善得越来越快。 也许不久,我们将不是将通过手机沟通,而是更多的和手机沟通。
手机的语音识别技术的优越性可不是个无聊的问题。如今触摸屏手机的大势已不可阻挡,而语音识别也因此变得极为重要。没有物理按键或按钮,输入文本和软件控制有时相当繁琐复杂。所以我决定花两个星期沉浸在语音识别的世界中:在所到之处携带 iphone 和运行 android 操作系统的手机,与这两款手机同时对话。由此来认识它们的不同,它们的优势和弱点。http://yhx01.51dzw.com











