2014年,亚马逊点燃了战火,并证明了语音服务的价值,从此,智能音箱江湖风起云涌。
前不久Google推出的AIY Voice Kit着实火了,直到现在为止,全球还处于缺货状态。能如此火爆当然离不开两个因素:一是智能家居系的产品初具规模,而AI音箱确实从前些时候摸索的阶段到成为目前具有非常代表性的家居中枢声控解决方案;二则是Google的AIY Voicle Kit确实便宜,配合目前开源界最火的树莓派,凡是想玩玩AI音箱的应该都会去尝试捣鼓一番,不抢疯了才怪。
当然,AIY Voice Kit虽然在做到价格优势的同时也基本实现了AI音箱的功能,但是就实际体验而言,整体效果就有点差强人意。尤其在语音前段方面,也就是麦克风采集电路,仅是简单的由两个麦克风组成阵列,在距离稍远的地方(远场),声音识别率表现的极为低下,而作为一个AI音箱设备,麦克风的远场采集是必须的。不久前爱板网拿到了Seeed推出的一款麦克风阵列开发板,在使用不就之后,我已经抛弃了Google AIY Voicle Kit,坚定认为Respeaker Mic Array v2.0与树莓派的组合完全可以构建高端的AI音箱解决方案。
Respeaker Mic Array v2.0
Respeaker Mic Array v2.0是Seeed的第二款麦克阵列方案,从尾部的版本号也能说明情况。
v2.0版本相较于v1.0版本最大的改变是板载MCU以及麦克风数量的变化:
- MCU从v1.0版本的XVSM-2000升级到XMOS 的 XVF-3000;
- 而麦克风数量则从7个减少为4个。
这么一看,虽然MCU升级了,但是麦克风数量减少了,那到底声音拾取效果如何呢?没有v1.0版本作为对比,所以只能在之后的体验中看v2.0版本本身的表现到底如何了。
从Respeaker Mic Array v2.0的设计上来看,还是非常下血本的,板载额外搭载了12个RGB LED,可用于调光和声音定向。
整个板子的规格参数参考下表:
Respeaker Mic Array v2.0正面板载的资源如下:
背面则是兼容Seeed另一款产品Respeaker Core的扩展排针接口。
扩展排针接口的定义如下,其实主要是USB信号、音频信号、电源以及LED控制信号。
XMOS XFV-3000
Respeaker Mic Array v2.0搭载的MCU是XMOS的XFV-3000,之前了解XMOS主要还是因为USB声卡的方案,在这方面XMOS做的很不错,全球有不少用户,特别是在用USB接口把麦克风数据输给后端处理方面很有优势,同步和时延方面可以说是业界顶尖的。
在AI音箱爆发之前,很少需要多麦克阵列组成的语音采集方案,所以说,XMOS也可以说是业界最早推出麦克风阵列的厂商之一,之前就推出过XVSM-2000带消噪算法的方案,也就是Seeed Respeaker Mic Array v1.0版本采用的方案,如今v2.0版本的XFV-3000方案到底又会怎样?
音频Codec WM8960G
欧胜WM8960G是一款侧重于低功耗的立体声编码解码器,集成了D类扬声器驱动,可为每个通道提供1W,总计8W 的负载;另外片上同样集成了耳机驱动,16欧姆负载、3.3V供电时输出功率为40mW,非常适合便携式数字音频设计。
WM8960G在板子中承担的作用主要还是信号转换。
在Respeaker Mic Array v2.0板子上,留有的耳机接口和MicroUSB接口是组成AI音箱的重要接口,耳机接口可以接音箱,这可比一般AI音箱上的扬声器要强多了;其中MicroUSB接口除了供电功能支持,支持 USB Audio Class 1.0 (UAC 1.0),支持所有主流的操作系统,如 Windows,MacOS,Linux,因此它可以当做USB声卡使用,但它具有语音算法,支持对麦克风阵列的控制。
Respeaker Mic Array v2.0板子上采用的数字麦克风型号为MP34DT01-M,是一款超小型,低功耗,全方位的数字 MEMS 麦克风,内置电容式感应元件和 IC 接口。
另一个比较有意思的地方如下图所示,在PCB上没黑油覆盖的地方标注了1,2,还有在背面标有3,4。刚开始没明白过来,仔细观察了下,好吧,这其实是PCB层数。这点算比较意外的,至少之前在我接触过的开发板中从没有在PCB板上明显标注PCB层数的,可能是Seeed想通过这种方式体现这个数字麦克风阵列方案的优势吧,简单PCB布线,但也仅要4层板。
上电使用
Respeaker Mic Array v2.0可以在Windows,MacOS,Linux下运行,其中window下需要安装Libusb-win32 驱动程序,而MacOS和Linux下是不需要安装驱动程序的,这个驱动程序主要是用于控制LED。
Windows下推荐使用Zadig工具(下载地址),可以方便的为Seed DFU和Seeed Control 安装libusb-win32驱动。
可以在设备管理器中查看驱动安装情况。
不过Windows下不适合开发,想开发还是在Linux环境下。我是通过与树莓派3B的组合实现Respeaker Mic Array v2.0板子的控制。
在树莓派的raspbian系统下,可以通过命令获取麦克阵列的一些控制例程的参数设置。
sudo apt-get update
sudo pip install pyusb click
git clone https://github.com/respeaker/usb_4_mic_array.git
在下载文件examples目录下有几个LED控制的案例,有兴趣的可以看看。
实际演示效果如下:
而我本身也是准备将Respeaker Mic Array v2.0配合树莓派去实现一个AI音箱,然后通过Google assistant实现智能家居的控制,使用到的硬件如下:
- 树莓派3B一块
- Respeaker Mic Array v2.0
- 高端音箱一个
- 智能LED一个
- 显示器及外设配件(可有可无)
在树莓派上安装google assistant并且完成配置,官方有专门的教程,本文就不啰嗦了,同样也可以参考爱板网的Google AIY Voice Kit的评测,按照这个教程更能快速安装google assistant。
下面是实际语音操控命令控制的视频效果,可以看到,Respeaker Mic Array v2.0优势在于通过麦克阵列和12颗RGB LED的结合实现了声源定向,声源定向后实现波束成形以及语音增强,实现了远场的语速拾取,这恰恰也是只有两个麦克的Google AIY Voice Kit不擅长的,至少目前手段还没法通过两个麦克定向,但是无论是哪种组合,由于用到google assistant,国内的环境需要科学上网的支持,可以明显感觉到命令的延迟,用国外的云服务这是没法避免的。
当然,近场的语音识别即便是google AIY Voice Kit也能比较好的实现,不过远场就不行,所以下面的视频才是重点,可以看到,我的语音很响,音箱的声音却很轻,那是因为录像设备是直接拿在手上的,这离我发出的声源比较近,而对于音箱端比较远的缘故,这恰恰也说明了麦克阵列远场采集音源的准确性以及可靠性,亲自体验过你就会发现比google AIY Voice的麦克采集强多了。
综合来看,Respeaker Mic Array v2.0的方案还算靠谱,像Google assistant的2个麦克风虽然也具有较好的降噪性能,但是在复杂环境特别是距离较远噪声较多的时候效果不好,而且可扩展的功能也不多,而以目前各家语音识别方案来看,多麦克风的性能是得到普遍认可的。
Respeaker Mic Array v2.0通过增加为数不多麦克的同时实现了语音活动检测VAD、声源定向DOA、波束成形、噪声抑制、混响抑制、声学回声消除等AI音箱所要具备的重要功能,可以说是一个综合性能、功能与价格因素的平衡解决方案,也符合想要将AI音箱做强做大的市场预期。如果对此麦克阵列板卡感兴趣的小伙伴,可以向爱板网申请试用。
小结
AI音箱已经从某几个厂商到现在全球厂商都在互相角逐的领域,然而,因为地域的限制、语言的限制、生活习惯的限制等基本上不会出现一个完美的AI音箱能让所有用户都满意,比如google home虽然依托google生态具备庞大的内容资源,可以理解人物、地点和事物,甚至还可以知道它们之间的关联,但是,它却不能像亚马逊的Alexa那样知道用户在网上的购买历史和购买习惯,也无法预测用户的购买趋势并给用户做出推荐和建议,这种专精法则拿到国内来说也是一样的。
所以靠谱的做法是,你的AI音箱标准要对应相应的人群,用难听点的话说,对于国内的用户,即便Google Home,亚马逊Alexa再强大,但也不适合我们;而能小米AI音箱、天猫精灵等国产音箱即便再烂,也适合我们用。总之一句话,国内AI音箱的未来还是在中国人自己手中。
Respeaker Mic array V2.0 AI智能语音套件
价格 ¥ 802.26
[升级版]Respeaker Mic array V2.0开发板 +Raspberry Pi 3B+ 完美结合,高端AI音箱养成记!
【RS】Raspberry Pi 3B+ 特惠专场 热门产品
去购买
推荐:2018国内工程师/创客最值得拥有开发板 Top 10排行
2014年,亚马逊点燃了战火,并证明了语音服务的价值,从此,智能音箱江湖风起云涌。
前不久Google推出的AIY Voice Kit着实火了,直到现在为止,全球还处于缺货状态。能如此火爆当然离不开两个因素:一是智能家居系的产品初具规模,而AI音箱确实从前些时候摸索的阶段到成为目前具有非常代表性的家居中枢声控解决方案;二则是Google的AIY Voicle Kit确实便宜,配合目前开源界最火的树莓派,凡是想玩玩AI音箱的应该都会去尝试捣鼓一番,不抢疯了才怪。
当然,AIY Voice Kit虽然在做到价格优势的同时也基本实现了AI音箱的功能,但是就实际体验而言,整体效果就有点差强人意。尤其在语音前段方面,也就是麦克风采集电路,仅是简单的由两个麦克风组成阵列,在距离稍远的地方(远场),声音识别率表现的极为低下,而作为一个AI音箱设备,麦克风的远场采集是必须的。不久前爱板网拿到了Seeed推出的一款麦克风阵列开发板,在使用不就之后,我已经抛弃了Google AIY Voicle Kit,坚定认为Respeaker Mic Array v2.0与树莓派的组合完全可以构建高端的AI音箱解决方案。
Respeaker Mic Array v2.0
Respeaker Mic Array v2.0是Seeed的第二款麦克阵列方案,从尾部的版本号也能说明情况。
v2.0版本相较于v1.0版本最大的改变是板载MCU以及麦克风数量的变化:
- MCU从v1.0版本的XVSM-2000升级到XMOS 的 XVF-3000;
- 而麦克风数量则从7个减少为4个。
这么一看,虽然MCU升级了,但是麦克风数量减少了,那到底声音拾取效果如何呢?没有v1.0版本作为对比,所以只能在之后的体验中看v2.0版本本身的表现到底如何了。
从Respeaker Mic Array v2.0的设计上来看,还是非常下血本的,板载额外搭载了12个RGB LED,可用于调光和声音定向。
整个板子的规格参数参考下表: