硅音频电路的发展与应用

摘要:简要介绍硅音频系统所采用的压缩格式、记录媒体和版权保护技术。

  1 前言

  硅音频系统是指以半导体存储器作为记录媒体的录音/重放系统。目前,以mp3播放机为代表的硅音频播放机(有时亦被称作“存储器播放机”更新很快,不断面市的新产品令人目不暇接。不过,就硅音频播放机而言,它们所采用的压缩格式、记录媒体和版权保护系统各不相同,本文将对此做概要介绍。

  2 压缩格式

  现今,硅音频所采用的压缩格式基本上有mp3、twinvq、atrac3、aac和wma等5种,它们的共同特点就是充分利用了人耳的听觉特性,将那些人耳察觉不到的声音予以消除。

  2.1 mp3

  mp3是mpeg-1audiolayer3的缩写。mpeg作为动画和声音的数字化处理格式,目前已完成标准化的有mpeg-1(1993年)、mpeg-2(1994年)和mpeg-4(1999年),正在策划制定的还有mpeg-7和mpeg-21。

  动画格式为mpegvideo,声音格式为mpegaudio。其中mpegaudio根据比特率的不同分为三层,第一层的比特率为32kbps~448kbps(用于md);第二层的比特率为32kbps~384kbps(用于卫星广播和vcd);第三层的比特率为32kbps~320kbps(用于卫星通信和因特网)。32kbps、64kbps、96kbps和128kbps能够分别提供“优于am无线电广播的音质”、“优于fm无线电广播的音质”、“接近cd的音质”和“与cd不相上下的音质”。

  mpegaudio利用“绝对可听阈值”和“掩蔽效应”这两种人耳听觉特性对声音进行压缩。绝对可听阈值是指在无声状态下人耳能够辨别的声压大小(单位为db),它因频率的不同而不同。声压低于绝对可听阈值的声音即便被消除了人耳也不会察觉,因此,mpeg标准中将这种声音忽略掉。掩蔽效应是指在声压较高的频率附近声压较低的频率不易被察觉的现象。将其他频率的声音予以消除的声音被称为“掩蔽音”,被消除的声音称为“被掩蔽音”。另外,受掩蔽音影响的频带被称为“临界频带”,掩蔽音的声压即便进一步提高也不会影响临界频带以外的声音。

  第三层还利用了一种所谓“瞬态掩蔽效应”(temporalmaskingeffect)的感知特性,即位于声压较高的声音前后的声压较低的声音是不容易被感知的,通过消除这些声音能够提高压缩率。

  由于mpeg标准得到了非常广泛的应用,从而推动了mp3格式的普及。windows中作为标准添加的图像·声音再生用应用程序windowsmediaplayer以及apple公司的图像·声音再生技术quicktime均支持mp3。在pc界,mp3已经成为一种默认标准。

  因为普及较早的缘故,mp3播放机没有版权保护功能。而且,即便现在开发出能够在mp3上实现的版权保护功能,也不大可能把它安装到已在使用的众多mp3播放机上。因此,用户能够不经著作权人的许可随意将cd上的数据变换成mp3格式并上载到web站点上进行发布。于是,一段时间以来有关mp3的侵权争论异常激烈,各种官司也层出不穷。

  2.2 twinvq

  twinvq(transformdomainweightedinterleavevectorquantization)是由原日本ntt人机接口研究所(现ntt电脑空间研究所)开发的,压缩率比mp3更高(mp3编码后的文件大小是原先的1/11左右,而twinvq则为1/18左右)。twinvq不是直接对原始音乐数据进行压缩,而是对多个数据进行图形化处理,并与事先准备的图形进行比较,选择最接近的图形并将标准图形的编号作为压缩代码。但这样做的缺点是编码处理的复杂化,使得处理时间比mp3长。在使用pentiumⅱ266mhzcpu时,22.05khz取样频率(双声道场合的数值,单声道场合的数值为44.1khz)是实时处理的极限;若是解码,则在使用pentium90mhzcpu时,能够实时处理取样频率为22.05khz(立体声场合的数值,单声道场合时为44.1khz)的数据。另外,由于它没有采用有可能使抗误码性能下降的技术(如自适应比特分配、可变长编码、可变比特帧等),因此比较适合于容易发生误码的无线传输。

  在版权保护功能方面,twinvq通过采用infobind排除了网络发送数据被非法复制的可能性。

  2.3 atrac3

  atrac3(adaptivetransformacousticc

  • 硅音频电路的发展与应用已关闭评论
    A+
发布日期:2019年07月02日  所属分类:参考设计