摘要:tms320c6201是美国ti公司生产的一种高性能数字信号处理器。本文介绍如何利用1片tms320c6201数字信号处理器实现mpeg-4 svp视频解码,并讨论***的结构,算法、存储器分配以及程序的优化等问题,最后给出该***总体特性表。
关键词:tms320c6201 视频压缩 mpeg-4 vop mb idct 运动补偿
引言
随着网络和多媒体技术的发展,视觉通信的重要性和需求急剧增加,如桌面视频会议、移动终端、基于因特网的视音频通信等。随之而来的是视频压缩技术的迅速发展和视频压缩标准的不断推出。国际运动图像编码专家组(mpeg)先后推出了mpeg-1、mpeg-2和mpeg-4.mpeg-4是由国际运动图像专家组于1998年11月制定的。它是一个面向多媒体应用的压缩标准,其应用覆盖范围远大于mpeg-1和mpeg-2等标准。从移动可视电话到专业视频编辑,既支持自然图像,也支持计算机合成图像。最重要的是它支持交互功能。这是由于mpeg-4采用了与其它标准不同的、基于对象的图像描述方式。目前,国内有关mpeg-4应用技术的研究及开发的工作正在悄然兴起。笔者在研究了mpeg-4视频标准之后,充分利用tms320c6201的硬件资源和软件优化,实时实现了嵌入式mpeg-4视频***。
1 mpeg-4视频码流及主要算法
mpeg-4采用了基于对象的压缩编码技术。在编码前,首先要对视频序列进行分析,从原理图像中分割出各个视频对象,然后南分别对每个视频对象单独编码。每个对象都有自己的形状信息(shape)、运动信息(motion)、纹理信息(texture)。对视频对象的编码就是对这3种信息进行编码。mpeg-4通过运动预测和运行补偿来去除连续帧之间的时间冗余。运动预测与运动补偿的精度可以为整像素、半像素或1/4像素,另外还增了重叠运动补偿方式。与形状相关算法有:基于邻近信息的算术编码、水平和垂直填补、扩张填补等。与纹理编码相关的算法有:离散余弦变换(dct)、量化、dct系数的dc/ac差分预测、zig-zag扫描、游程编码、霍夫曼变长编码等。
笔者实现的是mpeg-4的svp(simple visual profile)视频解码。视频序列全部为矩形,所以不存在任意形状编码。视频序列按照视频对象层vol(video object layer)、视频对象平台vop(video object plane)、宏块mb(macro block)视顺序编成一串码流。1个vol中包含多个vop,1个vop中包含多个mb。mb是码流中的基本单位。mb又分为帧内mb(intramb)、帧间mb(imtermb)。帧间4vmb(inter4vmb)等几种。在i-vop中,所有的宏块都是intramb。p-vop中宏块有多种可能,可以是intramb、intermb或inter4vmb。p-vop中的intermb或inter4vmb的码流描述如下:
mb码流=mb形状+mb头信息+mv+dct纹理信息(y1+y2+y3+y4+u+v)
由于是矩形帧,所以无形状编码mb shape部分。
mb头信息中主要包括4个参数:not_coded(本mb是否编码的标志位)、mcbpc(色度块u和v是否编码的标志位)、cbpy(亮度块y1~y4是否编码的标志位)、dquant(本mb中dct系数量化步长的增量值)。
mv为运动矢量,实际写入码流的是运动矢量误差值(δmv),这是因为编码中mv采用差分编码。如果mb是一个intermb,则表示本mb只有1个运动矢量,所以在码流中只传1个δmv;如果mb是一个inter4vmb,则表示本mb有4个运行矢量,即每个子块(block)有1个运动矢量,所以在码流中需传送4个δmv,即mvd1、mvd2、mvd3和mvd4。
最后是一连串经过量化、zig-zag扫描、游程编码和霍夫曼变长编码的dct系数,按照y1、y2、y3、y4、u和v的先后顺序编码。
2 tms320c6201 dsp及evm板介绍
2.1 tms320c6201 dsp
tms320c6201是美国ti公司的c6000系列新一代数字信号处理器中的第1个产品,于1997年3月发布。它是一个32bit的定点dsp芯片。该芯片具有8个相互独立的功能单元,可以工作在200mhz的cpu时钟频率,全速运行时可达到1600 mips。其主要特性包括:
*芯片内核采用velociti tm先进的超长指令字(vliw)结构,具有高度的并行性和快速的运行能力,每个时钟周期最多可同时执行8条32位指令,并且所有的指令都可以有条件执行;
*具有丰富的指令系统且可对字节操作,支持16位的乘法运算;
*有4个彼此独立的快速的dma通道,可以进行多种形式的数据传输。
*片内数据存储区和程序存储区各64kb,并支持多种数据宽度8位/16位/32位;32位的外部存储器接口,提供与片外sdram、sdsram和sram的直接接口。
tms320c6201的以上特点,能满足视频图像处理的实时性要求。例如:tms320c6201 dsp计算1块8×8 idct(逆变散余弦变换)仅用(168+62)个时钟周期,为1.15μs。
2.2 evm板
tms320c6201 evm板是一块带有pci接口的插卡,除了可以插在计算机主板的pci插槽上使用外,还可以外配电源作为独立的模块工作,并通过xds510仿真器进行调试。该板上配有1片tms320c6201 dsp,最高工作在160mhz。
evm板上提供的片外存储器包括1组64kbit×32(256kb)、133mhz的sbsram,