数字视频的大数据量给信息的存储和传输造成了相当大的困难,成为数字视频应用的瓶颈之一,数字视频压缩编码是解决这一问题的有效途径,但在一些对实时性要求较高的场合,要求快速实现数字视频的编解码。采用DSP器件集成的视频采集压缩卡能快速实现视频压缩算法,提高处理速度,满足实时性要求。
本文采用Blackfin系列的DSP芯片ADSP-21535来实现MPEG-4视频编解码,详细介绍了硬件和软件的设计方案。
硬件设计
整个系统包括视频采集单元、MPEG-4编解码单元、数据存储单元、逻辑控制单元和视频显示单元等。采用conexant公司的Bt829实现视频信号采集,数据存储采用Cypress公司的SRAM芯片CY7C104133,视频显示单元采用ADI公司的ADV7175,逻辑控制部分采用Altera公司的MAX7000芯片。
软件设计
MPEG-4视频编码是根据图像的内容将其分割成不同的视频对象VO(Video Object),然后进行编码。其编码过程可由3步来完成,即VO的形成、编码和复合。它提供了灵活的框架和开放的工具集。
基于VOP(VIDEO Object Plane)的编码,VO是场景中的某个物体,是由时间上连续的帧画面序列组成的,而VOP是某一时刻某一帧画面的VO,VOP编码是针对某一时刻该帧画面VO的形状、运动、纹理等三类信息进行编码。从类型上看包括帧内IVOP(Intra VOP)、帧间前向因果预测PVOP(Inter Prediction VOP)、帧间双向非因果预测BVOP(Inter Biderctional Prediction VOP)和全息灵影SVOP(Sprite VOP)。从空间上看它由若干个16×16的宏块组成,又可分成4个8×8的亮度块和2个8×8的色差块。它采用位图法对VOP的形状进行编码。
在本文设计的编解码器中,对于352×288的VOP图像数据编码采用Y:U:V=4:2:0的格式,即每采样4个亮度样本,对应采样两个色差样本。然后,分离不同的帧格式,分别对它们进行编码和解码。
基于ADSP-21535的MPEG-4编码优化
ADSP-21535采用双MAC的结构,具有正交的类似RISC的微处理器集,主频可达300MHz,有专门的视频处理指令、灵活的SRAM和cache结构,是一款在多媒体处理与网络传输应用中极具特色的芯片。因此,在编码的过程中,应充分考虑芯片的结构和指令特点,实现程序的优化。
使用硬件结构提高处理速度
ADSP-21535内部有两块RAM,即L1RAM和L2RAM。L1RAM是核内的高速RAM,可以按照需要定义为cache或SRAM,或者一部分数据cache,一部分数据SRAM。它可分成16KB指令cache和指令SRAM,也可分成32KB数据cache和数据RAM。相对来说L2RAM离核较远,如果程序或数据放在L2RAM中直接执行,速度会比较慢。因此如果程序的数据量较小,可以把程序和数据直接放入L1RAM中执行。但是对于数据量较大的程序来说,有时还有可能把数据放在外部存储器中,如视频采集数据,这时就应该设置好cache允许的数据地址和程序地址,然后启动cache,这样程序和数据就会自动调入L1RAM中执行。
运动估值搜索算法的并行处理
视频压缩的关键是去除时间与空间的冗余,考虑到帧间的时间相关性强的特点,为了满足随机存储和高压缩比的要求,一般采用帧间和帧内的编码技术。在MPEG-4运动搜索算法中是使用条块匹配算法,需要进行VOP范围内点的搜索。匹配使当前的图像与预测图像的绝对差值和,即SAD最小。
SAD的计算是运动估值中最重要的一个环节,它直接影响整个运动搜索的速度,这也是图像数据实时压缩的瓶颈。Blackfin提供了一个极好的硬件指令,可以取出8个单元数据同时做4组VIDEO单元的绝对差和。ADSP-21535提供了两种指令形式来完成这个操作,即SAA(R1:0)和SAA(R1:0,R3:2)(R代表寄存器组高低寄存器互换),将结果放在A0和A1中(A0和A1为两个乘法器和累加器,R1和R0、R2和R3为配对的两个寄存器,一般称为寄存器组0和寄存器组1)。
由于作绝对差和是针对字节而言,所以起始字节地址不一定是以4的整数倍开始,但是每次运算却必须要取出4个字节作运算。对于此,Blackfin巧妙地根据地址的末两位来确定运算所取的字节。其地址指针为I0和I1,由I0和R1:0、I1和R3:2来确定运算的8个点。
用ADSP-21535计算当前块与目标宏块的SAD值的程序在此就不再赘述。
结语
整个系统使用Visual DSP++3.0进行开发,通过JTAG口仿真,在CIF格式下(352×288)进行测试。采集的帧率为25fps,对IVOP、PVOP、BVOP同时编码,平均压缩一帧需60ms左右,平均压缩比为40倍左右。从这些数据可以看出,用Blackfin实现MPEG-4编解码方案是可行的,能有效解决传输数据的瓶颈问题,提高信号的处理速度。同时该芯片的功耗小,性能稳定,可实现电源的动态管理,有利于实现视频压缩卡的集成。当然,如果能够对算法进一步优化,就更有利于视频数据的实时处理和传输。
数字视频的大数据量给信息的存储和传输造成了相当大的困难,成为数字视频应用的瓶颈之一,数字视频压缩编码是解决这一问题的有效途径,但在一些对实时性要求较高的场合,要求快速实现数字视频的编解码。采用DSP器件集成的视频采集压缩卡能快速实现视频压缩算法,提高处理速度,满足实时性要求。
本文采用Blackfin系列的DSP芯片ADSP-21535来实现MPEG-4视频编解码,详细介绍了硬件和软件的设计方案。
硬件设计
整个系统包括视频采集单元、MPEG-4编解码单元、数据存储单元、逻辑控制单元和视频显示单元等。采用conexant公司的Bt829实现视频信号采集,数据存储采用Cypress公司的SRAM芯片CY7C104133,视频显示单元采用ADI公司的ADV7175,逻辑控制部分采用Altera公司的MAX7000芯片。
软件设计
MPEG-4视频编码是根据图像的内容将其分割成不同的视频对象VO(Video Object),然后进行编码。其编码过程可由3步来完成,即VO的形成、编码和复合。它提供了灵活的框架和开放的工具集。
基于VOP(VIDEO Object Plane)的编码,VO是场景中的某个物体,是由时间上连续的帧画面序列组成的,而VOP是某一时刻某一帧画面的VO,VOP编码是针对某一时刻该帧画面VO的形状、运动、纹理等三类信息进行编码。从类型上看包括帧内IVOP(Intra VOP)、帧间前向因果预测PVOP(Inter Prediction VOP)、帧间双向非因果预测BVOP(Inter Biderctional Prediction VOP)和全息灵影SVOP(Sprite VOP)。从空间上看它由若干个16×16的宏块组成,又可分成4个8×8的亮度块和2个8×8的色差块。它采用位图法对VOP的形状进行编码。
在本文设计的编解码器中,对于352×288的VOP图像数据编码采用Y:U:V=4:2:0的格式,即每采样4个亮度样本,对应采样两个色差样本。然后,分离不同的帧格式,分别对它们进行编码和解码。
基于ADSP-21535的MPEG-4编码优化
ADSP-21535采用双MAC的结构,具有正交的类似RISC的微处理器集,主频可达300MHz,有专门的视频处理指令、灵活的SRAM和cache结构,是一款在多媒体处理与网络传输应用中极具特色的芯片。因此,在编码的过程中,应充分考虑芯片的结构和指令特点,实现程序的优化。
使用硬件结构提高处理速度
ADSP-21535内部有两块RAM,即L1RAM和L2RAM。L1RAM是核内的高速RAM,可以按照需要定义为cache或SRAM,或者一部分数据cache,一部分数据SRAM。它可分成16KB指令cache和指令SRAM,也可分成32KB数据cache和数据RAM。相对来说L2RAM离核较远,如果程序或数据放在L2RAM中直接执行,速度会比较慢。因此如果程序的数据量较小,可以把程序和数据直接放入L1RAM中执行。但是对于数据量较大的程序来说,有时还有可能把数据放在外部存储器中,如视频采集数据,这时就应该设置好cache允许的数据地址和程序地址,然后启动cache,这样程序和数据就会自动调入L1RAM中执行。
运动估值搜索算法的并行处理
视频压缩的关键是去除时间与空间的冗余,考虑到帧间的时间相关性强的特点,为了满足随机存储和高压缩比的要求,一般采用帧间和帧内的编码技术。在MPEG-4运动搜索算法中是使用条块匹配算法,需要进行VOP范围内点的搜索。匹配使当前的图像与预测图像的绝对差值和,即SAD最小。
SAD的计算是运动估值中最重要的一个环节,它直接影响整个运动搜索的速度,这也是图像数据实时压缩的瓶颈。Blackfin提供了一个极好的硬件指令,可以取出8个单元数据同时做4组VIDEO单元的绝对差和。ADSP-21535提供了两种指令形式来完成这个操作,即SAA(R1:0)和SAA(R1:0,R3:2)(R代表寄存器组高低寄存器互换),将结果放在A0和A1中(A0和A1为两个乘法器和累加器,R1和R0、R2和R3为配对的两个寄存器,一般称为寄存器组0和寄存器组1)。
由于作绝对差和是针对字节而言,所以起始字节地址不一定是以4的整数倍开始,但是每次运算却必须要取出4个字节作运算。对于此,Blackfin巧妙地根据地址的末两位来确定运算所取的字节。其地址指针为I0和I1,由I0和R1:0、I1和R3:2来确定运算的8个点。
用ADSP-21535计算当前块与目标宏块的SAD值的程序在此就不再赘述。
结语
整个系统使用Visual DSP++3.0进行开发,通过JTAG口仿真,在CIF格式下(352×288)进行测试。采集的帧率为25fps,对IVOP、PVOP、BVOP同时编码,平均压缩一帧需60ms左右,平均压缩比为40倍左右。从这些数据可以看出,用Blackfin实现MPEG-4编解码方案是可行的,能有效解决传输数据的瓶颈问题,提高信号的处理速度。同时该芯片的功耗小,性能稳定,可实现电源的动态管理,有利于实现视频压缩卡的集成。当然,如果能够对算法进一步优化,就更有利于视频数据的实时处理和传输。
举报