一种实现低成本3D视讯的解决方案

happygi8766 2012-11-05 2690

编码与解码

54人已加入

描述

　　3D双层系统将减轻营运商布建新网路的负担。新型3D双层系统同步支援讯框相容、多视点视讯编解码（MVC）技术，可让有线电视营运商先沿用既有设备收发2D/3D相容讯号，待市场成熟后再升级支援全解析度3D内容传输，节省初期网路建置成本。

　　三维（3D）从电影院快速蔓延到家庭中。业界正积极发展讯框相容（Frame Compatible）技术，把两个视角结合到一个视讯中，从而以更经济的方式为家庭用户传送3D节目。

　　讯框相容方案实现低成本3D系统

　　服务供应商可采用两种方法将3D节目送入家庭，分别为讯框相容及2D相容方法--多视点视讯编解码（MVC）。前者可使用现有网路基础设施，虽解析度将有所损失，但未来可透过增强位元，并提供新解码器弥补损失的解析度。至于后者好处则在传输过程中可包含一个2D版本，并采用增强层提供第二视角，但若要接收并解码3D内容，就须采购新设备。

　　应用讯框相容技术打造的3D系统通常称为半解析度系统，具低成本优势，可使用当前的网路基础设施或机上盒（STB）实现。主要封包方式为平行排列法（Side by Side），其图形处理更可靠，处理隔行方式比处理垂直取样系统更简单，并提供较高的视频编码效率。

　　目前3D与2D节目大多采分开制作模式，尤其是体育类型的节目，因两者技术差异相当大，且3D节目观众数量在初期相对较少，因此，同一赛事的2D和3D讯号，将如同早期高画质（HD）和标准画质（SD）内容采取同步播放的形式，以进一步提升经济效益。未来，在2D和3D制作过程中，亦可望大量使用同一种讯号采集设备，也就是继续进行2D和3D同步播放。

　　基于此设计概念，杜比实验室（Dolby Laboratories）已开发3D双层系统，使用讯框相容基本层并透过增强层过渡至全解析度影像，同时亦基于MVC架构，允许使用相同晶片组设计，从而有效实现规模经济效益。网路营运商可先使用现有网路和机上盒传输相容3D内容的讯框，之后再选择合适时机将机上盒和网路升级到全解析度（Full Resolution）。

　　透过一段真人动作和动画混合素材所做的测试，此一3D全解析度系统只需78%的MVC位元传输速率（Bit Rate）。MVC基本层相比同等的2D先进视讯编码（AVC）而言，须增加35%左右位元传输速率，而额外增强层通常比基本层再多出6%左右位元传输速率。

　　事实上，应用讯框相容方案产生的3D视讯与正常讯号十分相近，所以进行接收和转播毋须对网路做出大量变更。相较之下，2D相容系统虽能提供全解析度，但传输网路和机上盒都要进行大幅变动，原因在于现有网路无法接收和处理全频宽3D讯号，故需新的制作和处理设备。

　　最后，营运商还会考虑传输速率的影响，讯框相容讯号相比同等2D讯号，需要额外的位元传输速率（35%），MVC则需更多（78%），但可透过同样的串流方式将讯号同时传送给2D和3D收视观众。但是，两者之间制作语法不同，且2D观众远多于3D观众，所以节目制作方不太会为3D而牺牲2D制作。

　　对营运商而言，讯框相容可协助其利用既有设备，尽早进入3D市场，未来机上盒亦可同时使用支持讯框相容和MVC的晶片方案，分阶段升级至全解析度。因此，考虑3D内容市场前途未卜，相信以讯框相容为主的设计，将显著降低营运商的投资风险。

　　3D投资风险高　2D内容制作仍为主流

　　立体内容有各种来源，首先是来自电影工业，此部分主要受到3D电影在票房上取得的巨大成功所驱动。过去几年发布的3D电影总合约三十五部，但预估未来每年将发行二十到三十部3D电影，这个速度意味着每个月就可望有两到三部新的3D电影产出。

　　另一大来源则是体育赛事和音乐会，但尚难预计将有多少赛事采用3D模式转播，主要是成本较高的考量，对广播公司而言，为刚起步且只有少量受众的3D节目而牺牲2D制作肯定是不明智的。未来，3D体育赛事制作可望与高画质内容同步进行，因2D和3D内容制作技术不同，3D成本较高且收看3D节目的家庭相对较少，所以业者将选择以2D内容制作为主，满足大部分观众需求。

　　也因此，从3D内容中提取2D视讯格式的想法可能无法实现，因为要制作精良的3D节目所需的制作语法不同。尤其体育赛事内容呈现最为明显，例如足球比赛中，选用3D制作的导播通常不愿切换镜头，因可能导致立体摄影机之间产生视差不匹配的问题。

　　另一方面，3D内容供应商直接向消费者收费的模式开始成形，从而抵消昂贵的制作和发布成本。初期3D供应商通常是卫星和有线电视公司，其提供须额外付费的3D节目，或以视讯点播的形式发布；服务供应商则提供机上盒给客户，并通过每月收视费回收网路基础设施成本。

　　由于只有少数内容会使用3D技术进行制作，还须耗费很高的成本，所以供应商都寻求低成本方法产制3D内容，最好是能在几乎不耗费成本的情况下进行升级，同时还能获取额外收入。

　　3D影像呈现方法多样　水平/垂直取样各有利弊

　　事实上，有多种方法可取样立体画素并做成讯框相容影像封包。画素取样和封包方法可相同也可不同，当两者以不同方式进行时，则会出现一些不合逻辑的组合，以下将就每种方法进行讨论。

　　首先是平行排列取样，可从每行上间隔取样，创建的影像在水平方向上为半解析度；视角取样亦采用相同方式（也就是说两个视角都是偶数画素），或采用视角差别方式（即一个视角奇数画素，一个视角偶数画素）。如此一来，生成的两个影像可采用平行排列或棋盘格式（Checkerboard）封包。如图1显示为平行排列讯框封包；至于水平取样影像无法使用垂直封包方法。与此同时，若采用上下取样，影像在垂直方向则为半解析度。这样生成的两个影像可采用上/下、水平交错格式（Line Interleaved）或棋盘格式进行编码。

　　图1　平行排列取样示意图

　　另一种与上/下取样大致相同的方法为水平交错格式，以隔行取样的方式进行取样，影像在垂直方向为半解析度，当其在使用相对立的样本时最为合适（即一个视角奇数行，一个视角偶数行）（图2）。

　　图2　水平交错格式取样示意图

　　最后一种棋盘格取样法结合水平和垂直取样，每隔一行取样间隔画素（五点梅花型取样），导致对角线解析度丢失一半。由于棋盘格式较特别，因此通常会针对每个影像进行补偿取样，生成的影像可采用上/下、水平交错格式或棋盘格式进行编码。

　　由于各种取样和讯框编码方法可达成不同的影像处理效果，因此，选择合适方法时，将是各家营运商部署3D内容服务的关键。其中，棋盘格和水平交错封包技术在过滤和尺寸调整等处理技术方面有所欠缺，可能导致画素间的影响，轻则产生叠影，重则完全丧失立体效果。由于很难在视讯路径中预测或控制影像处理过程，故此两种方法对讯框封包而言都非上选；平行排列和上/下取样封包法对此类处理技术的敏感度较低。

　　另一个须考虑的问题系影像交错（Interlace Video），主要透过垂直取样进行，由于须再次取样影像，故常产生一些问题。例如一个1，080i、60画面更新率（FPS）的讯号每段拥有五百四十行，再度取样影像会将垂直解析度降低至两百七十行相当于QVGA，因而导致垂直失真，使重组垂直取样的影像变得十分困难。平行排列法较不会受到影像交错影响，而棋盘格法的表现则介于两者之间。

　　最后，编码性能系选择合适的讯框封包方法时最重要的议题。图3显示使用MPEG-4 AVC1进行编码的相对效果，平行排列和上/下取样法在不同位元传输速率下的编码效果相当；而棋盘格封包的五点梅花型取样，则需前两者一倍以上的位元传输速率才能获得相同的峰值讯噪比（PSNR）。

　　图3　平行排列、上/下与棋盘格式取样编码性能比较

　　优化3D影像表现　厂商慎选取样/封包方案

　　透过图3分析资讯，可发现平行排列封包是最好的基本层封包方法，因其在影像交错及处理方面表现十分稳定，且编码性能优异。实际上，营运商可采用不同取样和封包方式，较常见的方法是使用五点梅花型取样，而用平行排列法封包。

　　图4显示平行排列和五点梅花型取样的性能对比，两者都用平行排列方式进行封包，并列出普通2D AVC编码的数据以供参考。从图4中可看出，整合五点梅花型取样和平行排列封包的编码性能，不如平行排列取样及封包。在10Mbit/s传输速率下，平行排列取样较五点梅花型取样高出2.5dB的性能。

　　图4　五点梅花型取样加平行排列封包整合方法的效能分析

　　根据图3数据，亦可看出在编码效率方面，五点梅花型取样、平行排列封包方法较五点梅花型取样、棋盘格封包的方法更佳，但不如同时使用平行排列取样和封包。简而言之，两者结合的方法使其编码效率不上不下，造成此一中等效率的原因在于垂直和水准边缘不再保持笔直，需要更多位元才能进行编码；五点梅花型取样结合任意一种封包方式，对垂直重新取样和色彩处理较不利。须注意的是，任何讯框相容格式均比2D视讯编码效率降低，如图4所示，平行排列取样、封包与五点梅花型取样、平行排列封包的方法，相比2D AVC编码都需要较高的位元传输速率。因为将两个影像压缩至一个影像时，高频率影像能量增加所致。

　　综合讯框相容/MVC效益　3D双层系统崭露锋芒

　　
　图5　3D双层编解码系统架构图

　　图5显示一款讯框相容与MVC结合的3D双层系统解决方案，其将立体影像对转化为两幅讯框相容影像，其中一幅使用一个画素集合，另一幅则使用其补充画素集合，透过MPEG-4 AVC压缩第一幅讯框相容影像，与普通视讯影像集的方式一样；至于补充影像则用作生成增强层的基础。增强层编码器使用来自基本层编码过程的资讯进行预测，并充分利用基本层中的冗余资讯，大幅降低增强层的资讯量。

　　该方案选择的讯框相容基本层、取样方法和封包格式均采用平行排列，可选择多种预取样低通滤波器，助力广播业者在固定的内容和位元传输速率条件下，实现最佳3D影像。图6展示其建立讯框相容基本层时，进行过滤和取样操作的流程，随后在按照服务提供商标准工作流程，对平行排列封包后的视讯进行压缩和传输。

　　图6　3D双层系统基本层封包架构图

　　在传统的MPEG-2视频传输中，只有基本层可透过传统MPEG-2机上盒进行传输。对于已实现MPEG-4 AVC（H.264）的营运商而言，将应用AVC对基本层进行编码，并可同时对增强层进行编码。

　　导入解析度增强系统　3D影像升级省时省力

　　对于传统的机上盒和解码器而言，基本层十分重要。传统解码器会忽略代表增强层的压缩位数并对基本层进行解码，就像对标准2D讯号一样。基本层将以平行排列影像形式被发送至3D显示萤幕，如图7所示，由3D显示萤幕进行平行排列影像重建。

　　图7　3D系统基本层讯号重构流程图

　　在视讯压缩领域，大部分编码效率源自预测技术及进行画素重构的效益。如图8显示一项3D解析度增强机制，左右两边的影像被发送到两个3D多工器（Multiplexer）中，上方多工器生成基本层，增强系统则分为参考影像处理单元（RPU）和残余编码系统（Residual Encoding System）两大部分。

　　图8　3D双层系统增强层架构图

　　RPU使基本层与增强层关联更紧密，并降低影像间的冗余，增进编码效率；而残余编码系统则对增强层数据进行编码，提升预测增强画面的准确性（图9）。基于此一系统设计，解码后的基本影像将被用于对增强影像进行预测。

　　图9　3D双层系统增强层作业流程图

　　由于基本层和增强层平行排列影像，均源自同一原始影像，且偏差仅为一画素而已，彼此十分相似。

　　此外，基本层路径中的数据将被封包进一个平行排列结构，并使用传统的AVC编码器进行压缩。标准视频编码器中亦包含一个内部解码器反馈回路，对目标解码器的行为进行模拟，以便进行缓冲管理、影像预测和动态补偿。

　　用于基本层的AVC编码器是标准编码器，完全独立于增强层之外。这种运作方式和系统结构与MVC十分相似。所有影像参考仅针对基本层，不存在增强层的影像参考。由于整个基本层都会用于增强层的预测，因此基本层运动向量也会被再次应用于增强层，对两个视角进行精确重构。

　　在合成影像方面，MVC运动向量趋向于高度协调，从而产生较少的残余量。相较之下，由于视差、遮蔽、曝光和光照条件的差异，不同视角间的关联往往较小。

　　此将使得MVC在视角间将生成更多的残余资讯，最终便会导致实景影像的压缩效率降低。至于增强层则是高度简化的AVC编解码器，专为现有大部分MVC解码硬体而设计，使移植到特定应用积体威廉希尔官方网站（ASIC）变得更简单，只须利用已有的MVC模组和设计即可。

　　此外，亦可同时搭载MVC和讯框相容3D技术，从而发挥规模经济效益，降低晶片成本。

打开APP阅读更多精彩内容