[01661843]基于对象的视频细粒度可分级编码关键理论与方法研究
交易价格:
面议
所属行业:
其他电子信息
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该成果主要源自国家自然科学基金(60372071)和辽宁省高等学校优秀人才支持计划(RC-04-11)所资助的项目。 由于用户要求不同、终端能力不同、异构网络的不同支路所能提供的QoS不同或网络传输条件的变化(比如噪声、拥塞等)等原因,产生了视频的网上渐进传输和多质量服务等应用需求。可分级编码(Scalable Coding)是解决此类问题的最好方法,目前仍是多媒体信息传输的热点和难点问题,特别对基于对象的视频可分级编码,至今未得到很好解决。对该问题的研究既具有重要的理论意义,又为实际应用所急需。 该成果包括四项主要技术: ⑴形状自适应提升小波变换方案:采用奇对称双正交小波基、奇对称边界延拓方式和局部位置下采样原则,提出了形状自适应的整数小波变换方案(LS-SA-DWT)。 ⑵VOP的帧内编码:根据帧内VOP变换系数的幅值动态变化范围小的分布特性,提出了基于奇数平方阈值和二分法量化方案的编码方法。在相同码率下,该方法的重构VOP较之传统EZW提高了0.5~2dB。 ⑶VOP的帧间编码:针对预测帧差的变换系数的能量分布特点,采用最小二乘法逼近率失真曲线,提出了基于双重量化和位平面的帧差图像编码方法。在同样码率下,用该方法重构的VOP帧差,其PSNR较SPIHT平均高出0.3dB,并且能获得更高的主观质量。 ⑷任意形状视频对象的小波域运动估计:基于过完备小波的思想,提出了改进的低频子带平移方法以克服小波的移变性。分层的预测结构,满足了视频可分级编码的要求。二值alpha平面的边界掩码技术和新的匹配衡量准则,进一步加快运动估计速度。利用该算法补偿得到的预测帧,其PSNR较之基于下层LL子带的分层运动估计方法和子带直接运动估计方法平均要高出0.5~3dB,并且算法的时空复杂度是LBS方法复杂度的30%~40%。 该成果的创新点主要包括: ⑴视频对象的形状自适应提升小波变换方案。 ⑵基于LS-SA-DWT变换域的视频对象运动估计/补偿理论和方法。该方法由两个灵活的框架组成,既适用于矩形的和任意形状的视频对象的运动估计,又能满足细粒度视频可分级编码的需求。 ⑶基于上述两种方案的帧内VOP和预测帧差VOP的编码策略。 该成果性能稳定,可广泛用于诸如视频会议、视频点播、多媒体数据库浏览等视频渐进传输和多质量服务的应用中,具有非常好的应用前景。
该成果主要源自国家自然科学基金(60372071)和辽宁省高等学校优秀人才支持计划(RC-04-11)所资助的项目。 由于用户要求不同、终端能力不同、异构网络的不同支路所能提供的QoS不同或网络传输条件的变化(比如噪声、拥塞等)等原因,产生了视频的网上渐进传输和多质量服务等应用需求。可分级编码(Scalable Coding)是解决此类问题的最好方法,目前仍是多媒体信息传输的热点和难点问题,特别对基于对象的视频可分级编码,至今未得到很好解决。对该问题的研究既具有重要的理论意义,又为实际应用所急需。 该成果包括四项主要技术: ⑴形状自适应提升小波变换方案:采用奇对称双正交小波基、奇对称边界延拓方式和局部位置下采样原则,提出了形状自适应的整数小波变换方案(LS-SA-DWT)。 ⑵VOP的帧内编码:根据帧内VOP变换系数的幅值动态变化范围小的分布特性,提出了基于奇数平方阈值和二分法量化方案的编码方法。在相同码率下,该方法的重构VOP较之传统EZW提高了0.5~2dB。 ⑶VOP的帧间编码:针对预测帧差的变换系数的能量分布特点,采用最小二乘法逼近率失真曲线,提出了基于双重量化和位平面的帧差图像编码方法。在同样码率下,用该方法重构的VOP帧差,其PSNR较SPIHT平均高出0.3dB,并且能获得更高的主观质量。 ⑷任意形状视频对象的小波域运动估计:基于过完备小波的思想,提出了改进的低频子带平移方法以克服小波的移变性。分层的预测结构,满足了视频可分级编码的要求。二值alpha平面的边界掩码技术和新的匹配衡量准则,进一步加快运动估计速度。利用该算法补偿得到的预测帧,其PSNR较之基于下层LL子带的分层运动估计方法和子带直接运动估计方法平均要高出0.5~3dB,并且算法的时空复杂度是LBS方法复杂度的30%~40%。 该成果的创新点主要包括: ⑴视频对象的形状自适应提升小波变换方案。 ⑵基于LS-SA-DWT变换域的视频对象运动估计/补偿理论和方法。该方法由两个灵活的框架组成,既适用于矩形的和任意形状的视频对象的运动估计,又能满足细粒度视频可分级编码的需求。 ⑶基于上述两种方案的帧内VOP和预测帧差VOP的编码策略。 该成果性能稳定,可广泛用于诸如视频会议、视频点播、多媒体数据库浏览等视频渐进传输和多质量服务的应用中,具有非常好的应用前景。