作者简介:
陈水仙,女,2011年毕业于武汉大学计算机学院计算机应用技术专业,获博士学位。论文获湖北省优秀博士学位论文奖。现在中国科学院信息工程研究所工作。
内容简介:
飞速发展的移动市场对高品质音频业务的需求日益迫切,移动环境下音频带宽不足,终端资源有限,传统音频理论和技术面临新的挑战。近年来,MPEG、ITU和AVS等国内外标准化组织积极推动移动音频理论和技术研究。基于双耳线索的音频编码因其在低码率下的音质优势而备受关注,然而,为适应移动环境苛刻的应用需求,仍需克服空间参数模型的理论缺陷,突破实变换域双耳线索表示的技术瓶颈,解决空间参数码率难以下降、系统复杂度偏高等问题。陈水仙编著的这本《基于双耳线索的移动音频编码研究》开展基于双耳线索的移动音频编码研究,在双耳线索感知机理分析、空间感知信息度量、MDCT域双耳线索表示和空间音频编码系统结构设计这四个方向上取得了创新性成果。
在双耳线索感知机理分析方向,《武汉大学优秀博士学位论文文库:基于双耳线索的移动音频编码研究》针对现有系统只能去除声道间数据客观冗余的不足,以巴克频带为感知分析单元,开展了对双耳线索临界感知JND的分析研究,提出基于感知的双耳线索参数表示模型,有效去除了声道问数据的主观冗余信息,下降4.28%~11.78%的空间参数码率,主观测试MUSHRA得分平均提高2.6分,客观测试ODG得分平均提高1.1分。
在空间感知信息度量方向,本书针对建立在单耳听音模型上的感知熵理论无法度量双耳空间感知信息量的问题,结合双耳线索的感知机理,建立了基于双耳线索生理感知的BCPPM模型来模拟双耳对空间信息的感知过程,提出基于模型的空间感知熵SPE的计算方法,解决了双耳空间感知信息量的度量问题,丰富和发展了空间音频编码技术的理论和实践。
在MDCT域双耳线索表示方向,本书针对MDCT实变换的相位信息缺失及能量抖动造成双耳线索表示不准确的问题,采用基函数“和分离”技术,提出了基于共轭窗函数的MDCT频谱复数化扩展方法,并针对新方法引入MDST带来复杂度增加的问题,提出了基于转换矩阵稀疏性的MDCT-MDST快速转换算法,同时利用转换矩阵的正交性和循环性,将复杂度从O(N*2)下降到O(N),主观测试MUSHRA得分平均提高2.07分,客观ODG得分平均提高0.4281分。
在空间音频编码系统结构设计方向,本书针对空间信息和下混信息分离处理模式导致的系统复杂度高和延时长的问题,采用滤波复用和并行处理的技术,提出并行滤波共享的分析综合ABS编码结构,去除了空间参数编码与下混声道编码中的冗余操作,缩短了5%的系统延时,减少了38%~86%的运算复杂度。
本书在基础理论和关键技术方面的研究成果可望成为国内移动音频标准的支撑技术,增强我国在高速成长的全球移动音频产业中的核心竞争力,为全面参与移动音频编解码领域的国际竞争和标准化工作奠定坚实的研究基础。
目录:
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 冗余信息去除技术
1.2.2 感知信息度量方法
1.3 面临的关键问题
1.3.1 空间参数主观冗余难以去除
1.3.2 MDCT域空间参数分析困难
1.4 主要工作和全文组织结构
1.4.1 主要工作
1.4.2 全文组织结构
第2章 双耳线索的特征分析与表示
2.1 引言
2.2 双耳线索的特征分析实验系统
2.2.1 特征分析实验系统设计
2.2.2 双耳线索临界感知的频率依赖性
2.2.3 双耳线索的统计分布特性
2.3 编码系统中的双耳线索编码实现
2.3.1 基于频率感知的参数集选取
2.3.2 基于频率感知的参数量化和熵编码
2.4 实验与性能分析
2.4.1 参数码率分析与比较
2.4.2 主观性能分析与比较
2.4.3 客观性能分析与比较
2.5 本章小结
第3章 双耳线索感知信息的度量
3.1 引言
3.2 基于双耳听音的生理感知模型构建
3.2.1 空间信息的物理层表示
3.2.2 空间信息的生理感知
3.2.3 双耳线索生理感知模型BCPPM
3.3 基于BCPPM模型的空间感知熵计算
3.3.1 空间感知熵的定义
3.3.2 临界频带滤波单元
3.3.3 双耳线索计算单元
3.3.4 有效感知量计算单元
3.4 实验与性能分析
3.4.1 立体声序列的信息量估算方法对比
3.4.2 不同序列SPE数值的差异分析
3.4.3 同一序列SPE随时间的变化分析
3.5 本章小结
第4章 MDCT域双耳线索的分析与合成
4.1 引言
4.2 基于共轭窗函数的MDcT复数化扩展
4.2.1 双耳线索的形成机理
4.2.2 MDCT频谱对双耳线索的影响:
4.2.3 基于共轭窗函数的MDCT复数化扩展
4.2.4 实验与性能分析
4.3 基于C2S转换的双耳线索分析
4.3.1 MDCT-MDST快速转换
4.3.2 C2S转换矩阵的稀疏化近似
4.3.3 CMCLT域的双耳线索表示
4.4 实验与性能分析
4.4.1 主观性能分析与比较
4.4.2 客观性能分析与比较
4.5 本章小结
第5章 基于合成分析的空间音频编码结构
5.1 引言
5.2 空间音频编码系统的基础操作模块
5.2.1 声源分离模块
5.2.2 下混/上混模块
5.2.3 空间参数分析模块
5.2.4 系统结构的优缺点
5.3 并行滤波共享的ABS编码结构
5.3.1 频带划分对空间信息分析的影响
5.3.2 ABS编码结构设计
5.3.3 并行结构下的滤波共享
5.4 实验与性能分析
5.4.1 系统延时分析
5.4.2 计算复杂度分析
5.4.3 系统性能分析
5.5 本章小结
第6章 总结与展望
6.1 研究工作总结
6.2 研究展望
参考文献
致谢
附录
好评度