10、语音处理技术:从听觉研究到编码压缩

10、语音处理技术:从听觉研究到编码压缩

语音处理技术:从听觉研究到编码压缩

1. 人类听觉研究回顾

在深入探讨语音通信之前,先来回顾一下人类听觉的相关研究。人类听觉系统十分复杂,其物理结构和内部过程对声音的感知起着关键作用。然而,人类听觉系统并非总是按照声音物理特性所预测的方式运行,存在一些违反直觉的现象,这就引出了心理声学的概念。

心理声学通过多个实例进行了表征,还借助一些 Matlab 程序来展示其效果。例如,我们可以通过以下代码来重放不连续声音和连续声音:

soundsc(repmat(sa,1,8))

soundsc(repmat(sb,1,8))

2. 语音通信概述

语音通信主要涉及语音编码和压缩,而非语音分类和识别。为了更好地理解语音通信,我们可以将其处理过程分为几个关键步骤: 1. 量化 :将语音视为一般音频波形进行处理,不考虑语音的特性。 2. 参数化 :利用语音的特征和特性对语音信号进行参数化,进而进行源滤波器建模。 3. CELP 技术 :码本激励线性预测(CELP)语音压缩技术是这些方法的巅峰之作。

2.1 语音编码质量分类

语音压缩或编解码系统根据压缩对象(语音或一般音频)、压缩效果以及质量或可懂度进行分类。以下是常见的语音质量分类及其典型特征: | 名称 | 采样率 | 带宽 | 动态范围 | 平均意见得分(MOS) | | — | — | — | — | — | <

相关阅读