倒频谱
倒频谱(cepstrum),顾名思义,就是将频谱(spectrum)的英文前四个字母反过来写。倒频谱是为了某些时候,为了计算方便,将原来信号的频谱先转成类似分贝的单位,再作逆傅里叶变换,把它视为一种新的信号做处理。倒频谱有复数倒频谱,及实数倒频谱。

倒频谱被定义在1963的论文(Bogert等)。定义如下:
- 字义:倒频谱(信号)是信号频谱取对数的傅里叶变换后的新频谱(信号),有时候会称频谱的倒频谱。
- 数学上:信号的倒频谱 = IFT ( log ( | FT (信号) | ) + j2πm )(m为实数)
- 算法:信号 -> 傅立叶变换 -> 取绝对值 -> 取对数 -> 相位展开 -> 逆傅立叶变换 -> 倒频谱
复数倒频谱拥有频谱大小跟相位的信息,实数倒频谱只有频谱大小的信息,各有各的不同应用。
复数倒频谱与实数倒频谱
复数倒频谱
其中
可能遭遇的问题
1.
2. 有无限多的解
当输入是实数时,因为偶对称,奇对称,所以复数倒频谱的值为实数
实数倒频谱
可能遭遇的问题
1.
应用
- 倒频谱可以被视为在不同频带上变化速率的信息,倒频谱一开始被发明在地震或炸弹产生的地震回音,现今也被使用在分析雷达信号,以及信号处理等问题。
- 自相关倒频谱(autocepstrum)被定义为倒频谱的自相关性,自相关倒频谱有时在分析处理回传信号时比倒频谱还准确。
- 倒频谱在处理人声信号以及音乐信号有非常好的效果,例如梅尔频率倒频谱(Mel-Frequency Cepstrum),用来做声音的辨认,侦测音高等。近年来梅耳倒频谱也被应用在音乐信息的回复。
- 倒频谱在声学中可以将声带震动的影响去除。
- 倒频谱用在处理多路径问题时(如声波的回音、电磁波的折、反射等),如果将其他路径干扰视为杂讯,为了消除杂讯,利用倒频谱,不需测量每条多路径的延迟时间,可以利用发送多次信号,观察其他路径在倒频谱上的效果,并且加以滤除。
- 语音大致上是由音高、声带脉冲、声门波形所组成,我们可以利用倒频谱将这三种元素在倒频域上分开,以利于做语音信号的分析。
- 倒频谱的微分适用于影像处理上的图形辨认(pattern recognition)。
- 倒频谱与同型声音理论(homomorphic sound theory)有关。
倒频谱观念
频谱图上的独立变量是频率,而倒频谱图上的独立变量为倒频率(quefrency),倒频率是一种时间的度量单位。举个例子,声音频号采样速率等于44100赫兹,在倒频谱上有个很大的值在倒频率等于100,代表实际上在44100/100=441赫兹有很大的值,这值出现在倒频谱上因为频谱上周期性出现,而频谱上出现的周期与倒频谱很大的值出现的位置有关。
倒滤波器
滤波器(filter)常使用在频谱上,用来保存或删除我们所要或不要的信息,经过上面的许多讨论,不难猜到,倒滤波器(lifter)就是在倒频谱上所使用的滤波器。低通的倒滤波器跟低通滤波器有点类似,它可以借由在倒频谱上乘以一个window系数,使倒频谱上的高倒频率被压抑,如此依来,当信号转回时域空间时会变成一个较平滑的信号。
计算倒频谱的方法
直接计算IDTFT(反离散时间傅里叶变换)
问题: 可能会无限大, 且对于arg(x[n])有无限多个解
利用Z转换的零点与极点
先对信号做Z转换, 并整理一下系数, 让他变成下面的形式
其中
分子:
第一项A是系数
第二项是延迟
第三项是位於单位圆内的零点
第四项是位於单位圆外的零点
分母:
第一项是位於单位圆内的极点
第二项是位於单位圆外的极点
对取log变成
假设r=0, 因为这只是延迟, 并不会破坏波形
根据Z转换所得到的系数, 我们可以利用泰勒展开得到Z的反转换
注意事项
1.总是IIR(无限脉冲响应)
2.对于FIR(有限脉冲响应)的情况,
利用Z转换与微分
对其做Z的反转换
故
分别对于x[n]的四种不同的状况做延伸
1.对于x[n]是因果(causal)和最小相位(minimum phase) i.e.
对于
可得出
故
2.对于x[n]是最小相位(minimum phase)
3.对于x[n]是反因果(anti-causal)且最大相位(maximum phase) i.e.
4.对于x[n]是最大相位(maximum phase)
特性
1. 复数倒频谱至少以的速度衰退
其中
2. 如果X(Z)没有在单位圆以外的零点和极点, 则
因为
3. 如果X(Z)没有在单位圆以内的零点和极点, 则
因为
4. 如果x[n]是有限长度, 则是无限长度
梅尔频率倒频谱
梅尔频率倒频谱是倒频谱的一种应用,梅尔频率倒频谱常应用在声音频号处理,对于声音频号处理比倒频谱更接近人耳对声音的分析特性,而梅尔频率倒频谱与倒频谱的差别在于:
- 梅尔频率倒频谱的频带分析是根据人耳听觉特性所设计,人耳对于频率的分辨能力,是由频率的"比值"决定,也就是说,人耳对200赫兹和300赫兹之间的差别与2000赫兹和3000赫兹之间的差别是相同的。
- 梅尔频率倒频谱是针对信号的能量取对数,而倒频谱是针对信号原始在频谱上的值取对数。
- 梅尔频率倒频谱是使用离散余弦转换,倒频谱是用离散傅里叶变换。
- 梅尔频率倒频谱系数足够描述语音的特征。
梅尔频率倒频谱系数(MFCCs)的推导步骤:
杂讯敏感性
梅尔频率倒频谱系数很容易被外来的杂讯所破坏,因此有些研究结果指出,在求梅尔频率倒频谱系数时,在作离散余弦转换前,提升适当的能量(大约2或3倍),以减少杂讯在低能量成份的影响。
梅尔频率倒频谱优点
相较于原始的倒频谱
- 有绝对值平方
微分倒频谱(differential cepstrum)
定义
或
If
优点:
(a)没有模糊的相位
(b)可以处理延迟问题
特性
(1)微分倒频谱在shift和scaling时,结果不改变。
ex:
(proof):
(2)复数倒频谱 与 微分倒频谱 和原信号x[n]有关
diff cepstrum
recursive formula
复数频谱做得到的事情, 微分倒频谱也做得到
(3)如果x[n]是最小相位(minimum phase),则,当
minimum phase 意思为 no poles 或 zeros 在单位圆外
(4)如果x[n]是最大相位(maximum phase),则,当
maximum phase 意思为 no poles 或 zeros 在单位圆内
(5)如果x(n)为有限区间,则为无限区间
- 复数倒频谱的衰减率反比于n
- 微分倒频谱的衰减率下降
范例
- ,otherwise 0 , Find its cepstrum.
step 1. Z transform:
step 2. log:
step 3. reverse Z transform:
- ,otherwise 0 , Find its inverse cepstrum.
step 1. Z transform:
step 2. exp:
step 3. reverse Z transform:
- Suppose that an IIR filter is
step 1. Z transform:
step 2. log:
step 3. reverse Z transform:
参考文献
- B. P. Bogert, M. J. R. Healy, and J. W. Tukey: "The quefrency analysis of time series for echoes: cepstrum, pseudo-autocovariance, cross-cepstrum, and saphe cracking". Proceedings of the Symposium on Time Series Analysis (M. Rosenblatt, Ed) Chapter 15, 209-243. New York: Wiley, 1963.
- D. G. Childers, D. P. Skinner, R. C. Kemerait, "The Cepstrum: A Guide to Processing(页面存档备份,存于)," Proceedings of the IEEE, Vol. 65, No. 10, October 1977, pp. 1428-1443.
- Jian-Jiun Ding, Advanced Digital Signal Processing class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2008