专利摘要
专利摘要
一种用于计算频率相关的正则化参数(FDRP)的方法和系统,所述频率相关的正则化参数(FDRP)被用于分析地导出或实验地测得的系统转移矩阵求逆以用于设计和/或生产串扰消除(XTC)过滤器,该方法和系统依赖于计算导致在扬声器处平坦的振幅相对频率响应(对比于如之前的方法中固有地所做地,在听者耳朵处的平坦的振幅相对频率响应)的FDRP,因此迫使XTC仅在相位域内起效并消除了XTC滤波器的音频频谱着色和动态范围损失的缺陷。当该方法和系统被与任何有效的优化技术一起使用时,其导致这样的XTC滤波器,其在音频带的任何期望部分上获得最佳XTC大小、在所处理的声音上不施加超出回放硬件和/或扬声器中固有频率着色的频谱着色、且不引起任何(或非常低的)动态范围损失。这样的XTC滤波器不仅优化且允许通过扬声器的对于双耳或立体声声音的最为自然和频谱通透的3D音频重现。
权利要求
1.一种用于过滤音频信号来消除音频系统中的串扰的方法,所述方法包括如下步骤
对于所述音频系统的转移矩阵或函数求逆;
使用来自所述逆转移矩阵或函数的信息来计算频率相关的正则化参数,当所述正则化参数被应用于音频信号时在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应;
使用所述经计算的频率相关的正则化参数来计算所述转移矩阵的伪逆。
2.如权利要求1的用于过滤音频信号来消除串扰的方法,其特征在于,所述平坦的频率响应在整个所述音频带或所述音频带的一部分上仅通过相位效应起效。
3.如权利要求1的用于过滤音频信号来消除串扰的方法,其特征在于,当所述频率相关的正则化参数被施加至音频信号时,所述频率相关的正则化参数对于被平移至左和右通道之间的任意处的期望图像在扬声器的其中一个或多个处产生平坦的频率响应。
4.如权利要求1的用于过滤音频信号来消除串扰的方法,其特征在于,所述音频系统是双耳音频系统。
5.如权利要求1的用于过滤音频信号来消除串扰的方法,其特征在于,所述音频系统是立体声音频系统。
6.一种用于为i音频应用设计串扰消除滤波器的方法,所述方法包括如下步骤
对于音频系统的转移矩阵或函数求逆;
使用来自所述逆转移矩阵或函数的信息来计算频率相关的正则化参数,当所述正则化参数被应用于音频信号时在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应;
使用所述经计算的频率相关的正则化参数来计算所述转移矩阵的伪逆矩阵。
7.如权利要求6的用于为音频应用设计串扰消除滤波器的方法,其特征在于,频率相关的正则化使得串扰消除在整个所述音频带或所述音频带的一部分上仅通过相位效应起效。
8.如权利要求6的用于为音频应用设计串扰消除滤波器的方法,其特征在于,计算所述频率相关的正则化参数的所述步骤得到滤波器,当该滤波器被应用于音频信号时,对于被平移至左和右通道之间的任意处的期望图像在扬声器的其中一个或多个处产生平坦的频率响应。
9.如权利要求6的用于过滤音频信号以消除串扰的方法,其特征在于,所述音频系统是双耳音频系统。
10.如权利要求6的用于过滤音频信号以消除串扰的方法,其特征在于,所述音频系统是立体声音频系统。
11.一种用于过滤音频信号来消除音频系统中的串扰的系统,所述系统包括:
音频输入级;
处理器,用于
对于所述音频系统的转移矩阵求逆;
计算频率相关的正则化参数,当所述正则化参数被应用于音频信号时在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应;
使用所述经计算的频率相关的正则化参数来计算所述转移矩阵的伪逆。
12.如权利要求11的用于过滤音频信号来消除音频系统中的串扰的系统,其特征在于,所述平坦的频率响应在所述音频带或所述音频带的一部分上仅通过相位效应由所述处理器起效。
13.如权利要求11的用于过滤音频信号来消除音频系统中的串扰的系统,其特征在于,所述处理器具有这样的能力:施加所述频率相关的正则化参数来过滤音频信号从而对于被平移至左和右通道之间的任意处的期望图像在扬声器的其中一个或多个处产生平坦的频率响应。
14.一种用于为音频应用产生串扰消除滤波器的系统,所述系统包括:
音频输入级;
处理器,用于
对于所述音频系统的转移矩阵求逆;
计算频率相关的正则化参数,所述正则化参数导致滤波器,当所述滤波器被应用于音频信号时,在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应;
使用所述经计算的频率相关的正则化参数来计算所述转移矩阵的伪逆。
15.如权利要求14的用于对音频应用产生串扰消除滤波器的系统,其特征在于,使用相关音频的正则化从而串扰消除在整个所述音频带或所述音频带的一部分上仅通过相位效应起效。
16.如权利要求14的用于过滤音频信号以消除音频系统中的串扰的系统,其特征在于,所述处理器具有这样的能力:施加所述频率相关的正则化参数来产生滤波器,当该滤波器被应用于所述音频信号时,对于被平移至左和右通道之间的任意处的期望图像在扬声器的其中一个或多个处产生平坦的频率响应。
说明书
相关申请的交叉引用
本申请要求在2010年9月3日提交的、名为“OPTIMAL CROSSTALK CANCELLATION FOR BINAURAL AUDIO WITH TWO LOUDSPEAKERS”的美国临时申请号61/379,831的美国临时申请的权益且该专利内容通过参考并入此处。
背景技术
采用扬声器的双耳音频(BAL),也称为贯通听觉化(transauralization),意在在听者的耳道出口处再现仅在立体声信号的同侧通道内记录的声压信号。即,在左耳仅再现左立体声通道的声音信号且在右耳仅再现右立体声通道的声音信号。例如,如果用听者的头部相关变换函数(HRTF)来编码源信号、或者源信号包括合适的双耳间时间差(ITD)和双耳间强度差(ILD)线索,则在立体声信号的每一个通道上将信号传递至同侧的耳,且仅传递至该耳,将理想地确保耳-脑系统接收到它所需的线索,从而听到所记录的声场的准确的3-维(3-D)再现。
然而,通过扬声器的双耳音频回放的非故意序列是串扰。当左耳(右耳)听到来自右(左)声道的、源自右扬声器(左扬声器)声音时,发生串扰。换言之,当在立体声通道之一上的声音被听者的对侧的耳朵所听到时,发生串扰。
串扰破坏HRTF信息和ITD或ILD线索,从而听者可能未合适地或完整地理解被包含在记录中的声场的双耳线索。因此,接近BAL的目标要求有效地消除这个非故意的串扰,即串扰消除,或简称为XTC。
尽管存在用于对双扬声器系统能实现某种程度的串扰消除的各种技术,它们全都具有如下一个或多个缺陷:
D1:即使听者正坐在预期的甜区(sweet spot),也有对于听者所听到的声音的数个频谱着色。
D2:仅在音频带的有限频率范围内达到有用的XTC级别。
D3:当声音经过XTC滤波器或处理器处理(同时避免扭曲和/或削波)时的严重的动态范围损失。
通过使用XTC问题的最基本表达式来分析XTC-即通过查看描述从扬声器到听者的耳朵的声音传播的系统转移矩阵(如下所示且在下文描述)的逆(inverse),可看到上述缺陷。
尽管,通常用在使得系统转移矩阵的逆矩阵表现显著较好的XTC滤波器设计中的恒定参数(非频率相关的)正则化的技术,可消除缺陷D3的其中一些,但是它固有地引入其自身的频谱伪像(特定地,以减少逆转移矩阵中的频谱峰值的振幅为代价,恒定参数正则化导致在扬声器的较高频率处的不期望的窄带伪像和较低频率处的衰减(rolloff)),且几乎没有消除另外两个缺陷(D1和D2)。
现有技术的频率相关的正则化,即使当与有效的优化方案结合时,也不足以处理掉缺陷D1、D2、和D3。
基于系统转换矩阵逆矩阵(带有或不带有正则化)的以前的XTC滤波器设计方法,通过在扬声器处施加不平坦的振幅相对频率响应(如下所述),在听者的耳朵处争取维持平坦的振幅相对频率响应,这引起所处理的声音的动态范围中的损失,且基于如下所述的理由,即使听者坐在所预计的甜区,导致听者所听到的声音的频谱着色。
因此,尽管之前的方法对于设计可固有地校正回放硬件和扬声器的振幅相对频率响应的不理想度的XTC滤波器时是有用的,它们没有解决所有的缺陷D1、D2、和D3。
发明内容
描述了一种用于计算频率相关的正则化参数(FDRP)的方法和系统,所述频率相关的正则化参数(FDRP)被用于对于分析导出或实验测得的系统分析矩阵求逆以用于串扰消除(XTC)滤波器设计。本方法依赖于计算导致在扬声器处的平坦的振幅相对频率响应(而非如现有技术方法中原本所做的那样,导致在听者的耳朵处的平坦的振幅相对频率响应)的FDRP,因此强迫XTC仅在相位域中实现且减轻XTC滤波器在可听频谱着色和动态范围损失方面的缺陷。当与任何有效的优化方案一起使用本方法时,其导致这样的XTC滤波器,其在音频带的任何期望部分上获得最佳XTC大小、在所处理的声音上不施加超出回放硬件和/或扬声器中固有的频谱着色的频谱着色、且不引起任何动态范围损失。采用这个方法设计、且被用在该系统中的XTC滤波器不仅是最佳的,且由于不存在缺陷D1、D2、和D3,允许通过扬声器对于双耳或立体声音频的最自然的和频谱通透的3D音频再现。本发明和系统并不企图校正回放硬件的频谱特性、且因此最为适用于与被设计为在不需要用于频谱校正的附加信号处理的情况下满足期望的频谱保真度的音频回放硬件和扬声器。
附图说明
在下文详细描述中可看到本发明的更为详细的理解,该描述要在对照相应附图情况下阅读,在附图中:
图1是听者和双源模型的示图;
图2是在扬声器处的完美的XTC滤波器的频率响应曲线;
图3是示出对于在扬声器处的包络频谱的正则化的效果的曲线,
图4示出对于串扰消除频谱的正则化的效果,
图5是示出扬声器处的包络频谱的示图,
图6是本发明的方法的流程图。
图7示出代表时域中的转换函数的四个(加窗的)测得的脉冲响应(IR)。
图8是示出与完美的XTC滤波器关联的所测得的频谱的图。
图9是示出本发明的XTC滤波器的测得的频谱的图。
详细说明
为了解释本发明的方法和系统的优势,将描述在理想化情况下的基本XTC问题的分析表达式,且将定义“完美的XTC滤波器”,它将作为基准,说明所有XTC滤波器固有的可听频谱着色的严重问题。
在以下描述中,为了清楚以及允许分析观察,将使用在自由空间(没有声音反射)的两个点源(理想的扬声器)12、14以及对应于理想的听者20(没有)的耳朵位置的两个接听点16、18构成的理想化环境。然而,在本发明的下文描述中给出的示例中,将使用对应于在仿真头部的耳道入口处测得的在真实房间中的真实扬声器的脉冲响应的实际数据。
基本XTC问题的表达式
在频域中,在自由场(从听者或任何其他物理对象的头部或外耳壳,没有衍射或反射)中发生声音传播、且扬声器如同点源般辐射的理想化假设的情况下,在自辐射频率ω的声波的点源(单极)相距r处的自由场点处的空气压力,由下式给出:
其中ρo是空气密度,k=2π/λ=ω/cs是波数,λ是波长,cs是声速(340.3m/s),且q是源强度(单位为每单位时间的体积)。将来自源中心的空气的质量流率,V,定义为:
这是 的时间导数,在上述假设下,在图1所示的对称的双源几何配置中由于双源12、14引起的空气压力加起来,为
类似地,在听者20的右耳18处,下式是所感测到的压力:
此处,l1和l2是双源12、14中任一个分别和同侧、对侧的耳朵之间的路径长度,如图1中所示。
在说明书全文中,大写字母代表频率变量、小写代表时域变量,大写粗体字母代表矩阵,且小写粗体字母代表向量,并且定义
Δl≡l2-l1且g≡l1/l2 (3)
分别作为路径长度差和路径长度比。
由于在图1的几何配置中,对侧的距离大于同侧的距离,则0<g<1。进一步,由图1的几何配置,可将两个距离表达为:
其中Δr是耳道入口之间的有效距离,且l是任一源与听者的耳间中点之间的距离。如图1中所定义,Θ=2θ是扬声器跨距。注意,l>>Δrsin(θ),如很多基于扬声器的聆听设置中一样,这导致g≈1。另一个重要的参数是时间延迟,
被定义为声波横穿路径长度差异Δl所花费的时间。
使用式(1)和(2),在听者左耳16处接收到的信号和在听者右耳18处接收到的信号可被写为如下向量形式:
p=αCv
其中
其,在时域内,是不影响所接收的信号的形状的传输延迟(除以常数l1)。在包括左通道VL和右通道VR的扬声器处的源向量被写成向量形式v=[VL(iω),VR(iω)]T。v可使用如下变换,从被表示为d=[DL(iω),DR(iω)]T的“所记录的”信号的两个通道获得v:
v=Hd (9)
其中
是所要寻找的用于XTC的2×2滤波器或转换矩阵。因此,由式(7),可获得如下结果
p=αCHd (11)
其中p=[PL(iω),PR(iω)]T是耳朵处的压力的向量,且C是系统的转换矩阵。
由于图1中所示的几何配置的对称性,C是对称的。
简而言之,从信号d、通过滤波器H、到源变量v、然后通过波传播从扬声器源到在听者耳朵处的压力p,这一转化可被写成
p=αRd
其中性能矩阵,R,被定义为
R的对角元素(即,RLL(iω)和RRR(iω))代表所记录的声音信号向耳朵的同侧的传播,且非对角元素(即,RRL(iω)和RLR(iω))代表不期望的对侧的传输,即,串扰。
性能度量
现在将描述判断XTC滤波器频谱着色与性能的一组度量。仅馈入系统的两个输入中的一个(左或右)、如在同侧的耳朵处听到的信号的振幅谱(对于因子α)为
Esi|(ω)≡|RLL(iω)|=|RRR(iω)|
其中下标“si”和||分别表示“侧图像”和“同侧的耳朵(相对于输入信号)”,如所定义的,Esi||是将由平移至一侧的输入产生的侧图像的(在同侧的耳朵处的)频率响应。类似地,在对侧耳朵,对于输入信号(下标X),如下是侧图像频率响应:
当同一个信号在左和右输入时之间被等分时,在任一耳朵处的系统频率响应是另一个频谱着色度量:
此处,下标“ci”代表“中间图像”,因为如所定义的,Eci是将由平移至中间的输入产生的中间图像的率响应。
同样重要的是将在源(即,扬声器)处测得的频率响应,这由S表示且可从过滤器矩阵H的元素中获得:
Ssi||(ω)≡|HLL(iω)|=|HRR(iω)|
这些响应由与上述振幅谱所使用的相同下标惯例而给出(“||”和“X”分别表示与输入信号同侧与对侧的扬声器)。对于上述度量的重要性的直观解释是,从单输入平移至系统的两个输入的信号将导致在耳朵处的频率响应从Esi到Eci,且在扬声器处从Ssi到Sci。
另外两个频谱着色度量是对于系统的同相和异相输入的系统的频率响应。这两个响应如下给出:
Si(ω)≡|HLL(iω)+HLR(iω)|=|HRL(iω)+HRR(iω)|
So(ω)≡|HLL(iω)-HLR(iω)|=|HRL(iω)-HRR(iω)|
下标i和o分别表示同相和异相响应。注意,如所定义地,Si是两倍的(即,比之大6dB)Sci,下文将描述振幅1的信号被平移至中间(即,在L和R输入之间相同地分离),而上文描述了两个振幅1的信号同相馈入系统的两个输入。由于真实的信号可包含具有不同相位关系的各组分,有用的是将Si(ω)和So(ω)组合为单个度量 其是描述在扬声器处可被期待的最大振幅的包络频谱,且由下式给出
相关的是,注意 等于的H的两次取模(2-norm),||H||,且Si和So是H的两个单值。
最后,将允许对于各种滤波器的XTC性能的评估和比较的重要的度量是χ(ω),串扰消除频谱:
这是在同侧耳朵的振幅谱与在对侧耳朵的振幅谱的比值,且因此,串扰消除频谱χ(ω)的值越大,串扰消除滤波器越是有效。上述定义给出了一共八个度量, 全是频率的实函数,通过这些度量来评估并比较XTC滤波器的频谱着色和XTC性能。
基准:完美的串扰消除
完美的串扰消除(P-XTC)滤波器可被定义为理论上对于所有的频率在听者的耳朵处获得无限串扰消除的滤波器。串扰消除要求在两个耳朵的每一个耳朵处接收到的信号是可单独从同侧信号得到的。因此,为了实现完美的串扰消除,式(13)要求R=CH=I,其中I是单位矩阵(恒等矩阵),且因此,按照式(14)中对于R的定义,P-XTC滤波器是式(12)中所表达的系统转移矩阵的逆矩阵,且可被准确地表达为:
其中上标[P]表示完美的XTC。对于这个滤波器,上述定义的八个度量变为:
完美的XTC滤波器(χ[P]=∞)给出在耳朵处的平坦的频率响应(如常数 和 所证明地)且在消除串扰方面是有效地,如 所证明地,同时保持同侧信号,如振幅谱1, 所证明地。然而,频谱在构成严重的频谱着色的源( 和 )处具有频率变化的行为,这,如下文将看到的,仅在理想世界(即,在模型的理想化假设下)中才不被耳朵所听到。
扬声器处的频谱着色的程度被绘制在图2中,图2示出在扬声器处的完美XTC滤波器的频率响应:振幅包络(曲线22)、侧图像(曲线24)、和中间图像(曲线26)。虚线的水平线标记了包络顶部,这对于(g=.985)的情况是36.5dB。在底部轴上给出无量纲的频率ω/τc,且以Hz为单位的被图示在顶部轴上的相应频率,用来说明在44.1kHz的红书(redbook)CD采样频率处的τc=3样本的特别(典型)情况。(这将是例如,具有Δr=15cm、l=1.6m、且θ=18°的设置的情况。)
如图2中所示,在对于这些频率,扬声器处的信号振幅必须被提升从而实现在耳朵处的XTC同时补偿在这个位置的破坏性干扰的这些频率处,在 和 频谱中出现峰值。类似地,当由于破坏性干扰,振幅必须被衰减时,在频谱中出现最小值。
对于各频谱,使用表达式的一阶和二阶导数(相对于ωτc),相关峰值的振幅和频率,用上标↑表示,且最小值,用上标,表示,且由下式给出:
对于典型的接听设置,g≈1,即,图2中所示的g=.985的情况,包络峰值(即, )对应于如下的增强:
(且其他频谱中的峰值, 对应于约30.5dB的增强。)尽管这些增强在频谱上具有相同的频率宽度,当用对数绘制频谱时(因为这适于人声音的感知),在所感知的频率范围内,低频增强是最突出的。这个低频(即,低音增强)被认为是XTC中的内在问题。尽管,理论上,通过减少τc(从式(4)到(6)可看出,通过增加l和/或减少扬声器跨距θ而达成,如在所谓“立体声偶极”配置中所做的那样,其中θ可以是10°),可从音频范围中推出高频峰值,但是P-XTC滤波器的“低频增强”将仍是问题。
与这些高振幅峰值关联的严重的频谱着色表现出三个实际问题:1)这将由甜区外的听者所听到、2)这将引起在回放换能器上物理张力的相对增加(相比未经处理的声音回放)、和3)这将对应于动态范围的损失。
如果在甜区的听者的耳朵处确保完美的XTC滤波器承诺的无限好的XTC性能(χ=∞)和完美地平坦的频率响应(F[P](ω)-constant),这些缺点或将是合理的代价。然而,实践中,由于该解对于不可避免的误差的敏感性,这些理论上承诺的优势是难以实现的。通过评估转移矩阵C的条件数,可最佳地了解这个问题。
已知的是在矩阵拟问题中,该解对于系统中误差的敏感度是由矩阵的条件数给出的。矩阵的条件数κ(C)由下式给出
κ(C)=||C||||C′-1||=||C||||H[P]||.。
(这等同地也是矩阵的最大单值与最小单值的比。)因此,我们有
使用这个函数的一阶和二阶导数,如对于之前的频谱所做的那样,以下是最大值和最小值:
在
ωτc=nπ,
对于通过扬声器的音频的频谱不着色的优化串扰消除专利购买费用说明
Q:办理专利转让的流程及所需资料
A:专利权人变更需要办理著录项目变更手续,有代理机构的,变更手续应当由代理机构办理。
1:专利变更应当使用专利局统一制作的“著录项目变更申报书”提出。
2:按规定缴纳著录项目变更手续费。
3:同时提交相关证明文件原件。
4:专利权转移的,变更后的专利权人委托新专利代理机构的,应当提交变更后的全体专利申请人签字或者盖章的委托书。
Q:专利著录项目变更费用如何缴交
A:(1)直接到国家知识产权局受理大厅收费窗口缴纳,(2)通过代办处缴纳,(3)通过邮局或者银行汇款,更多缴纳方式
Q:专利转让变更,多久能出结果
A:著录项目变更请求书递交后,一般1-2个月左右就会收到通知,国家知识产权局会下达《转让手续合格通知书》。
动态评分
0.0