CN102122508B - 方法、装置、编码器设备、译码器设备和音频系统 - Google Patents

方法、装置、编码器设备、译码器设备和音频系统 Download PDF

Info

Publication number
CN102122508B
CN102122508B CN2010102544793A CN201010254479A CN102122508B CN 102122508 B CN102122508 B CN 102122508B CN 2010102544793 A CN2010102544793 A CN 2010102544793A CN 201010254479 A CN201010254479 A CN 201010254479A CN 102122508 B CN102122508 B CN 102122508B
Authority
CN
China
Prior art keywords
signal
stereophonic
complex function
upside down
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010102544793A
Other languages
English (en)
Other versions
CN102122508A (zh
Inventor
M·W·范卢恩
D·J·布里巴尔特
G·H·霍索
E·G·P·舒伊杰斯
H·普恩哈根
K·J·罗登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Koninklijke Philips Electronics NV filed Critical Dolby International AB
Publication of CN102122508A publication Critical patent/CN102122508A/zh
Application granted granted Critical
Publication of CN102122508B publication Critical patent/CN102122508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

描述了一种用于处理从编码器得到的立体声信号的方法和装置,该编码器把N通道音频信号编码成空间参数(P)和包括第一与第二立体声信号(L0,R0)的立体声下混合的信号。利用该方法可以实现完全质量的多通道重建而与可得到的译码器无关。

Description

方法、装置、编码器设备、译码器设备和音频系统
本申请是申请日为2005年7月7日、申请号200580023855.5的题为“方法、装置、编码器设备、译码器设备和音频系统”的发明专利申请的分案申请。
技术领域
本发明涉及用于处理从一个编码器得到的立体声信号的方法和装置,该编码器把N通道音频信号编码成空间参数和一个包括第一与第二立体声信号的立体声下混合信号。本发明还涉及包括这样的编码器和这样的装置的编码器设备。
本发明还涉及用于处理通过这样的方法得到的立体声下混合信号的方法和装置,和用于处理从编码器得到的立体声信号的装置。本发明还涉及包括这样的用于处理立体声下混合的信号的装置。
本发明还涉及包括这样的编码器设备和这样的译码器设备的音频系统。
背景技术
很长时间以来,例如在家庭环境中音乐的立体声重现一直很流行。在1970年代,进行了家庭音乐设备的某些四通道实验。
在诸如电影院那样的较大的大厅内,声音的多通道重现存在了很长时间。
Figure BSA00000231030600011
(杜比数字)和其它系统被开发用于在大厅中提供逼真的和感人的声音重现。
这样的多通道系统被引入到家庭影院,并且引起广泛的兴趣。因此,具有五个全范围通道和一个部分范围通道或低频效果(LFE)通道的系统,被称为5.1系统,在现今的市场上是很流行的。也存在其它的系统,诸如2.1、4.1、7.1和甚至8.1系统。
随着SACD和DVD的引入,多通道音频重现具备了基础。许多消费者已经有可能在他们的家中进行多通道重放,而多通道源材料正变得很流行。然而,许多人仍旧只有2通道重现系统,以及传输通常是经由2通道进行的。为此,例如像
Figure BSA00000231030600012
(杜比环绕声)那样的矩阵运算技术被开发,使得有可能经由2通道进行多通道传输。所传送的信号可以通过2通道重现系统直接被重放。当可得到适当的译码器时,多通道重放是可能的。熟知的用于这一用途的译码器是Dolby(I和II),(Kenneth Gundry,“A new active matrix decoderfor surround sound”(环绕声用的新型有源矩阵译码器),见于Proc.AES19th International Conference on Surround Sound,June 2001)和Circle
Figure BSA00000231030600022
(I和II),(美国专利No.6,198,827:5-2-5矩阵系统)。
因为多通道材料的增加的流行性,多通道材料的有效的编码变得越来越重要。矩阵运算减少了对传输所需的音频通道数,从而减小所需带宽或比特率。矩阵技术的额外的优点在于,它与立体声重现系统是后向兼容的。为了进一步减小比特率,可以应用传统的音频编码器来对矩阵运算的立体声信号编码。
减小比特率的另一个可能性是对未经过矩阵运算的所有各个通道编码。这个方法导致较高的比特率,因为必须对五个通道编码而不是两个通道,但空间重建比起通过应用矩阵运算更接近于原始的声音。
在原理上,矩阵运算过程是有损运算。所以,仅根据2通道混合重建成完美的5通道通常是不可能的。这个特性限制了5通道重建的最大感觉质量。
最近,开发了一种把多通道音频编码为2通道立体声音频信号和少量空间参数或编码器信息参数P的系统。因此,这个系统对立体声重现是后向兼容的。所传送的空间参数或编码器信息参数P确定了译码器应当如何根据可得到的二通道立体声下混合信号来重建五通道。由于上混合过程由所传送的参数所控制,5通道重建的感觉质量与没有控制参数的上混合算法(例如,Dolby Pro Logic)相比得到了很大的改进。
总之,三种不同的方法可用来根据提供的二通道混合生成5通道重建:
1)盲重建。这个试图仅仅根据信号特性来估计上混合矩阵,而不用任何提供的信息。
2)矩阵运算技术,例如Dolby Pro Logic。通过应用某个下混合矩阵,由于由所应用的下混合矩阵确定的某些信号特性,从2到5通道的重建可被改进。
3)参数控制的上混合。在这个方法中,编码器信息参数P典型地被存储在比特流的附属部分,保证与通常的重放系统的后向兼容性。然而,这些系统通常是不与矩阵运算系统后向兼容的。
把上述的方法2和3组合成单个系统可能是有趣的。取决于可得到的译码器,这保证最高质量。对于具有诸如Dolby Pro Logic或CircleSurround的矩阵环绕译码器的消费者,重建是按照矩阵运算过程得到的。如果得到这样的译码器,它能够解译传送的参数,则可以得到更高质量的重建。不具有矩阵环绕声译码器或能够解译空间参数的译码器的消费者仍然可以享受立体声后向兼容性。然而,组合方法2和3的一个问题是,实际传送的立体声下混合将被修改。这对使用空间参数的5通道重建又可能具有有害的影响。
发明内容
本发明的目的是提供一种允许把参数化多通道音频编码与矩阵运算编码技术相组合的方法,利用该方法可以实现完全质量的多通道重建而与可得到的译码器无关。
按照本发明,这个目的是通过一种处理从编码器得到的立体声信号的方法而达到的,该编码器把N通道音频信号编码成空间参数和一个包括第一与第二立体声信号的立体声下混合信号,该方法包括以下步骤:
把第一与第三信号相加以得到第一输出信号,其中所述第一信号包括由第一复数函数修改的所述第一立体声信号,和其中所述第三信号包括由第三复数函数修改的所述第二立体声信号;以及
把第二与第四信号相加以得到第二输出信号,其中所述第四信号包括由第四复数函数修改的所述第二立体声信号,和其中所述第二信号包括由第二复数函数修改的所述第一立体声信号;
其中所述复数函数是所述空间参数的函数,并且被选择成使得在第一信号与第二信号之间的差值的能量值大于或等于第一与第二信号的总和的能量值,并使得在第四信号与第三信号之间的差值的能量值大于或等于第四与第三信号的总和的能量值。因此,使得能在译码器中进行前/后操控。
这些差信号与和信号的能量值可以是基于2-模方(2-norm)(即,遍及多个样本的平方和)或这些信号的绝对值。另外,这里可以应用其它传统的能量测量值。
在本发明的实施例中,N通道音频信号包括前通道信号和后通道信号,以及所述空间参数包括在立体声下混合中的后通道相对于这里的前通道的贡献的相对贡献的度量。这是因为选择后通道贡献是必须的。
所述第二复数函数的幅度可以小于所述第一复数函数的幅度,以使得能进行左/右后操控,和/或所述第三复数函数的幅度小于所述第四复数函数的幅度。
第二复数函数和/或第三复数函数可以包括基本上等于正或负90度的相移,以防止信号与前通道贡献抵销。
在本发明的另一个实施例中,所述第一函数包括第一与第二函数部分,其中当所述空间参数表明在所述第一立体声信号中的后通道的贡献比起前通道的贡献增加时,所述第二函数部分的输出增加,以及所述第二函数部分包括基本上等于正或负90度的相移。这是为了防止信号与前通道相抵销。另外,所述第四函数可包括第三与第四函数部分,其中当所述空间参数表明在所述第二立体声信号中的后通道的贡献比起前通道的贡献增加时,所述第四函数部分的输出增加,以及所述第四函数部分包括基本上等于正或负90度的相移。
第一函数部分与所述第四函数部分相比较时可以具有相反的正负号。第二函数部分与所述第三函数部分相比较时可以具有相反的正负号。第二函数部分与第四函数部分可以具有相同的正负号,以及第三函数部分与第二函数部分可以具有相同的正负号。
本发明的另一方面,提供了用于按照上述的方法处理立体声信号的装置,以及一个包括这样的装置的编码器。
本发明的另一方面,提供了用于处理包括第一与第二立体声信号的立体声下混合信号的方法,该方法包括按照上述的方法颠倒进行处理操作的步骤。
本发明的另一方面,提供了用于按照上述的处理立体声下混合信号的方法处理立体声下混合信号的装置,以及包括这样的装置的编码器。
本发明的再一个方面,提供了包括这样的编码器设备和这样的译码器设备的音频系统。
附图说明
通过参照本发明的实施例和附图作出的本发明的以下的详细说明将明白本发明的另外的目的、特性和优点,其中:
图1是按照本发明的、包括后处理和逆后处理的编码器/译码器的音频系统的框图。
图2是按照本发明的、用于处理立体声信号的装置的实施例的框图。
图3是显示本发明的进一步的细节的、类似于图2的详细框图。
图4是显示本发明的再进一步的细节的、类似于图3的详细框图。
图5是显示本发明的另外进一步的细节的、类似于图3的详细框图。
图6是按照本发明的、用于处理立体声下混合信号的装置的实施例的框图。
具体实施方式
本发明方法能够使得矩阵译码成为可能,而不恶化参数化多通道重建。这是可能的,因为在下混合后在编码器中应用矩阵运算技术,这与通常在下混合以前完成矩阵运算相反。下混合的矩阵运算由空间参数控制。
如果所应用的矩阵是可逆的,则译码器可以根据所传送的编码器信息参数P取消该矩阵运算。
传统上,矩阵运算是施加到原始的N通道输入信号上的。然而,这个方法在这里是不适用的,因为对于N通道正确重建所必须的对这种矩阵运算的求逆通常是不可能的,因为在译码器处可供使用的只有2个通道。因此,本发明的一个特点是用二通道混合的参数控制的修改方案来替代通常被施加到5通道混合的矩阵运算技术。
图1是引用本发明的编码器/译码器的音频系统的框图。在音频系统1中,N通道音频信号被提供给编码器2。编码器2把N通道音频信号变换为立体声通道信号L0和R0以及编码器信息参数P,译码器3通过该编码器信息参数P可以对信息译码和近似地重建原先的N通道信号以供译码器3输出。N通道信号可以是用于5.1系统的信号,包括中心通道、两个前通道、两个环绕通道和低频效果(LFE)通道。
传统上,编码的立体声通道信号L0和R0以及编码器信息参数P以适当的方式,诸如CD、DVD、广播、激光光盘、DBS、数字电缆、互联网或任何其它传输或分发系统,传送或分发给用户,如用图1的圆圈4表示的。由于传送或分发的是左和右立体声信号L0和R0,系统1与大量只能重现立体声信号的接收设备是兼容的。如果接收设备包括参数化多通道译码器,则译码器可以根据在立体声通道L0和R0中的信息和编码器信息参数P来提供它们的估值而对N通道信号译码。
现在,假设一个N通道音频信号,N是大于2的整数,以及其中z1[n],z2[n],...,zN[n]描述N通道的离散时域波形。这N个信号通过使用通常的分段方式、优选地使用重叠分析窗口而被分段。随后,每个分段通过使用复数变换(例如,FFT)而被变换成频域。然而,复数滤波器组结构也可以适用于得到时间/频率片(tile)。这个过程导致输入信号的经分段的子频带表示,被表示为Z1[k],Z2[k],...,ZN[k],其中k表示频率下标。
从这N个通道,产生2个下混合通道,即L0[k]和R0[k]。每个下混合通道是N个输入信号的线性组合:
L 0 [ k ] = Σ i = 1 N α i Z i [ k ]
R 0 [ k ] = Σ i = 1 N β i Z i [ k ]
参数αi和βi被选择成使得由L0[k]和R0[k]组成的立体声信号具有良好的立体声形像。
后处理器5可以对于最终得到的立体声信号进行处理,以使得它主要影响在立体声混合中特定的通道i的贡献。作为处理,可以选择特定的矩阵运算技术。这导致左和右矩阵可兼容的信号L0w[k]和R0w[k]。这些信号连同空间参数一起,被传送到译码器,如图1的圆圈6显示的。用于处理从编码器得到的立体声信号的装置包括后处理器5。按照本发明的编码器设备包括编码器2和后处理器5。
后处理的信号L0w和R0w可被提供到传统的立体声接收机(未示出),以用于重放。替换地,后处理的信号L0w和R0w可被提供到矩阵译码器(未示出),例如Dolby Pro
Figure BSA00000231030600071
泽码器或Circle译码器。再一个可能性是把后处理的信号L0w和R0w提供到逆后处理器7,以用于取消后处理器5的处理。最终得到的信号L0和R0可以由后处理器7提供给多通道译码器3。用于处理立体声下混合信号的译码器包括逆后处理器7。按照本发明的译码器设备包括译码器3和逆后处理器7。
在译码器3中,N通道信号被重建为如下:
Z ^ i [ k ] = C 1 , Z i L O [ k ] + C 2 , Z i R O [ k ] ,
其中
Figure BSA00000231030600074
是Zi[k]的估值。滤波器C1,Zi和C2,Zi优选地与时间和频率有关,它们的转移函数是根据传送的编码器信息参数P而推导的。
图2显示这个后处理块5可以如何被实施,以使得矩阵译码成为可能。左输入信号L0[k]由第一复数函数g1修改,这导致第一信号L0wL[k],它被馈送到左输出L0w[k]。左输入信号L0[k]还由第二复数函数g2修改,这导致第二信号R0wL[k],它被馈送到右输出R0w[k]。函数g1和g2被选择成使得差值信号L0wL-R0wL具有等于或大于和值信号L0wL+R0wL的能量。这是因为在矩阵译码中,和值信号与差值信号的比值用来执行前/后向控制。当差值信号变为更大时,更多的输入信号被控制到后向。因为这样,当在L0[k]中左后方的贡献增加时,R0wL[k]必须增加。这个控制过程由作为空间参数P的函数的函数g1和g2完成。这些函数被选择成使得当在L0[k]中左后方的贡献增加时,左输入通道的处理量增加。
g2的幅度优选地小于g1的幅度。这允许在译码器中进行左/右后通道控制。
右输入信号R0[k]由第四函数g4修改,这导致第四信号R0wR[k],它被馈送到右输出R0w[k]。右输入信号R0[k]还由第三函数g3修改,这导致第三信号L0wR[k],它被馈送到左输出L0w[k]。函数g3和g4被选择成使得当在R0[k]中的右后方的贡献增加时,右输入通道的处理量增加,以及还使得从R0wR中减去L0wR比起它们的相加导致更大的信号。
g3的幅度优选地小于g4的幅度。这允许在译码器中进行左/右后通道控制。
输出可以藉助于以下的矩阵描述:
L ow R ow = H L 0 R 0 = g 1 g 3 g 2 g 4 L 0 R 0
参数化多通道编码器在下面描述。应用了以下的公式:
L0[k]=L[k]+Cs[k]
R0[k]=R[k]+Cs[k]
其中Cs[k]是在把LFE通道和中心通道组合后得出的单声道信号。以下的公式对于L[k]和R[k]都成立:
L [ k ] = c 1 c 2 L f [ k ] L s [ k ]
R [ k ] = c 3 c 4 R f [ k ] R s [ k ]
其中Lf是左前通道,Ls是左环绕声通道,Rf是右前通道,Rs是右环绕声通道。常数c1到c4控制下混合过程,以及可以是复数值和/或与时间和频率有关。对于(c1,c3=sqrt(2);c2,c4=1)得到ITU-方式下混合。
在译码器中,执行以下的重建:
L ^ [ k ] = β L 0 [ k ] + ( γ - 1 ) R 0 [ k ]
R ^ [ k ] = ( β - 1 ) L 0 [ k ] + γ R 0 [ k ]
C ^ [ k ] = ( 1 - β ) L 0 [ k ] + ( 1 - γ ) R 0 [ k ]
其中是L[k]的估值,
Figure BSA00000231030600088
是R[k]的估值以及
Figure BSA00000231030600089
是C[k]的估值。参数β和γ在编码器中被确定,以及被传送到译码器,即,它们是编码器信息参数P的子集。另外,信息信号P可包括在相应的前通道与环绕通道之间的(相对)信号电平,即分别是在Lf,Ls与Rf,Rs之间的通道间强度差值(IID)。对于描述在Lf与Ls之间的能量比值的IIDL的一个方便的表示式被给出为:
IID L = Σ k L f [ k ] L f * [ k ] Σ k L s [ k ] L s * [ k ]
当这些参数被使用时,图2上的方案可以用图3上的方案替代。为了处理左通道L0[k],仅仅需要确定在左输入通道中前后贡献的参数,它们是参数IIDL和β。为了处理右输入通道,仅仅需要参数IIDR和γ。函数g2现在可以用函数g3替代,但正负号相反。
在图4上,函数g1和g4都被分割成两个并行的函数部分。函数g1被分割成g11和g12。函数g4被分割成g11和-g12。函数部分g12和函数g1的输出信号是后通道的贡献。函数部分g12和函数g3在一个输出中需要以相同的正负号相加,以避免信号抵销,以及在不同的输出中以有相反的正负号。
函数部分g12和函数g3都包含正或负90度的相移。这是为了避免前通道贡献的抵销(函数部分g11的输出)。
图5给出这个方块的更详细的说明。参数wl确定L0[k]的处理量以及参数wr确定R0[k]的处理量。当wl等于0时,L0[k]不用处理,以及当wl等于1时,L0[k]有最大的处理。同样的情形对于wr相对于R0[k]也成立。
以下的归一化的公式对于后处理参数wl和wr成立:
wl=f1(P)
wr=fr(p)
方块Φ-90是执行90度移相的全通滤波器。图5上的方块G1和G2是增益。最终得到的输出是:
L 0 w R 0 w = H L 0 R 0 , 其中, H = 1 - w l + w l Φ - 90 w r Φ - 90 G 2 - w l Φ - 90 G l 1 - w r - w r Φ - 90
其中:
G1=f1(wl,wr)
G2=f2(wl,wr)
所以函数g1,...,g4用更具体的函数替代:
g1=1-wl+wlΦ-90
g2=-wlΦ-90G1
g3=wrΦ-90G2
g4=1-wr-wrΦ-90
矩阵H的逆矩阵被给出为(如果det(H)≠0):
H - 1 = 1 1 - w l - w r + w l w r + ( w l - w r ) Φ - 90 + ( G 1 G 2 - 1 ) w l w r Φ - 180 1 - w r - w r Φ - 90 - w r Φ - 90 G 2 w l Φ - 90 G 1 1 - w l + w l Φ - 90
因此,在矩阵H中使用适当的函数允许矩阵运算处理过程被颠倒。
该颠倒可以在译码器中完成而不必传送附加的信息,因为参数wl和wr可以根据传送的参数来计算。因此,原先的立体声信号将可重新得到,这对于多通道混合的参数译码是必须的。
如果增益G1和G2是在各环绕声道之间的通道间强度差值(IID)的函数,则可以得到更好的结果。在这种情形下,这个IID也必须被传送到译码器。
在给定上述的参数说明后,以下的函数用于后处理运算:
wl=f1l)f2(β)
wr=f3r)f4(γ)
这里,f1,...,f4可以是任意函数。例如:
f 1 ( IID ) = f 3 ( IID ) = IID 1 + IDD
全通滤波器Φ-90可以通过在(复数值)频域中执行与复数算子j(j2=-1)的乘法而有效地实现。对于增益G1和G2,wl和wr的函数可被取为如在Circle Surround中完成的那样,但一个其值为的常数也是适用的。这导致矩阵:
H = 1 - w l + w l j 1 2 2 w r j - 1 2 2 w l j 1 - w r - w r j
这个矩阵的行列式等于:
det ( H ) = ( 1 - w l - w r + 3 2 w l w r ) + j ( w l - w r )
当wl=wr时,这个行列式的虚部将只等于零。在这种情形下,对于该行列式下式成立:
det ( H ) = 1 - 2 w l + 3 2 w l 2
这个函数对于wl=2/3具有det(H)=1/3的最小值。
因此,对于wl=wr,这个矩阵是可逆的。所以,对于增益
Figure BSA00000231030600117
矩阵H总是可逆的,与wl和wr无关。
图6是逆后处理器7的实施例的框图。像后处理那样,求逆可以通过对每个频段进行矩阵乘法而完成:
L 0 R 0 = H - 1 L 0 w R 0 w = k 1 k 3 k 2 k 4 L 0 w R 0 w 其中 k 1 = 1 g 1 g 4 - g 2 g 3 g 4 k 2 = - 1 g 1 g 4 - g 2 g 3 g 2 k 3 = - 1 g 1 g 4 - g 2 g 3 g 3 k 4 = 1 g 1 g 4 - g 2 g 3 g 1
因此,当可以在译码器中确定g1,...,g4时,就可以确定函数k1,...,k4。函数k1,...,k4是参数组P的函数,如函数g1,...,g4那样。因此为了求逆,需要知道函数g1,...,g4和参数组P。
当矩阵H的行列式不等于零时,即:
det(H)=g1g4-g2g3≠0
矩阵H可以求逆。
这可以通过适当地选择函数g1,...,g4而达到。
本发明的另一个应用是仅仅在译码器侧对立体声信号执行后处理操作(即,在编码器侧不进行后处理)。使用这种方法,译码器可以从未增强的立体声信号生成增强的立体声信号。仅仅在译码器侧的这个后处理操作还可以在编码器中多通道信号被译码成单个(单声道)信号和相关的空间参数的情形下被精心完成。在译码器中,单声道信号首先可以(通过使用空间参数)被变换成立体声信号,此后,这个立体声信号可以如上所述进行后处理。替换地,单声道信号可以由多通道译码器被直接译码。
应当指出,动词“包括”和它的派生物的使用不排除其它单元或步骤,以及不定冠词“一个”的使用不排除多个单元或步骤。而且,在权利要求中的标号并不被看作为限制权利要求的范围。
本发明是参照具体的实施例描述的。然而,本发明并不限于所描述的各种实施例,但可以以不同的方式被修改和组合,正如阅读本技术说明书的本领域技术人员看到的。

Claims (14)

1.一种对从编码器得到的立体声信号进行处理的方法,该编码器把N通道音频信号编码成空间参数(P)和包括第一与第二立体声信号(L0,R0)的立体声下混合信号,该方法包括以下步骤:
把第一与第三信号相加以得到第一输出信号(L0w),其中所述第一信号(L0wL)包括由第一复数函数(g1)修改的所述第一立体声信号(L0),和其中所述第三信号(L0wR)包括由第三复数函数(g3)修改的所述第二立体声信号(R0);以及
把第二信号与第四信号相加以得到第二输出信号(R0w),其中所述第四信号(R0wR)包括由第四复数函数(g4)修改的所述第二立体声信号(R0),和其中所述第二信号(R0wL)包括由第二复数函数(g2)修改的所述第一立体声信号(L0);
其中所述第一复数函数(g1)包括第一和第二函数部分,其中当所述空间参数(P)表明在所述第一立体声信号(L0)中的后通道的贡献相比于在所述第一立体声信号(L0)中的前通道的贡献增加时,所述第二函数部分的输出增加,以及所述第二函数部分包括正或负90度的相移。
2.权利要求1所述的方法,其中N通道音频信号包括前通道信号和后通道信号,以及其中所述空间参数(P)包括在立体声下混合信号中的后通道相对于其中的前通道的贡献的相对贡献的度量。
3.权利要求1或2所述的方法,其中所述第二复数函数(g2)的幅度小于所述第一复数函数(g1)的幅度,和/或所述第三复数函数(g3)的幅度小于所述第四复数函数(g4)的幅度。
4.权利要求1或2所述的方法,其中所述第二复数函数(g2)和/或所述第三复数函数(g3)包括正或负90度的相移。
5.权利要求1所述的方法,其中所述第四复数函数(g4)包括第三与第四函数部分,其中当所述空间参数(P)表明在所述第二立体声信号(R0)中的后通道的贡献比起在所述第二立体声信号(R0)中前通道的贡献增加时,所述第四复数函数部分的输出增加,以及所述第四复数函数部分包括正或负90度的相移。
6.权利要求1所述的方法,其中所述第一函数部分具有与所述第四函数部分相比较为相反的正负号。
7.权利要求5所述的方法,其中所述第二复数函数(g2)具有与所述第三复数函数(g3)相比较为相反的正负号。
8.权利要求6或7所述的方法,其中所述第二复数函数(g2)与所述第四函数部分具有相同的正负号,以及所述第三复数函数(g3)与所述第二函数部分具有相同的正负号。
9.一种用于处理从编码器得到的立体声信号的装置(5),该编码器把N通道音频信号编码成空间参数(P)和包括第一与第二立体声信号(L0,R0)的立体声下混合信号,该装置包括:
第一加法装置,用于把第一与第三信号相加以得到第一输出信号(L0w),其中所述第一信号(L0wL)包括由第一复数函数(g1)修改的所述第一立体声信号(L0),和其中所述第三信号(L0wR)包括由第三复数函数(g3)修改的所述第二立体声信号(R0);以及
第二加法装置,用于把第二与第四信号相加以得到第二输出信号(R0w),其中所述第四信号(R0wR)包括由第四复数函数(g4)修改的所述第二立体声信号(R0),和其中所述第二信号(R0wL)包括由第二复数函数(g2)修改的所述第一立体声信号(L0);
其中所述第一复数函数(g1)包括第一和第二函数部分,其中当所述空间参数(P)表明在所述第一立体声信号(L0)中的后通道的贡献相比于在所述第一立体声信号(L0)中的前通道的贡献增加时,所述第二函数部分的输出增加,以及所述第二函数部分包括正或负90度的相移。
10.一种编码器设备,包括:
编码器(2),用于把N通道音频信号编码成空间参数(P)和包括第一与第二立体声信号(L0,R0)的立体声下混合信号,以及
如在权利要求9中要求的用于处理立体声下混合信号的装置(5)。
11.一种处理经后处理的立体声下混合信号的方法,所述经后处理的立体声下混合信号包括等于第一输出信号的第一颠倒立体声输入信号和等于第二输出信号的第二颠倒立体声输入信号,第一输出信号和第二输出信号是通过用于处理包括第一和第二立体声信号的立体声下混合信号的方法生成的,该立体声下混合信号与相关的空间参数从N通道音频信号编码过来,所述用于处理立体声下混合信号的方法包括以下步骤:
把第一与第三信号相加以得到第一输出信号(L0w),其中所述第一信号(L0wL)包括由第一复数函数(g1)修改的所述第一立体声信号(L0),和其中所述第三信号(L0wR)包括由第三复数函数(g3)修改的所述第二立体声信号(R0);以及
把第二信号与第四信号相加以得到第二输出信号(R0w),其中所述第四信号(R0wR)包括由第四复数函数(g4)修改的所述第二立体声信号(R0),和其中所述第二信号(R0wL)包括由第二复数函数(g2)修改的所述第一立体声信号(L0);
其中所述第一复数函数(g1)包括第一和第二函数部分,其中当所述空间参数(P)表明在所述第一立体声信号(L0)中的后通道的贡献相比于在所述第一立体声信号(L0)中的前通道的贡献增加时,所述第二函数部分的输出增加,以及所述第二函数部分包括正或负90度的相移,
所述处理经后处理的立体声下混合信号的方法包括步骤:
颠倒通过所述用于处理立体声下混合信号的方法执行的处理操作,以获得包括第一颠倒输出信号和第二颠倒输出信号的颠倒后处理的立体声下混合信号,所述第一颠倒输出信号和第二颠倒输出信号等于对应的第一和第二立体声信号。
12.一种处理经后处理的立体声下混合信号的装置(7),所述经后处理的立体声下混合信号包括等于第一输出信号的第一颠倒立体声输入信号和等于第二输出信号的第二颠倒立体声输入信号,第一输出信号(L0w)和第二输出信号(R0w)是通过用于处理包括第一和第二立体声信号的立体声下混合信号的方法生成的,该立体声下混合信号与相关的空间参数从N通道音频信号编码过来,所述用于处理立体声下混合信号的方法包括以下步骤:
把第一与第三信号相加以得到第一输出信号(L0w),其中所述第一信号(L0wL)包括由第一复数函数(g1)修改的所述第一立体声信号(L0),和其中所述第三信号(L0wR)包括由第三复数函数(g3)修改的所述第二立体声信号(R0);以及
把第二与第四信号相加以得到第二输出信号(R0w),其中所述第四信号(R0wL)包括由第四复数函数(g4)修改的所述第二立体声信号(R0),和其中所述第二信号(R0wL)包括由第二复数函数(g2)修改的所述第一立体声信号(L0);
其中所述第一复数函数(g1)包括第一和第二函数部分,其中当所述空间参数(P)表明在所述第一立体声信号(L0)中的后通道的贡献相比于在所述第一立体声信号(L0)中的前通道的贡献增加时,所述第二函数部分的输出增加,以及所述第二函数部分包括正或负90度的相移,
该装置包括用于颠倒的装置,所述用于颠倒的装置被配置为颠倒通过所述用于处理立体声下混合信号的方法执行的处理操作,以获得包括第一颠倒输出信号和第二颠倒输出信号的颠倒后处理的立体声下混合信号,所述第一颠倒输出信号和第二颠倒输出信号等于对应的第一和第二立体声信号。
13.一种译码器设备,包括:
在权利要求12中所述的用于处理经后处理的立体声下混合信号的装置(7),所述装置(7)被配置为获得包括第一颠倒输出信号和第二颠倒输出信号的颠倒后处理的立体声下混合信号,以及
译码器,用于把包括第一颠倒输出信号和第二颠倒输出信号的颠倒后处理的立体声下混合信号译码成N通道音频信号。
14.一种包括在权利要求10中所述的编码器设备与在权利要求13中所述的译码器设备的音频系统。
CN2010102544793A 2004-07-14 2005-07-07 方法、装置、编码器设备、译码器设备和音频系统 Active CN102122508B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04103365 2004-07-14
EP04103365.5 2004-07-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2005800238555A Division CN1985544B (zh) 2004-07-14 2005-07-07 处理立体声下混合信号的方法、装置、编译码器和系统

Publications (2)

Publication Number Publication Date
CN102122508A CN102122508A (zh) 2011-07-13
CN102122508B true CN102122508B (zh) 2013-03-13

Family

ID=35044993

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2005800238555A Active CN1985544B (zh) 2004-07-14 2005-07-07 处理立体声下混合信号的方法、装置、编译码器和系统
CN2010102544793A Active CN102122508B (zh) 2004-07-14 2005-07-07 方法、装置、编码器设备、译码器设备和音频系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2005800238555A Active CN1985544B (zh) 2004-07-14 2005-07-07 处理立体声下混合信号的方法、装置、编译码器和系统

Country Status (11)

Country Link
US (2) US8150042B2 (zh)
EP (2) EP2175671B1 (zh)
JP (2) JP4898673B2 (zh)
KR (1) KR101147187B1 (zh)
CN (2) CN1985544B (zh)
AT (2) ATE557552T1 (zh)
ES (2) ES2373728T3 (zh)
HK (1) HK1143481A1 (zh)
PL (2) PL2175671T3 (zh)
TW (1) TWI462603B (zh)
WO (1) WO2006008683A1 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9992599B2 (en) * 2004-04-05 2018-06-05 Koninklijke Philips N.V. Method, device, encoder apparatus, decoder apparatus and audio system
WO2006008683A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
US8793125B2 (en) * 2004-07-14 2014-07-29 Koninklijke Philips Electronics N.V. Method and device for decorrelation and upmixing of audio channels
CN101151658B (zh) * 2005-03-30 2011-07-06 皇家飞利浦电子股份有限公司 多声道音频编码和解码方法、编码器和解码器
EP1899958B1 (en) * 2005-05-26 2013-08-07 LG Electronics Inc. Method and apparatus for decoding an audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR101512995B1 (ko) * 2005-09-13 2015-04-17 코닌클리케 필립스 엔.브이. 공간 디코더 유닛, 공간 디코더 장치, 오디오 시스템, 한 쌍의 바이노럴 출력 채널들을 생성하는 방법
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP1974346B1 (en) * 2006-01-19 2013-10-02 LG Electronics, Inc. Method and apparatus for processing a media signal
WO2007091843A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
ES2339888T3 (es) 2006-02-21 2010-05-26 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de audio.
EP1999999B1 (en) 2006-03-24 2011-11-02 Dolby Sweden AB Generation of spatial downmixes from parametric representations of multi channel signals
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
AU2007271532B2 (en) * 2006-07-07 2011-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for combining multiple parametrically coded audio sources
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
KR100891665B1 (ko) 2006-10-13 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
BRPI0718614A2 (pt) 2006-11-15 2014-02-25 Lg Electronics Inc Método e aparelho para decodificar sinal de áudio.
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
WO2008069584A2 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101100223B1 (ko) 2006-12-07 2011-12-28 엘지전자 주식회사 오디오 처리 방법 및 장치
WO2008082276A1 (en) * 2007-01-05 2008-07-10 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
EP2609589B1 (en) * 2010-09-28 2016-05-04 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
JP6133422B2 (ja) 2012-08-03 2017-05-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法
CN106104678A (zh) * 2013-10-02 2016-11-09 斯托明瑞士有限责任公司 从两个或多个基本信号导出多通道信号
JP5977313B2 (ja) * 2014-10-31 2016-08-24 住友化学株式会社 偏光板の製造方法
GB2549532A (en) * 2016-04-22 2017-10-25 Nokia Technologies Oy Merging audio signals with spatial metadata

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5818941A (en) * 1995-11-22 1998-10-06 Sony Corporation Configurable cinema sound system
CN1109407C (zh) * 1998-10-13 2003-05-21 日本胜利株式会社 音频信号的编码、解码方法及音频传输方法
CN1451255A (zh) * 2000-05-10 2003-10-22 数字剧场系统股份有限公司 具有向后兼容性混频的分立式多声道音响
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US6198827B1 (en) 1995-12-26 2001-03-06 Rocktron Corporation 5-2-5 Matrix system
US5771295A (en) 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6711266B1 (en) * 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
US6111958A (en) * 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US6173061B1 (en) * 1997-06-23 2001-01-09 Harman International Industries, Inc. Steering of monaural sources of sound using head related transfer functions
WO2000004744A1 (en) 1998-07-17 2000-01-27 Lucasfilm Ltd. Multi-channel audio surround system
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
CA2473343C (en) 2002-05-03 2012-03-27 Harman International Industries, Incorporated Multichannel downmixing device
JP2003333699A (ja) * 2002-05-10 2003-11-21 Pioneer Electronic Corp マトリックス・サラウンドデコード装置
AU2003244932A1 (en) 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
FI118370B (fi) * 2002-11-22 2007-10-15 Nokia Corp Stereolaajennusverkon ulostulon ekvalisointi
ATE368921T1 (de) * 2003-09-29 2007-08-15 Koninkl Philips Electronics Nv Codierung von audiosignalen
US9992599B2 (en) 2004-04-05 2018-06-05 Koninklijke Philips N.V. Method, device, encoder apparatus, decoder apparatus and audio system
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
WO2006008683A1 (en) 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5818941A (en) * 1995-11-22 1998-10-06 Sony Corporation Configurable cinema sound system
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
CN1109407C (zh) * 1998-10-13 2003-05-21 日本胜利株式会社 音频信号的编码、解码方法及音频传输方法
CN1451255A (zh) * 2000-05-10 2003-10-22 数字剧场系统股份有限公司 具有向后兼容性混频的分立式多声道音响

Also Published As

Publication number Publication date
EP2175671A3 (en) 2011-01-12
KR20070039543A (ko) 2007-04-12
JP2011039535A (ja) 2011-02-24
EP2175671B1 (en) 2012-05-09
TW200628002A (en) 2006-08-01
JP5485844B2 (ja) 2014-05-07
ATE526797T1 (de) 2011-10-15
HK1143481A1 (en) 2010-12-31
PL2175671T3 (pl) 2012-10-31
PL1769655T3 (pl) 2012-05-31
WO2006008683A1 (en) 2006-01-26
CN102122508A (zh) 2011-07-13
ES2387256T3 (es) 2012-09-19
ATE557552T1 (de) 2012-05-15
EP1769655B1 (en) 2011-09-28
EP1769655A1 (en) 2007-04-04
JP4898673B2 (ja) 2012-03-21
US8150042B2 (en) 2012-04-03
CN1985544A (zh) 2007-06-20
US8144879B2 (en) 2012-03-27
US20110058679A1 (en) 2011-03-10
JP2008537596A (ja) 2008-09-18
US20070230710A1 (en) 2007-10-04
EP2175671A2 (en) 2010-04-14
ES2373728T3 (es) 2012-02-08
KR101147187B1 (ko) 2012-07-09
TWI462603B (zh) 2014-11-21
CN1985544B (zh) 2010-10-13

Similar Documents

Publication Publication Date Title
CN102122508B (zh) 方法、装置、编码器设备、译码器设备和音频系统
CN1947172B (zh) 方法、装置、编码器设备、解码器设备以及音频系统
CN101160618B (zh) 用于空间音频参数编码的紧凑辅助信息
US9848180B2 (en) Method, medium, and system generating a stereo signal
CN101151658B (zh) 多声道音频编码和解码方法、编码器和解码器
CN101410889B (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
CN101410890B (zh) 用于导出上混参数的参数计算器和方法以及包括该参数计算器的声道重构器和音频接收机
EP1774515B1 (en) Apparatus and method for generating a multi-channel output signal
CN103021417B (zh) 用于可伸缩声道解码的方法和设备
TR201811059T4 (tr) Ses kaynaklarının parametrik birleşik kodlaması.
US20090240505A1 (en) Audio decoding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant