WO1995002925A1

WO1995002925A1 - Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite

Info

Publication number: WO1995002925A1
Application number: PCT/JP1994/001166
Authority: WO
Inventors: Kenzo Akagiri
Original assignee: Sony Corporation
Priority date: 1993-07-16
Filing date: 1994-07-15
Publication date: 1995-01-26
Also published as: EP0669724A1; JP3336618B2; EP0669724A4; US6104321A; CN1113401A; AU7195294A; TW272341B; AU686199B2; KR100339324B1; CN1065382C

Description

明細書高能率符号化方法、高能率符号の復号化方法、高能率符号の符号化装置、高能率符号の復号化装置、高能率符号化 ·復号化システム、及び記録メディア技術分野本発明は、デジタル音声信号の符号化及び又は復号化に関し、特に複数チャンネルのデジタル音声信号について、人間の聴覚特性を利用して高能率符号化及び又は復号化するものに関する。詳しくは、本発明は、放送、通信、映画、ビデオテープレコーダ、又はディスクプレーヤのステレオ音響システム、又は 3チャンネル以上のチヤンネルからなるマルチプル ·サラウンド音響システムに関する。さらに、これらのシステムにおいて使用されるに好適なる、ビット · レートの削減を行う高能率符号化方法と、これに対応する高能率符号の復号化方法、及び高能率符号の復号化再生方法に関する。さらにまた、その高能率符号化方法により符号化された信号を記録する高能率符号化信号記録方法及び記録がなされた記録メディアに関するものである。

さらにまた、その高能率符号化方法により符号化された信号を伝送する高能率符号化信号伝送方法に関するものである。背景技術音楽信号、或いは音声信号等のオーディオ信号の高能率符号化方法及び高能率符号化装置には、多くの技術が知られている。

例えば一^つの方法として、時間領域のオーディオ信号を、時間軸に沿って、所定の単位時間でブロック化し、このブロック毎の時間領域の信号を周波数領域の信号に直交変換する。さらに、複数の周波数帯域にブロック化し、各周波数帯域毎に再量子化 ·符号化する、ブロック化周波数帯域分割方式がある。一般には、変換符号方法

(Transform Coding)と呼ばれる。

この方法は、本発明者及び本出願人による特許出願があり、例えば米国特許明細書第 5， 3 0 1 , 2 0 5号に開示されている。

また別の方法として、時間領域のオーディオ信号を、単位時間毎にブロック化しないで、 20程度の複数の周波数帯域に分割して符号化する非ブロック化周波数帯域分割方法がある。一般には帯域分割符号化（Sub Band Coding ： SBC ) と呼ばれるものが知られている。例えば、米国特許明細書第 4, 8 9 6, 3 6 2号、米国特許明細書 5, 1 0 5, 4 6 3号に開示されている。

また、上述の帯域分割符号化と変換符号化とを組み合わせた高能率符号化の方法及び装置も考えられている。この場合には、上記帯域分割符号化で帯域分割を行った後、各帯域毎の信号を周波数領域の信号に直交変換し、この直交変換された各帯域毎の信号に符号化を施す方法である。

この方法としては、例えば、米国特許明細書第 4, 9 7 2， 4 8 4に開示されている。

ここで、上述した帯域分割符号化の帯域分割用フィルタとしては、例えばクオドラチヤ ' ミラー ' フィルタ（Quarature Mirror Filter: QMF)等のフィルタがある。これは 1976 R. E. Crochiere Digital coding of speech in subbands Bell Syst. Tech. J. Vol.55. No.8 1976において、述べられている。

また ICASSP 83, BOSTON Polyphase Quadrature filters- A new subband coding technique Joseph H. Rothweiler (こ {ま、等ノくンド幅のフィルタ分割方法及び装置が述べられている。

また、上述した直交変換の方法としては、入力オーディオ信号を所定単位時間（フレーム）でブロック化し、ブロック毎に高速フーリエ変換（ Fast Fourier Transform ： FFT ) 、離散コサイン変換 ( Discrete Cosine Transform ： DCT) 、モディファイド離散コサィン変換（Modi f ied Discrete Cosine Transform： MDCT) などを行うことで時間軸を周波数軸に変換する方法が知られている。

本出願の実施例では、直交変換として MDCTを使用し、この MDCTについては.,， ICASSP 1987 Subband/Transf orm Coding Using Fi l ter Bank Des i gns Based on Time Domain Al iasing Cancel lat ion J. P. Princen A. B. Bradley Univ. of Surrey Royal Melbourne Inst. of Tech. に述べられている。

更に、各周波数成分を量子化する場合の周波数分割幅としては、人間の聴覚特性を考慮して帯域分割幅を決めることが有効である。具体的には、クリティカル ·バンドと呼ばれている高域程、帯域幅が広くなるような帯域幅が使用され、 0〜20 kHzのオーディオ信号は複数（例えば 25バンド）の帯域に分割される。

クリティカル ·バンドとは、人間の聴覚特性を考慮して分割された周波数帯域をいい、ある純音の周波数近傍の同じ強さの狭帯域バンドノイズによって、当該純音がマスクされるときのそのノイズの持つ帯域のことである。

また、この時の各帯域毎のデータを符号化する際には、各帯域毎に所定の又は適応的なビット配分（bi t al locat i on)によって決定されたビット量にて、符号化が行われる。例えば、上記 MDCTにより得られた MDCT係数データを符号化する際に、決定されたビット量で符号化が行われることになる。

上記ビット配分に関しては、次の 2つの文献が知られている。

IEEE Transact i ons of Accoust ics, Speech, and Si gnal

Processing, vol. ASSP-25, No. 4, August 1977 では、各帯域毎の信号の大きさをもとに、適応的なビット配分を行う技術が述べられている。

また ICASSP 1980 The cri tical band coder—digi tal encoding of the perceptual requirements of the audi tory system

M. A. Kransner MIT では、聴覚マスキングを利用することで、各帯域毎に必要な信号対雑音比を得て、固定的なビット配分を行う技術が述べられている。

ところで、記録媒体においては記録密度、放送 ·通信においては伝送路容量、又は伝送速度で決まるビット · レートにより、単位時間あたりのビット量に制限がある。そこで、ビット · レートを満たすために、前述したような、高能率符号化方法が使用される。

しかし、上述した従来のビット配分技術は、それぞれ独立に各チヤンネル毎でのビット配分を考慮したものである（以下簡単のため、独立配分： Independent Al locat ion という）。言い換えれば、各チャンネルのビット量は、ある固定量である。よって複数チャンネルの間にまたがるようなビット配分は考慮されていない。

これに対して、先に本発明者は、日本特許出願として平成 5年特許願第 1 5， 4 9 2号及びこの出願に対応る米国特許出願 0 8 Z 1 8 4 , 4 7 1号の明細書及び図面において、複数のチャンネルに使用できる共通のビットを確保しておき、ビットが必要とされるチヤンネルに対して、適当な量のビットを配分することを提案しているこのような方法は、ビット配分が各チャンネル毎に独立していないことから、チャンネル間ビット配分（以下簡単のため、従属配分： Dependent Al locat ion とレヽラ) とレヽラ。

本発明者の先の提案は、共通のビットを確保することで、音質向上には寄与するものであった。しかし、共通のビットを常に確保しておくことは、冗長なことでもある。

通常、複数のチャンネルがある場合、各チャンネルが要求するビット量には、各チャンネルの情報量により、差が生じる。

例えばオーディオ信号がステレオである場合、右チャンネルが要求するビット量が基準の 120%であり、逆に左チャンネルが要求するビット量が基準の 50%であったとする。このような場合、右チヤンネルに許容されるビット量は、基準の 100%迄であり、不足する 20%により、音質劣化を生じる。

これに対して、左チャンネルでは基準の 50%もの余分なビッ卜-量があり、いわゆるオーバー · クオリティとして、冗長な基準の 50% のビット量はその左チャンネルのために使用される。もちろん、冗長なビットは音質向上に寄与するが、人間の聴覚には知覚されない程度の向上に過ぎない。

ところで、この例において、左チャンネルで冗長であった基準の 50%のビット量を、右チャンネルで不足する 20% (以下簡単のため、補助配分： Subs i diary Al locat i onという）のために使用することが考えられる。

これを実現できれば、両チャンネル共、高音質を維持したまま、所定のビット ■ レートを満足することができる。

特に、音楽や映画等のオーディオ信号は、電話と異なり、複数チヤンネルの組により 1つの情報を構成する場合が多い。よって、複数チャンネルの何れかのチャンネルで冗長なビットが発生する場合があり、従属配分が有効であると考えられる。

ところで、この場合、もう一つの別の問題が生じる。すなわち、従来のデコーダ（高能率復号化装置）では、独立配分に基づくェンコ一ド信号が記録された記録媒体を復号するものである。

このため、従属配分により、エンコードされた信号が記録された記録媒体は、従来のデコーダ（復号化装置）では復号できない。

また、従属配分により、エンコードされた信号が記録された記録媒体を復号するための復号化装置が、既に市場にある記録媒体、即ち、独立配分でのみェンコ一ドされた信号が記録された記録媒体をもデコードできなければ、使用者の著しい不利となる。

これに対して、左チャンネルでは基準の 50%もの余分なビット量があり、いわゆるオーバ一 · クオリティとして、冗長な基準の 50% のビット量はその左チャンネルのために使用される。もちろん、冗長なビットは音質向上に寄与するが、人間の聴覚には知覚されない程度の向上に過ぎない。

ところで、この例において、左チャンネルで冗長であった基準の 50%のビット量を、右チャンネルで不足する 20% (以下簡単のため、補助配分： Subsidiary Al locat ionという）のために使用することが考えられる。

これを実現できれば、両チャンネル共、高音質を維持したまま、所定のビット · レートを満足することができる。

ところで、この場合、もう一^ ^の別の問題が生じる。すなわち、従来のデコーダ（高能率復号化装置）では、独立配分に基づくェンコード信号が記録された記録媒体を復号するものである。このため、従属配分により、エンコードされた信号が記録された記録媒体は、従来のデコーダ（復号化装置）では復号できない。

また、従属配分により、エンコードされた信号が記録された記録媒体を復号するための復号化装置が、既に市場にある記録媒体、即ち、独立配分でのみェンコ一ドされた信号が記録された記録媒体をもデコードできなければ、使用者の著しい不利となる。発明の開示そこで、本発明は、従属配分を用いて高音質とした圧縮信号を得ることができる技術を提供することを目的とする。

さらに、この従属配分技術を使用して高音質の再生が可能で、かつ、従来の独立配分が行われていても、復号化の際に大きな音質劣化を生ずること無く再生できるようにする、高能率符号化技術を提案することを目的とする。

さらに、本発明技術による符号化方法、符号化信号の復号化方法の提供を目的とする

さらに、本発明技術による符号化装置、符号化信号の復号化装置、及び符号化装置と復号化装置とからなるシステムの提供を目的とする

さらに、本発明技術による符号化方法、及び符号化装置により形成された符号化信号が記録された記録メディアを提供することを目的とするものである。

さらに、本発明技術による符号化方法、及び符号化装置により形成された符号化信号を伝送する伝送方法、伝送装置を提供することを目的とする。

上述の目的を達成するために提案された本発明に係る高能率符号化方法は、複数チャンネルの信号に対し、複数チャンネルの時間領域でのサンプル ·データ若しくは周波数領域でのサンプル ·データへのチャンネル間で、適応的ビット配分を行う高能率符号化方法である。即ち、一定の基準値よりも大きいビット量を要求するチャンネルへのビット配分を、多くても一定の基準値を越えない第 1のビット配分量と、残りの第 2のビット配分量とに分解する。

第 1のビット配分量は、従来の独立配分時にデータに使用できたビット量に相当する一定の基準値の範囲とし、従来のシステムとの互換性を考慮したものである。

第 2のビット配分量は、従来の独立配分時にデータに使用できたビット量を上 0る部分であり、そのチャンネルの音質を考慮したものである。

本発明の高能率符号化方法は、以下のステップよりなる。

即ち、あるシンク ·ブロック（単位ブロック）において、全チヤンネルの総ビット配分量は、略一定にする。

前記第 1のビット配分量に関するサンプル ·デ一夕のためのスケ —ル · ファクタ及びヮ一ドレングスから、前記第 2のビット配分量に関するサンプル 'データのためのスケール ' ファクタを求める。上記第 1のビット配分量は、サブ情報のためのビット量を考慮した量とされる。

上記第 2のビット配分量は、そのチャンネルが要求するビット配分量から上記第 1のビット配分量を引いた量である。

時間軸と周波数軸とについて細分化された小ブロック中のサンプル，データに対し、前記小ブロック内では同一の量子化を行う。前記小ブロック中のサンプル ·データを得るために、非ブロック化周波数特性の分析を行った後、前記非ブロック化周波数特性の分析の出力を、更にブロック化周波数特性の分析を行う。

前記非ブロック化周波数特性の分析の周、波数帯域幅は、少なくとも最低域の 2帯域で同じである。前記非ブロック化周波数特性の分析は、 PQF (Polyphase Quadrature f i l ter ) である。前記非ブロック化周波数特性の分析の周波数帯域幅は、高域は低域より広くする。なお、前記非ブロック化周波数特性の分析には、 QMF

(Quadrature Mirror f i l ter) をも使用できる。

前記ブロック化周波数特性の分析は、 MDCTである。前記ブロック化周波数特性の分析では、入力信号の時間特性により適応的にプロック 'サイズを変更する。前記ブロック ·サイズの変更は、少なくとも 2つの前記非ブロック化周波数特性の分析の出力毎に独立に行ラ

各チャンネルの前記第 1のビット配分部分と、前記第 2のビット配分部分との和は、各チャンネルのスケール ' ファクタ又はサンプル ·データの最大値により変化する。

従属配分は、各チャンネルの信号のエネルギ値、ピーク値又は平均値等の振幅の時間的変化により、変化する。または、各チャンネルのスケール，ファクタの時間的変化により、変化する。

補助配分に使用できるビット量は、最大でも他のチャンネルの余剰ビッ卜の合計ビット量である。

次に、本発明の高能率符号の復号化方法は、符号化時に、複数チヤンネルの信号に対し、複数チャンネルの時間領域若しくは周波数領域でのサンプル ·デ一夕への適応的従属配分が行われた符号化信号を、復号化するための高能率符号の複号化方法である。上記符号化時には、一定の基準量よりも大きいビット量が配分されるチャンネルへのビット配分量を、多くても前記一定の基準量を越えない第 1のビット配分量と残りの第 2のビット配分量に分解していることを特徵としいてる。

ここで、本発明の高能率符号の復号化方法は、以下に示すようにすることも可能である。

前記第 1のビット配分量と前記第 2のビット配分量との合計の全チャンネルについての総ビット量は略一定である。前記第 2のビット配分量に関するサンプル ·データのためのスケール · ファクタは、前記第 1のビット配分量に関するサンプル 'データのためのスケール。ファクタおよぴヮ一ドレングスから求める。

上記第 1のビット配分量は補助配分ビットを含まないビット配分量であり、上記第 2のビット配分量は補助配分ビットを含むビット配分量である。

時間軸と周波数軸とについて細分化された小ブロック中の同一の量子化を行ったサンプル ·データを、復号化する。前記小ブロック中のサンプル 'データを、ブロック化周波数合成した後、前記プロック化周波数合成の出力を非ブロック化周波数合成の入力とし、非ブロック化周波数合成の出力を得る。前記非ブロック化周波数合成の周波数帯域幅が少なくとも最低域の 2帯域で同じである。

前記非ブロック化周波数合成は、 P Q Fである。前記非ブロック化周波数合成の周波数帯域幅は、高域は低域より広く設定される。前記非ブロック化周波数合成は、 QMF とすることもできる。前記ブロック化周波数合成は逆 MDCTである。前記ブロック化周波数合成では、入力信号の時間特性により適応的にそのブロック ·サイズを変更する。前記ブロック ·サイズの変更は、少なくとも 2つの前記非ブロック化周波数合成の入力帯域毎に独立に行う。

各チャンネルの前記第 1 のビット配分量と、前記第 2のビット配分量との和が略各チャンネルのスケール · ファクタ又はサンプル最大値により決定されている。また、複数のチャンネルを持ち、一定の基準量よりも大きいビット量が配分されたチャンネルの検出を、チャンネルへの配分ビット量が前記一定の基準量より小さい第 2の基準量よりも大きいか等しいことを検出することにより行う。

また、本発明の高能率符号の復号化再生方法は、一つのシンク · ブロック（連続信号を所定時間単位でブロック化したもの）の中に分離して記録され取り出された、少なくとも 2つのサンプル ·プロック群よりなる。即ち、複数チャンネルのための一定の基準量よりも大きいビット量を配分する第 1 のビット配分のサンプル群と、複数チャンネルのための前記第 1のビット配分サンプル群の残りの第 2のビット配分のサンプル群とよりなる。

ここで、各チャンネルでは、各チャンネルの一定の基準量よりも大きいビット量を配分する第 1のビット配分サンプル群と、当該第 1のビット配分サンプル群の残りの第 2のビット配分サンプル群とから復号再生を行う。

次に、本発明の高能率符号化信号記録方法は、一つのシンク -ブロックの中に、複数チャンネルのための一定の基準量よりも大きいビット量を配分する第 1のビット配分サンプル群と、複数チャンネルのための前記第 1のビット配分サンプル群の残りの第 2のビット配分サンプル群とを分離して記録することを特徴とする。

さらに一^ Dのシンク ·ブロックの中では、上記第 1のビット配分サンプル群と、上記第 2のビット配分サンプル群とが、各チャンネル毎に交互に記録される。

また、本発明の記録メディアは、本発明の高能率符号化方法により符号化した信号を記録してなるものである。

この記録メディアは、映画フィルムであり、ディスクであり、テーブであり、さらには半導体メモリーを内蔵した力一ドである。すなわち、本発明では、従属配分のための補助配分ビットの含まれたビット配分と、補助配分ビッ卜の含まれないビット配分を求めるようにしている。上記補助配分ビットの含まれないビット配分は、各チャンネル毎に独立に求められ、概略チャンネル毎に一定のビット配分量を持つ。

ここで、上記補助配分ビットの含まれたビット配分量が、補助配分ビットの含まれないビット配分量よりも大きいチャンルについては、補助配分された時間領域もしくは周波数領域の情報サンプルを、補助配分ビットの含まれないビット配分に基づく情報サンプル ( A ) と残りの情報サンプル（B ) とに分割する。

前記残りの情報サンプル（B ) は、補助配分ビットの含まれたビット配分に基づく情報サンプル（C ) と補助配分ビットの含まれないビット配分に基づく情報サンプル（A ) との差の大きさを持つ情報サンプルとして求める。

一方、補助配分ビットを含むビット配分量が、補助配分ビットを含まないビット配分量と同じかそれよりも小さいチャンネルについては、補助配分ビットされた時間領域もしくは周波数領域のサンプル情報（C ) を、そのチャンネルのビット配分として用いる。

この事により、独立配分のみでビット配分が行われた符号化信号を復号化するデコーダを用いた場合に、当該デコーダでは、補助配分ビットの含まれたビット配分量が補助配分ビットの含まれないビット配分量よりも大きいチャンネルについては、補助配分ビットの含まれないビット配分に基づく情報サンプル（A ) を再生する。逆に、補助配分ビットの含まれたビット配分量が、補助配分ビットの含まれないビット配分量と同じかそれよりも小さいチャンネルについては補助配分された情報サンプル（C ) を再生すればよいことになる。

また、完全な再生をする場合、補助配分ビットの含まれたビット配分量が補助配分ビットの含まれないビット配分量よりも大きいチヤンネルについては、補助配分ビットされたサンプル情報を、補助配分ビットの含まれないビット配分に基づく情報サンプル（A ) と、残りの情報サンプル（B ) との両者を用いて、より高音質な再生音を再生することができる。そのためには情報サンプル（A ) と情報サンブル（B ) とをそれぞれデコードしたものを加算すればよいまた、前記情報サンプル（A ) のビット配分量と前記情報サンプル（B ) のビット配分量の合計の全チャンネルについての総ビット配分量を概略一定とする事により、ビット · レートが一定であることが望まれる記録メディア上への記録を可能にする事ができる。以上の場合に、前記情報サンプル（B ) のビット配分に関するサンプル ·データの正規化の為のスケール · ファクタを、前記情報サンプル（A ) のサンプル ·データの為のスケール · ファクタおよびワードレングスから求めることにより、前記情報サンプル（B ) のビット配分に関するスケール ' ファクタをェンコ一ド側からデコ一ド側に送付することなく、デコード側で発生でき、したがって、記録ゃ伝送に必要な情報量を低減することができる。

また、補助配分ビットの含まれないビット配分に基づくサンプル情報（A ) を得るために、四捨五入処理を含む量子化を行うことは量子化雑音の低減のために有効である。

更に前記情報サンプル（B ) の為のビット配分を行ったチャンネルがどれかをデコーダ側が知るためには、チャンネルへのビット配分量が前記一定の基準量より小さい第 2の基準量よりも大きいことにより行う事はェンコ一ド側からデコード側に専用のデータを送付する必要がなく有益である。

また、本発明では、時間軸と周波数軸とについて細分化された小ブロック中のサンプルに対し、当該小ブロック内では同一の量子化を行うようにしている。前記小ブロック中のサンプルを得るためには、フィルタなどの非ブロック化周波数特性の分析を行った後、当該フィルタなどの非ブロック化周波数特性の分析の出力を直交変換等のブロック化周波数特性の分析を行う。

この時、前記非ブロック化周波数特性の分析の周波数帯域幅が少なくとも最低域の 2帯域で同じであることはコストを低減するうえで役に立つ。また、前記非ブロック化周波数特性の分析の.周波数帯域幅が高域が低域より広いことは、臨界帯域に基づく聴覚の効果を利用するうえで重要である。

前記ブロック化周波数特性の分析は、入力信号の時間特性により適応的にそのブロック ·サイズを変更することにより入力信号の時間特性に対応した最適な処理が可能となる。前記ブロック 'サイズの変更を少なぐとも 2つの前記非ブロック化周波数特性の分析の出力帯域毎に独立に行うことは、周波数成分の間の相互干渉を防いで各帯域成分独立に最適な処理を行うえで効果的である。

さらに各チャンネルに与えられるビット配分量は、各チャンネルのスケール · ファクタまたはサンプル最大値により決めるのは、演算を低減させるうえで効果的である。

またこれに加えて、各チャンネルのスケール · ファクタで代表される振幅情報の時間的変化により各チャンネルに与えられるビット配分量を変化させることも、量子化雑音を検知し難くするうえで有益である。更にシンクの為の情報を含むひとつのシンクブロックの中に、複数チャンネルの為の前記第 1のビット配分サンプル群と複数チャンネルの為の前記第 2のビット配分サンプル群とを分離して sd^する。

本発明によれば、複数チャンネルの信号に対し、一定の基準量よりも大きいビット量を配分するチャンネルへのビット配分量を、多くても一定の基準量を越えない第 1のビット配分量と残りの第 2のビット配分量に分解し、複数チャンネルの時間領域でのサンプル若しくは周波数領域でのサンプル ·データへのチャンネル間で可変ビット配分を行うようにすることにより、従属配分を利用した高音質再生が可能となる。さらに、通常良く使われる各チャンネル個別に固定値以下のビット · レートを用いてチャンネル毎で周波数領域及び時間領域での適応ビット配分技術が適用されるデコーダでも大きな音質劣化無く再生できるようにすることができる。従って、互換性を保ち、異なる記録メディア間での情報の授受が可能となる。

また特に映写装置では、各チャンネル別に固定値以下のビット · レートを用いて、各チャンネル毎で周波数領域及び時間領域での適応ビット配分技術を使用するデコーダを用いることが可能となる。したがって高品質の音質を必要とするオーディオシステムや映画の音声記録再生に好適なシステムを与えることができる。

この時に、前記第 2のビット配分量に関するサンプル 'データの為のスケール · ファクタを、前記第 1のビット配分量に関するサンプル ·データの為のスケール · ファクタおよびワードレングスから求めることにより、前記第 2のビット配分に関するサンプル ·デー夕の為のスケール · ファクタをェンコ一ド側からデコ一ド側に送付することなくデコ一ド側で作り、記録や伝送に必要な情報量を低減することができる。

更に多くても前記一定の基準量を越えない補助配分ビットの含まれないビット配分である第 1のビット配分量のビット量が、前記一定の基準量より小さい第 2の基準量よりも大きいことにより、前記第 2のビット配分を行ったチャンネルをデコード側が知る事は、ェンコード側からデコード側に専用のデータを送付する必要がなくな補助配分ビットの含まれないビット配分に基づくサンプル情報を得るために四捨五入処理を含む量子化を行うことは、各チャンネル別に固定値以下のビット · レートを用いてチャンネル毎に周波数領域及び時間領域での適応ビット配分技術を使用するデコードにおいて、量子化雑音の低減のために有効である。

さらに、時間軸と周波数軸とについて細分化された小ブロック中のサンプルを得るために、フィルタなどの非ブロック化周波数特性の分析を行つた後、このフィル夕などの非ブロック化周波数特性の分析の出力を直交変換等でブロック化周波数特性の分析する事により、時間領域、周波数領域で聴覚マスキングを生かした量子化雑音の求め方が可能となり、聴覚上好ましい周波数特性の分析を得ることが可能となる。

この時、前記非ブロック化周波数特性の分析の周波数帯域幅が少なくとも最低域の 2帯域で同じであることはコストを低減するうえで役に立つ。

前記非ブロック化周波数特性の分析の周波数帯域幅を少なくとも最高域で高域程広くすることにより臨界帯域に基づく聴覚の効果を効率的に利用することが可能となる。前記ブロック化周波数特性の分析は入力信号の時間特性により適応的にそのブロック ·サイズが変更されることにより入力信号の時間特性に対応した最適な処理が可能となる。

前記ブロック ·サイズの変更を少なくとも 2つの前記非ブロック化周波数特性の分析の出力帯域ごとに独立に行うことは、周波数成分の間の相互干渉を防いで各帯域成分独立に最適な処理を行うえで効果的である。

補助配分ビットの際には、各チャンネルのスケール ' ファクタによって計算することによりそのビット配分計算の簡易化が図られる

図面の簡単な説明図 1は、本発明に係る高能率符号化装置の構成例を示すブロック回路図である。

図 2 A及び図 2 Bは、本発明に係る高能率符号化装置における信号の周波数及び時間分割を示す図である。

図 3は、本発明に係る高能率符号化装置のマルチチャンネルでのビット配分用パラメ一夕を求める構成の一例を示すブロック回路図である。

図 4 A〜図 4 Hは、チャンネル間でスぺクトルの大きさからビット配分を行う概念を示す図である。

図 5 A〜図 5 Hは、チャンネル間での信号の時間特性を考慮したビット配分の為のパラメータの求め方を示す図である。

図 6は、ビット配分（1) のビット配分量とトーナリティとの間の関係を示す図である。

図 7は、ビット配分（1) のビット配分量と時間変化率との間の関係を示す図である。

図 8は、均一配分の時のノイズスぺクトルを示す図である。図 9は、信号の周波数スぺクトル及びレベルに対する依存性を持たした聴覚的な効果を得るためのビット配分によるノイズスぺクトルの例を示す図である。

図 1 0は、信号の大きさ及び聴覚許容雑音スペクトルの 2者を用いたビット配分方法を実現する構成を示すブロック回路図である。図 1 1は、許容雑音レベルを求める構成を示すブロック回路図であ o

図 1 2は、各帯域の信号レベルによるマスキング ·スレシヨールドの例を示す図である。

図 1 3は、情報スぺクトル、マスキング ·スレショールド、最小可聴限を示す図である。

図 1 4は、トーナリティが低い信号に対する信号レベル依存および聴覚許容雑音レベル依存のビット配分を示す図である。

図 1 5は、トーナリティが高い信号に対する信号レベル依存および聴覚許容雑音レベル依存のビット配分を示す図である。

図 1 6は、トーナリティが低い信号に対する量子化雑音レベルを示す図である。

図 1 7は、トーナリティが高い信号に対する量子化雑音レベルを示す図である。

図 1 8 A及び図 1 8 Bは、マルチチャンネルにおけるビット配分の関係を示す図である。

図 1 9は、第 1 と第 2の量子化回路の関係を示すブロック回路図である。

図 2 0は、シンク ·ブロックへのデータの配列を模式的に示す図である。

図 2 1は、本発明に係る高能率符号の復号化装置の構成例を示すブロック回路図である。

図 2 2は、本発明に係る高能率符号化方法のビット配分のフローチヤ一トである。発明を実施るための最良の形態以下、本発明の高能率符号化方法が適用される高能率符号化装置 (エンコーダ）と、本発明の高能率符号の復号化方法（高能率符号の復号化再生方法）が適用される高能率符号の復号化装置（デコ一ダ）の実施例について、図面を参照しながら説明する。

本実施例では、オーディオ P C M信号等の入力ディジ夕ル信号を、帯域分割符号化（S B C ) 、適応変換符号化（A T C ) 及び適応ビット配分にて（A P C— A B ) の各技術を用いて高能率符号化する。この技術について、図 1を参照しながら説明する。

図 1は、本発明が適用される実施例の高能率符号化装置を示す。概要は、時間領域の入力ディジタル信号を QMF により複数の周波数帯域に分割し、各周波数帯域毎に直交変換を行って周波数領域のスぺクトル ·データとし、得られたスぺクトル ·データを、クリテイカル ·バンド毎に適応的にビット配分して符号化する、高能率符号化装置である。

この時、高域ではクリティカル ·バンドを更に分割した帯域を用いる。もちろん QMF による非ブロッキングの周波数分割幅は、等分割幅としてもよい。

さらに、本発明実施例においては、直交変換の前に入力信号に応じて、適応的にブロック ·サイズ（ブロック長）を変化させると共に、クリティカル ·バンド単位、もしぐは高域ではクリティカル · バンドを更に細分化した帯域でフローティング処理を行っている。フローティング処理とは、複数のデータ値を 1の指標に基づき正規化する処理をいう。

さらに図 1の高能率符号化装置を詳細に説明する。入力端子 1 0には例えば 0〜22 kHzのオーディオ P CM信号が供給されている。通常のオーディオ帯域は、 0〜20 kHzで充分とされるが、 22 kHzまで高域を拡張することで、より高品位のオーディオ信号を扱う。

この入力信号は、まず QMF で構成されるの帯域分割フィルタ 1 1 により、 0〜11 kHz帯域と 11 k〜22 kHz帯域とに分割される。更に 0〜11 kHz帯域の信号は、同じく QMF で構成されるの帯域分割フィル夕 1 2により、 0〜5.5 kHz 帯域と 5.5. k〜ll kHz帯域とに分割される。

帯域分割フィルタ 1 1、 1 2からのそれぞれの帯域の信号は、直交変換回路である MDCT回路 1 3〜 1 5に送られることにより、それぞれ MDCT係数に変換される。なお、各 MDCT回路 1 3〜 1 5では、各帯域毎に、ブロック決定回路 1 9〜2 1により決定されたブロック •サイズに基づいて MDCTされる。

ここで、上記ブロック決定回路 1 9〜2 1により決定される各 MDCT回路 1 3〜 1 5でのブロック ·サイズの具体例を図 2 A及び図 2 Bに示す。なお、図 2 Aには直交変換ブロック ·サイズが時間軸で長い場合（ロング 'モードという）を、図 2 Bには直交変換ブロック 'サイズが時間軸で短い場合（ショート ·モードという）を示ししている。

この図 2の具体例においては、上記 3つのフィルタ出力は、それぞれ 2つの直交変換ブロック ·サイズを持つ。

すなわち、図 2 Aに示すように長いブロック長（11.6msec) の場合、低域側の 0〜5.5 kHz帯域の信号及び中域の 5.5 k〜llkHz帯域の信号に対しては、 1ブロック内のサンプル数を 128サンプルとする。これに対して、図 2 Bに示すように短いブロック長

(2.9msec ) の場合には、 1ブロック内のサンプル数を 32としている o

なお、高域側の llk〜22kHz帯域の信号に対しては、長いブロック長の場合（図 2 A ) は、 1ブロック内のサンプル数を 256サンプルとし、短いブロック長（1. 45msec) の場合（図 2 B ) には、 1ブロック内のサンプル数を 32サンプルとしている。

このようにして短いブロックが選ばれた場合には、各帯域の直交変換ブロックのサンプル数を同じにして高域程時間分解能を上げ、なおかつ MDCTのためのウインドウの種類を減らしている。

なお、上記ブロック決定回路 1 9〜2 1で決定されたブロック · サイズを示す信号は、各 MDCT回路 1 3〜 1 5に供給されてそのウインドウが切り換えられ、また後述の適応ビット配分符号化回路 1 6 〜 1 8に送られると共に、出力端子 2 5〜2 7から出力され、記録 •伝送のために使用される。

再び図 1において、各 MDCT回路 1 3〜 1 5にて MDCT処理されて得られた周波数領域のスぺクトル ·デ一夕である MDCT係数データは、クリティカル ' ノくンドまたは高域では更にクリティカル ·バンドを分割した帯域毎にまとめられて、適応ビット配分符号化回路 1 6〜 1 8に送られている。

適応ビット配分符号化回路 1 6〜 1 8では、上記ブロック ·サイズの情報、及びクリティカル ·バンド毎または高域では更にクリテイカル ·バンドを分割した帯域毎に、割り当てられたビット量に応じて各 MDCT係数データを正規化及び再量子化する。

この時、適応ビット配分符号化回路 1 6〜 1 では、各チャンネルに指定されたビット量を上限として、各ブロック毎にビット量の配分を行う。

各チャンネルのスぺクトル分布を示すデジタル信号（M D C T係数）が適応ビット配分回路 3 0へ端子 2 9を介して供給され、一方、適応ビット配分回路 3 0からは、各チャンネルのブロックで使用できるビット量が、端子 2 8を介して適応ビット配分符号化回路 1 6〜 1 8に供給される。

このようにして、所定のビット量にて符号化されたデータは、出力端子 2 2 〜 2 4を介して取り出される。同時に、当該適応ビット配分符号化回路 1 6 〜 1 8からは、正規化に関するスケール · ファクタ信号と、どのヮ一ド長で再量子化がされたかを示すヮード長信号が得られ、これらの信号もサブ情報として、出力端子 2 2 〜 2 4 から出力される。

また、図 1における各 MDCT回路 1 3 〜 1 5の出力は、上記クリテイカル ·バンドまたは高域では更にクリティカル ·バンドを分割した帯域毎のエネルギを、当該帯域毎の各振幅値の 2乗平均の平方根を計算すること等により求められる。

もちろん、上記エネルギの代わりに、上記スケール · ファクタそのものを以後のビット配分の為に用いるようにしてもよい。この場合にはエネルギ計算の演算が不要となるため、ハード規模の節約となる。また、各バンド毎のエネルギの代わりに、振幅値のピーク値、平均値を用いることも可能である。

次に、上記ビット配分を行うための適応ビット配分回路 3 0の具体的な構成及び動作を、図 3を用いて説明する。なお、この図 3の例では、映画を例として、オーディオ信号のチャンネル数を 8 ( CH 1 〜CH8 ) としている。

この図 3において、各チャンネルで共通の部分については、チヤンネル CH1 を用いて説明する（他のチャンネルについては同一の指示符号を付して説明は省略している）。

各チャンネルからの入力信号は、対応する各チャンネルの入力端子 3 1に供給される。なお、この端子 3 1は、図 1の端子 2 9と対応している。この入力信号はマッピング回路（Mappi ng) 3 2により入力信号の周波数分析（スぺクトル分布）が得られる。

ここでマッピング回路として、フィルタを使用する場合には、サブバンド信号として時間領域サンプル ·データが得られることになり。また直交変換を使用する場合及びフィルタリング後に直交変換を使用する場合には、周波数領域サンプル ·データが得られることになる。

これらのサンプル 'データは、ブロッキング（Blocking)回路 3 3 によって複数サンプル ·データ毎にまとめられる。前述のように、フィルタを使用した場合には時間領域の複数サンプルがまとめられることになり、直交変換及びフィルタリング後に直交変換を使用した場合には、周波数領域の複数サンプルがまとめられることになるまた、本実施例では、入力信号に応じて逐次マッピングされるサンプルデータの時間変化（V) を、時間変化算出回路 3 4により算出する。入力信号の過渡的変化を、ビット配分に反映させることにより、より高品位な信号が得られる。

上記ブロッキング回路 3 3により複数のサンプル毎にまとめられた各サンプルは、正規化回路 3 7で正規化される。ここで、正規化のための係数であるスケール■ ファクタ（SF)は、スケール · ファク夕算出回路 3 5によって得られる。複数のサンプルに 1の共通するスケール · ファクタを使用することで、デジタル信号を効率的に圧縮する

同時にトーナリティが、トーナリティ算出回路 3 6で算出される。トーナリティ（T) とは、入力信号のスペクトル分布の起伏を示し、起伏が大きい入力信号をトーナリティが高い信号という。詳紬は後述する。

以上で求まるサンプルデータの時間変化（V) 、スケール . ファク夕（SF)及びトーナリティ（T) 等のパラメ一夕は、ビット配分回路 3 8でビット配分計算のために使用される。

ビット配分計算は、基本的には入力信号に応じた適応的ビット配分である。さらに詳細には、各チャンネルの入力信号のスペクトル分布や過渡特性に応じた独立配分と、各チャンネル間の相関を利用した従属配分とがある。更に各チャンネルの重要度 ·使用目的 ·信号の帯域幅等により配分に調整が加えられる。ここで、 MDCT係数を表現して伝送または記録に使えるビット量を、全チャンネルで 800kbpsとすると、本実施例のビット配分回路 3 8では、従属配分ビットを含む第 1のビット配分（第 1のビット配分量）と、従属配分ビットを含まない第 2のビット配分（第 2のビット配分量）の 2つを求める。

これらのビット配分が、各チャンネルに端子 3 9 (図 1では端子 2 8 ) を介して、適応ビット配分符号化回路に供給される。

先ず、従属配分ビットを含む第 1のビット配分について説明する。ここでは、スケール · ファクタ（SF)の周波数領域の分布をみて適応的にビット配分を行う。

この場合、全チャンネルのスケール · ファクタ（SF)の周波数領域の分布に応じて、従属配分を行うことで、有効なビット配分を行うことが可能である。

このとき、複数チャンネルの信号情報が、スピーカにより再生される場合のように、同一音場のなかで混合されて左右の耳に達する場合を考える。この場合、全チャンネル信号が加算されたものによりマスキング効果が作用すると考えられる。

したがって、図 4 A、図 4 Hに示すように、同一帯域において各チャンネルが同一のノイズ · レベルになるようにビット配分を行うことが有効である。

なぜならば、あるチャンネルが他のチャンネルに比べてのノイズ • レベルが大きい場合は、そのチャンネルでノイズとして知覚されてしまうからである。またあるチャンネルを他のチャンネルに比べてのノイズ · レベルを小さくしても、結局は、他のチャンネルのノィズ . レベルで全体のノイズ . レベルが決まるからである。

このための 1方法としてはスケール · ファクタ指標の大きさに比例したビット配分を行えばよい。すなわち、以下の式にようてビット配分を行う。

B m = B * (∑S F n ) / S t St =∑ (∑ S F n)

ここで、 Bmは各チャンネルへのビット配分量、 Bは全チャンネルへのビット配分量、 S F nはスケール · ファクタ指標であり、概略ピーク値の対数に対応している。 nは各チャンネル毎のブロック • フローティングバンド番号、 mはチャンネル番号、 St は全チヤンネルのスケール · ファクタ指標の和である。なお、図 4 A、図 4 Hでは、チャンネル CH1 とチャンネル CH8 のみ示しチャンネル CH2 〜CH7 については図示を省略している。

以上に加えて、ビット配分回路 3 8は、各チャンネルの信号の時間変化特性（V) を検出して、この指標によって独立配分量を変えるプロセスを持つ。この時間変化を表す指標を求める方法を、図 5 A 〜図 5 Hにより説明する。

図 5 A〜図 5 Hに示すように、チャンネルが 8チャンネルあるとすると、それぞれのチャンネルの情報入力信号について、ビット配分の時間単位であるビット配分時間ブロックを時間的に 4分割し、それぞれの小時間ブロック（サブブロック）のピーク値を得る。そして各サブブロックのピーク値が小から大へと変わるところの差分の大きさに応じてチャンネル間でビットを分け合う。ここで、このビット配分のために 8チャンネル合計で Cbit 使えるとしたとき、各チャンネルの各サブブロックのピーク値が小から大へと変わるところの差分の大きさがそれぞれ a (図 5 A) 、 b (図 5 B) 、 • · · · h (図 5 H) デシベル（dB) とすると、それぞれ

C * aZT、 C * bZT、、 C * hZTビット（bit )

(ここで、 T= a +b + c + d + e + f + g+hである）と配分することができる。

ピーク値の変化が大である程、そのチャンネルに対してのビット配分量を大きくする。なお、図 5 A〜図 5 Hには、チャンネル CH1 、 CH2、 CH8 に対応する図 5 A、図 5 B、図 5 Hのみ示し、チャンネル CH3 〜CH7 に対応する図 5 C〜図 5 Gについては省略している次に、従属配分ビットを含まない第 2のビット配分方法について説明する。第 2のビット配分方法として、更に 2つのビット配分方法について説明する。

この 2つのビット配をそれぞれビット配分（2-1) とビット配分 (2-2) とする。以下のビット配分では各チャンネルに割り当てるビット量は、各チャンネルで固定された値とする。

例えば、 8チャンネルの内で音声など重要部分を担う 2つのチヤンネルには 147kbpsという比較的大きいビットを割り当て、サブゥーハ—チャンネルには高々 2kbps、それ以外のチャンネルには

100kbpsを割り当てておく。

先ず、ビット配分（2-1) に使うべきビット量を確定する。そのためには、信号情報（a) のスぺクトル情報のうち、トーナリティ情報（T) 及び信号情報（b) の時間変化情報（V) を使用する。

ここで、トーナリティ情報（T) について説明すると、信号スぺクトルの隣接値間の差の絶対値の和を、信号スペクトル数で割った値を、指標として用いている。より簡単にはブロック ' フローテイングの為のブロックごとのスケール . ファクタの、隣接スケール · ファクタ指標の間の差の平均値を用いる。スケール · ファクタ指標は、概略スケール · ファクタの対数値に対応している。

本実施例では、ビット配分（2-1) に使うべきビット量を、このトーナリティを表す値に対応させて最大 80kbps、最小 10kbpsに設定する。ここでは簡単のために、全チャンネルそれぞれの割当を等しく 100kbpsとしている。

ト一ナリティ計算は次式のように行う。

Τ= ( 1 /WLma x) (∑AB S (S F n - 1 ) )

なお、 WLm a xはワードレングス最大値 =16、 S F nはスケ一ル · ファクタ指標で概略ピーク値の対数に対応している。 nはプロック · フローティングバンド番号である。このようにして求められたトーナリティ情報（T) とビット配分（2

-1) のビット配分量とは、図 6に示すように対応付けられる。

これと共に本実施例においては、ビット配分（2-1) とそれに付加するその他の少なくとも 1つのビット配分との分割率は、信号の時間変化特性（V) に依存する。本実施例では、直交変換時間ブロック •サイズを更に分割した時間区間毎に、信号情報のピーク値を隣接ブロック毎に比較している。このことにより、時間軸及び周波数軸の 2次元で比較して、信号の振幅が急激に大きくなる部分を検出し、その状態により分割率を決定している。

時間変化率計算は次式のように行う。

V t =∑ Vm

V a v= UZVma x) * ( 1 /C h) V t

ここで、 V tは各チャンネルの時間サブブロックのピーク値の小から大への変化を dB値で表しもののチャンネルに関する和、 Vmは各チャンネルの時間サブブロックのピーク値の小から大への変化を dB値で表しもので一番大きいものの大きさ（但し最大値を 30dBに制限し Vma xであらわす。 mはチャンネル番号、 Chはチャンネル数、 V a Vは時間サブブロックのピーク値の小から大への変化を dB 値で表しもののチヤンネル平均である。

このようにして求められた時間変化率 Va Vとビット配分（2 - 1) の配分量とは、図 7に示すように対応付けられる。最終的にビット配分（2-1) への配分量は次の式で求められる。

B= 1/2 (B f +B t)

ここで、 Bは最終的なビット配分（2-1) への配分量、 B f は Tv aより求められたビット配分量、 B tは V a Vより求められたビット配分量である。

ここでのビット配分（2-1) はスケール · ファクタに依存した周波数、時間領域上の配分がなされる。

このようにしてビット配分（2-1) に使用されるビット量が決定されたならば、次にビット配分（2-1) で使われなかったビットについての配分、即ちビット配分（2-2) を決定する。ビット配分（2-2) では、以下に示す様々なビット配分が行われる。

第 1に、ビット配分（2-2) で使用できるビットの一部を使用して、全てのサンプル値に対する均一配分を行う。

この場合の量子化雑音スぺク:トルの一例を図 8に示す。この場合、雑音レベルは全周波数帯域で均一に低減する。即ち、第 1のビット配分でのノイズ · レベル（点線 N L 1 ) が、均一配分により、点線 N L 2で示すノイズ · レベルに均一に低減する。

このような均一配分は、入力信号がトーナリティの低い、滑らかな信号であるときに有効である。

第 2に、ビット配分（2-2) で使用できる残りビットを使用して、信号情報の周波数スぺクトル及びレベルに対する依存性を持たせた、聴覚的な効果を得るためのビット配分を行う。

この場合のビット配分に対する量子化雑音スぺクトルの一例を図 9に示す。この例では信号のスぺクトルに依存させたビット配分を行っていて、特に信号のスぺクトルの低域側にウェイトをおいたビット配分を行い、高域側に比して起きる低域側でのマスキング効果の減少を補償している。これは隣接臨界帯域間でのマスキングを考慮して、スぺクトルの低域側を重視したマスキングカーブの非対象性に基づいている。

このように、図 9の例では低域を重視したビット配分が行われている。即ち、第 1のビット配分でのノイズ · レベル（点線 N L 1 ) が、上記周波数スぺクトル及びレベルに対する依存性を持たせた聴覚的な効果を得るためのビット配分により、点線 N L 2で示すノィズ · レベルに低減する。

なお、図 8、図 9の図中 S Sで示した太線は、信号スぺクトルのピークをつなげたものを示す。

そして最終的にビット配分（2-1) とビット配分（2- 2) に付加されるビット配分との和が、図 3のビット配分回路 3 8で得られる。最終的なビット配分は以上の各ビット配分の和として与えられる。次に従属配分ビットを含まないビット配分の別の方法を次に説明する。

この場合の適応ビット配分回路 8 0 0の動作を図 1 0で説明する図 1 0の実施例では、入力信号は MDCT回路 1 3〜 1 5の出力 (MDCT係数）の和として与えられる。 MDCT係数は、入力端子 8 0 1 に供給される。当該入力端子 8 0 1に供給された MDCT係数は、帯域毎のエネルギ算出回路 8 0 3に与えられる。帯域毎のエネルギ算出回路 8 0 3では、クリティカル ·バンドまたは高域においては、クリティカル ·バンドを更に再分割したそれぞれの帯域に関する信号エネルギを算出する。帯域毎のエネルギ算出回路 8 0 3で算出されたそれぞれの帯域に関するエネルギは、エネルギ依存ビット配分回路 8 0 4に供給される。

エネルギ依存ビット配分回路 8 0 4では、使用可能総ビット発生回路 8 0 2からの使用可能総ビット、本実施例では 128kbpsのある割合、例えば 100kbpsを用いて白色の量子化雑音を作り出すようなビット配分を行う。このとき、入力信号のトーナリティが高いほど、すなわち入力信号のスペクトルの凸凹が大きいほど、このビット量が上記 128kbpsに占める割合が増加する。

なお、入力信号のスペクトルの凸凹を検出するには、隣接するブロックのブロック . フローティング係数の差の絶対値の和を指標として使う。そして、求められた使用可能なビット量につき、各帯域のエネルギの対数値に比例したビット配分を行う。

聴覚許容雑音レベルに依存したビット配分算出回路 8 0 5は、まず上記クリティカル ·バンド毎に分割されたスぺクトル 'データに基づき、いわゆるマスキング効果等を考慮した各クリティカル ·バンド毎の許容ノイズ量を求める。次に聴覚許容雑音スぺクトルを与えるように使用可能総ビットからエネルギ依存ビットを引いたビット分が配分される。このようにして求められたエネルギ依存ビットと聴覚許容雑音レベルに依存したビットは加算されて、ビット配分信号として、出力端子 8 0 7から出力される。

ビット配分信号は、図 1の適応ビット配分符号化回路 1 6〜 1 8 において、各クリティカル ·バンド毎もしくは高域においてはクリティカル ·バンドを更に複数帯域に分割した帯域に割り当てられたビット量に応じて、各スペクトル ·データ（あるいは MDCT係数デ一夕）を再量子化するようにしている。このようにして符号化されたデータは、図 1の出力端子 2 2〜2 4を介して取り出される。

さらに詳しく上記聴覚許容雑音スぺクトル依存のビット配分回路 8 0 5中の聴覚許容雑音スぺクトル算出回路について説明すると、 MDCT回路 1 3〜 1 5で得られた MDCT係数が上記許容雑音算出回路に与えられる。

図 1 1は上記許容雑音算出回路をまとめて説明した一具体例の概略構成を示すブロック回路図である。この図 1 1において、入力端子 5 2 1には、 MDCT回路 1 3〜 1 5からの周波数領域のスぺクトル •データが供給されている。

この周波数領域の入力データは、帯域毎のエネルギ算出回路 5 2 2に送られて、上記クリティカル ·バンド（臨界帯域）毎のエネルギが、例えば当該バンド内での各振幅値 2乗の総和を計算すること等により求められる。この各バンド毎のエネルギの代わりに、振幅値のピーク値、平均値等が用いられることもある。このエネルギ算出回路 5 2 2からの出力として、例えば各バンドの総和値のスぺクトルは、一般にバークスぺクトルと称されている。図 1 2はこのような各クリティカル 'バンド毎のバークスぺクトル S Bを示している。ただし、この図 1 2では、図示を簡略化するため、上記クリテイカル ·バンドのバンド数を 1 2ノくンド（B l 〜B 12) で表現している。ここで、上記バークスぺクトル S Bのいわゆるマスキングに於ける影響を考慮するために、該バークスぺクトル S Bに所定の重み付け関数を掛けて加算するような畳込み（コンボリューシヨン）処理を施す。このため、上記帯域毎のエネルギ算出回路 5 2 2の出力すなわち該バークスぺクトル S Bの各値は、畳込みフィルタ回路 5 2 3に送られる。該畳込みフィルタ回路 5 2 3は、例えば、入力デー夕を順次遅延させる複数の遅延素子と、これら遅延素子からの出力にフィルタ係数（重み付け関数）を乗算する複数の乗算器（例えば各バンドに対応する 2 5個の乗算器）と、各乗算器出力の総和をとる総和加算器とから構成されるものである。

なお、上記マスキングとは、人間の聴覚上の特性により、ある信号によって他の信号がマスクされて聞こえなくなる現象をいうものであり、このマスキング効果には、時間領域のオーディオ信号による時間軸マスキング効果と、周波数領域の信号による同時刻マスキング効果とがある。これらのマスキング効果により、マスキングされる部分にノイズがあつたとしても、このノイズは聞こえないことになる。このため、実際のオーディオ信号では、このマスキングされる範囲内のノイズは許容可能なノイズとされる。

ここで、上記畳込みフィルタ回路 5 2 3の各乗算器の乗算係数（フィルタ係数) の一具体例を示すと、任意のバンドに対応する乗算器 Mの係数を 1 とするとき、乗算器 M— 1で係数 0 . 1 5を、乗算器 M— 2で係数 0 . 0 0 1 9を、乗算器 M— 3で係数 0 . 0 0 0 0 0 8 6を、乗算器 M + 1で係数 0 . 4を、乗算器 M + 2で係数 0 . 0 6を、乗算器 M + 3で係数 0 . 0 0 7を各遅延素子の出力に乗算することにより、上記バークスぺクトル S Bの畳込み処理が行われる。ただし、 Mは 1〜2 5の任意の整数である。

次に、上記畳込みフィルタ回路 5 2 3の出力は引算器 5 2 4に送られる。該引算器 5 2 4は、上記畳込んだ領域での後述する許容可能なノイズ ' レベルに対応するレベルひを求めるものである。なお、当該許容可能なノイズ · レベル（許容ノイズ · レベル）に対応するレベル αは、後述するように、逆コンボリューシヨン処理を行うことによって、クリティカル .バンドの各バンド毎の許容ノイズ · レベルとなるようなレベルである。ここで、上記引算器 5 2 4には、上記レベル αを求めるるための許容関数（マスキングレベル表現する関数）が供給される。この許容関数を増減させることで上記レベルの制御を行っている。当該許容関数は、次に説明するような（II一 a i ) 関数発生回路 5 2 5から供給されているものである ο

すなわち、許容ノイズ · レベルに対応するレベルなは、クリティカル ·バンドのバンドの低域から順に与えられる番号を i とすると、次の式で求めることができる。

α = S - ( η— a i )

この式において、 n， aは定数で a > 0、 Sは畳込み処理されたバークスぺクトルの強度であり、式中（n- ai)が許容関数となる。例として n = 38、 a = - 0. 5 を用いることができる。

このようにして、上記レベルが求められ、このデータは、割算器 5 2 6に伝送される。当該割算器 5 2 6では、上記畳込みされた領域での上記レベルなを逆コンボリュ一ションするためのものである。したがって、この逆コンボリューシヨン処理を行うことにより、上記レベルからマスキング ·スレツショールドが得られるようになる。すなわち、このマスキング 'スレツショールドが許容ノィズスペクトルとなる。なお、上記逆コンボリューシヨン処理は、複雑な演算を必要とするが、本実施例では簡略化した割算器 5 2 6を用いて逆コンボリューシヨンを行っている。

次に、上記マスキング ·スレツショールドは、合成回路 5 2 7を介して減算器 5 2 8に伝送される。ここで、当該減算器 5 2 8には、上記帯域毎のエネルギ検出回路 5 2 2からの出力、すなわち前述したバークスぺクトル S Bが、遅延回路 5 2 9を介して供給されている。

したがって、この減算器 5 2 8で上記マスキング · スレツショールドとバークスぺクトル S Bとの減算演算が行われることで、図 1 3に示すように、上記バークスぺクトル S Bは、該マスキング ·スレツショールド M Sのレベルで示すレベル以下がマスキングされることになる。なお、遅延回路 5 2 9は上記合成回路 5 2 7以前の各回路での遅延量を考慮してエネルギ検出回路 5 2 2からのバークスぺクトル S Bを遅延させるために設けられている。

当該減算器 5 2 8からの出力は、許容雑音補正回路 5 3 0を介し、出力端子 5 3 1を介して取り出され、例えば配分ビット量情報が予め記憶された R O M等（図示せず）に送られる。この R O M等は、上記減算回路 5 2 8から許容雑音補正回路 5 3 0を介して得られた出力（上記各バンドのエネルギと上記ノイズ · レベル設定手段の出力との差分のレベル）に応じ、各バンド毎の配分ビット量情報を出力する。

このようにしてエネルギ依存ビットと聴覚許容雑音レベルに依存したビットは加算されてその配分ビット量情報が図 1の端子 2 8を介して上記適応ビット配分符号化回路 1 6〜 1 8に送られることで、ここで MDCT回路 1 3〜 1 5からの周波数領域の各スぺクトル ·デ一夕がそれぞれのバンド毎に割り当てられたビット量で量子化されるわけである。

すなわち要約すれば、適応ビット配分符号化回路 1 6〜 1 8では、上記クリティカル，バンドの各バンド帯域（クリティカル ·バンド）毎もしくは高域においてはクリティカル ·バンドを更に複数帯域に分割した帯域のエネルギもしくはピーク値と上記ノイズ · レべル設定手段の出力との差分のレベルに応じて配分されたビット量で上記各バンド毎のスぺクトル ·データを量子化することになる。

ところで、上述した合成回路 5 2 7での合成の際には、最小可聴カーブ発生回路 5 3 2から供給される図 1 3に示すような人間の聴覚特性であるいわゆる最小可聴カーブ R Cを示すデータと、上記マスキング ·スレツショールド M Sとを合成することができる。この最小可聴カーブにおいて、雑音絶対レベルがこの最小可聴カーブ以下ならば該雑音は聞こえないことになる。

この最小可聴カーブは、エンコード方法が同じであっても、苒生時の再生音量の違いで異なるものとなる。しかし、実際に音楽を音源とするようなディジタル ·オーディオ · システムでは、例えば 16 ビット量子化によるデジタル記録では、最小可聴カーブに大差が無い。

したがって、 4kHz付近の最も聴覚されやすい周波数帯域の量子化雑音が聞こえなければ、他の周波数帯域の最小可聴カーブのレベル以下の量子化雑音は聞こえないと考えてよい。

したがって、このように例えばシステムの持つダイナミックレンジの 4kHz付近の雑音が聞こえない使い方をすると仮定し、この最小可聴カーブ R Cとマスキング ·スレツショールド M Sとを共に合成することで許容ノイズ ' レベルを得るようにすると、この場合の許容ノイズ · レベルは、図 1 3中の斜線で示す部分までとすることができるようになる。なお、本実施例では、上記最小可聴カーブの 4k Hzのレベルを、例えば 20ビット相当の最低レベルに合わせている。また、この図 1 3は、信号スぺクトル S Sも同時に示している。また、上記許容雑音補正回路 5 3 0では、補正情報出力回路 5 3 3から送られてくる例えば等ラウドネス，カーブの情報に基づいて、上記減算器 5 2 8からの出力における許容雑音レベルを補正している。ここで、等ラウドネス ·カーブとは、人間の聴覚特性に関する特性曲線であり、例えば 1kHzの純音と同じ大きさに聞こえる各周波数での音の音圧を求めて曲線で結んだもので、ラウドネスの等感度曲線とも呼ばれる。

またこの等ラウドネス曲線は、図 1 3に示した最小可聴カーブ R Cと略同じ曲線を描くものである。この等ラウドネス曲線においては、例えば 4kHz付近では 1 kHzのところより音圧が 8〜10dB下がっても 1 kHzと同じ大きさに聞こえ、逆に、 50Hz付近では 1 kHzでの音圧よりも約 15dB高くないと同じ大きさに聞こえない。

このため、上記最小可聴カーブのレベルを越えた雑音（許容ノィズ . レベル）は、該等ラウドネス曲線に応じたカーブで与えられる周波数特性を持つようにするのが良いことがわかる。このようなことから、上記等ラウドネス曲線を考慮して上記許容ノイズ · レベルを補正することほ、人間の聴覚特性に適合していることがわかる。以上述べた聴覚許容雑音レベルに依存したスぺクトル形状を使用可能総ビット 128kbpsの内の、ある割合のビット配分でつくる。この割合は入力信号のトーナリティが高くなるほど減少する。

次に 2つのビット配分方法の間でのビット量分割方法について説明する。

図 1 0に戻って、 MDCT回路出力が供給される入力端子 8 0 1からの信号は、スペクトルの滑らかさ算出回路 8 0 8にも与えられ、ここでスぺクトルの滑らかさが算出される。本実施例では、信号スぺグトルの絶対値の隣接値間の差の絶対値の和を、信号スぺクトルの絶対値の和で割った値を、上記スぺクトルの滑らかさとして算出している。

上記スぺクトルの滑らかさ算出回路 8 0 8の出力は、ビット分割率決定回路 8 0 9に与えられ、ここでエネルギ依存のビット配分と、聴覚許容雑音スぺクトルによるビット配分間のビット分割率とが決定される。ビット分割率はスぺクトルの滑らかさ算出回路 8 0 8 の出力値が大きいほど、スペクトルの滑らかさが無いと考えて、ェネルギ依存のビット配分よりも、聴覚許容雑音スぺクトルによるビット配分に重点をおいたビット配分を行う。ビット分割率決定回路 8 0 9は、それぞれエネルギ依存のビット配分及び聴覚許容雑音スぺクトルによるビット配分の大きさをコントロールするマルチプラィャ 8 1 1及び 8 1 2に対してコントロール出力を送る。ここで、仮にスぺクトルが滑らかであり、エネルギ依存のビット配分に重きをおくように、マルチプライヤ 8 1 1へのビット分割率決定回路 8 0 9の出力が 0 . 8の値を取ったとき、マルチプライヤ 8 1 2へのビット分割率決定回路 8 0 9の出力は

1 - 0 . 8 = 0 . 2

とする。これら 2つのマルチプライヤの出力はァダ一 8 0 6で足し合わされて最終的なビット配分情報となって、出力端子 8 0 7から出力される。

このときのビット配分の様子を図 1 4、図 1 5に示す。また、これに対応する量子化雑音の様子を図 1 6、図 1 7に示す。

図 1 4は信号スぺクトルが低いト一ナリティを示す場合を示しており、図 1 5は信号スぺクトルが高いトーナリティを示す場合を示している。また、図 1 4及び図 1 5の図中、斜線で示す Q Sは信号レベル依存分のビット量を示す。

また図中、白抜きで示す Q Nは聴覚許容雑音レベル依存分のビット量を示す。図 1 6及び図 1 7の図中において、 S Sは信号レベルを示し、 N Sは信号レベル依存分のビット割当による雑音低下分を、 N Nは聴覚許容雑音レベル依存のビット割当による雑音低下分を示している。

先ず、信号のスぺクトルが、割合平坦である場合を示す図 1 4において、聴覚許容雑音レベルに依存したビット配分は、全帯域に渡り大きい信号雑音比を取るために役立つ。しかし低域及び高域では比較的少ないビット配分が使用されている。これは聴覚的にこの帯域の雑音に対する感度が小さいためである。信号エネルギレベルに依存したビット配分の分は量としては少ないが、白色雑音スぺクトルを生じるように、この場合には中低域の信号レベルの高い周波数領域に重点的に配分されている。

これに対して、図 1 5に示すように、信号スぺクトルが高いトーナリティを示す場合には、信号エネルギレベルに依存したビット配分量が多くなり、量子化雑音の低下は極めて狭い帯域の雑音を低減するために使用される。聴覚許容雑音レベルに依存したビット配分の集中はこれよりもきつくない。

図 1 0に示すように、この両者のビット配分の和により、孤立スぺクトル入力信号での特性の向上が達成される。

以上の様にして得られた従属配分ビットを含むビット配分と、従属配分ビットを含まないビット配分との 2つを用いて、次のようにして第 1 と第 2の量子化を行う。

図 1 8 A及び図 1 8 Bは 8チャンネルのオーディオ信号について、各チャンネルが要求する、言い換えれば各チャンネルの音質を低下させずに必要とされるビット数を示す。

図 1 8 Aにおいて、格子模様部のみ（CH2，CH4, CH5, CH7, CH8) 、又は格子模様部及び斜線模様部の両者の和（CHI , CH3, CH6) が各チャンネルが要求するビット量を示す。この内、斜線模様部は補助配分ビットに相当するビット量を示す。点模様部は余剰ビット（R) を示し、ビット · レートで許容される各チャンネルの上限ビット量（147kb ps) と各チャンネルが実際に要求するビット量（各チャンネル内での許容ビット量を少ない値、例えば 2 kbpsに規定している場合は、その上限）との差である。

図 1 8 Aの例では、全 8チャンネルのなかで要求するビット量が 147kbpsを越えるチャンネルは、チャンネル CH1 、チャンネル CH3 、チャンネル CH6 である。

まず、入力信号によって要求される、補助配分ビットを含むビット配分量が 147kbpsを越えるチャンネルについて、例えばチャンネル CH1 について、ある一定のビット量、例えば 147kbpsを最大とする部分（I ) と 147kbpsを越える部分（S) とに 2分して考える。

即ち、入力信号を、独立配分に相当する 147kbpsのビット量で量子化される部分と、補助配分のビット量で量子化される部分とに分割し、各々がそのビット量にて量子化されるものとする。

例えば 16ビッ卜のデジタル · ヮードの入力信号を、 M S Bを含む 10ビット部と L S Bを含む 6 ビット部とに分解し、 10ビット部を独立配分で、 6 ビット部を補助配分にて量子化するような処理を考える ο

この処理を行う構成を図 1 9に示す。

図 1 9の構成では、ビット量が 147kbpsを越えるビット配分の各サンプルについて、複数サンプルごとのブロックについての正規化処理、すなわちブロック · フローティングを行う。この時どの程度のブロック · フローティングが行われたかを示す係数として、スケール ' ファクタが得られる。

この図 1 9において、入力端子 9 0 0に供給された信号はゲイン調整器 9 0 5でゲイン調整される。

次に、前記補助配分ビットを含まないビット配分でのビット量（1 47kbps) により、各サンプル語長で量子化器（quant i zer ) 9 0 1 が再量子化を行う。この時、量子化雑音を少なくするためには、四捨五入による再量子化が行われる。

また、 M S B側の数ビットがサンプル語長とされる。この場合のサンプル語長を固定とすることも可能である。この場合、前記ビット量（147kbps) に接近したビット量とすることは難しい。

そこで最良なのは、入力信号に応じてサンプル語長を適応可変とすることである。このためには、例えば上記量子化器 9 0 1からのデータ量を積算し、 147kbps に接近するように、上記量子化器 9 0 1をフィ一ド ·バック制御する。

次に、量子化器 9 0 1の入力と出力の差が差分器 9 0 2で取られ、それがゲイン調整器 9 0 6でゲイン調整された後、第 2の量子化器 9 0 3に与えられる。

当該量子化器 9 0 3では、前記入力信号のサンプル語長と、前記補助配分ビットを含まないビット配分によるサンプル語長との差のサンプル語長が得られる。即ち、前記入力信号の L S B側の数ビットが得られる。

この時のフローティング係数は第 1の量子化器 9 0 1で用いられたフローティング係数と語長から自動的に決定される。すなわち第 1の量子化器 9 0 1で用いられた語長が Nビットであったときには、 ( 2 * * N ) で第 2の量子化器 9 0 3で用いられるフローティング係数が得られる。

第 2の量子化器 9 0 3では、第 1の量子化器 9 0 1 と同じように、ビット配分による、四捨五入処理を含む再量子化を行う。

このようにして 2つの量子化により、要求ビット量が 147kbpsをこえるチャンネルは、 147kbps以下でなるべく 147kbpsに近いビット配分によるデータと、残りのビット配分によるデータとに分けられる。

また、要求されるビット配分が 147kbpsよりも小さいビット配分となったチャンネルは、そのままそのビット配分を使用する。

以上の例において、前記従属配分によるビットは、格子模様部（I ) で示す独立配分に相当するビットにも、斜線模様部で示す補助配分ビット（S) にも含まれるようにする。

即ち、各チャンネルの全ビットは、補助ビットの有無に関係無く、独立配分ビットと従属配分ビットとの和とする。

従って、例えば前述のチャンネル CH1 に関し、格子模様部（I) の 70%を独立配分によるビットとし、残りの 30%を従属配分によるビットとする。また、補助ビット（斜線部分（S) ) については、同様に、 70 を独立配分によるビットとし、残りの 30%を従属配分によるビットとする。この場合、補助ビットの 50%を独立配分によるビットとし、残りの 50%を従属配分によるビットとすることもできる o

さらに、処理を簡単にするため、

格子模様部（I ) で示す 147kbps 未満の部分については、独立配分によるビットが配分されるとし、斜線模様部で示す補助配分ビット (S) は従属配分によるビットが配分されるとする。即ち、各チャンネルの全ビットについて、補助ビットは全て従属配分ビットによるものとする。

従って、例えば前述の図 1 8 Aの例では、チャンネル CH1 、チヤンネル CH3 、及びチャンネル CH6 についてのみ、チャンネル間の相関を考慮したビット配分、即ち従属配分を使用してビット配分を行レ、、補助配分ビットとする。この方法でのメリットは、ビット配分のための計算が容易になることである。

なお、前述したように、前記残りのビット配分の成分の大きさは、図 1 9で示されるようにビット配分（1) のスケール · ファクタとワード . レングスからスケール · ファクタを算出できるので、ヮード · レングスのみがデコーダに必要とされる。

以上のビット配分を行うためのフロー ·チヤートの例を図 2 2に示す。

先ず、各チャンネル毎に要求ビット量を算出する（S10) 。次に基準量を超えるビット量を要求しているチャンネルを特定する（S11) 。続いて、各チャンネルの余剰ビット（R) の合計（ ∑R)を算出する

(512) 。ここで、基準量を超えるビット量を要求しているチャンネルについては、基準量を超えるビット量（S) の合計を（ ∑S)求める

(513) 。

余剰ビット（R) の合計と基準量を超えるビット量（S) の合計とを比較し（S14) 、もし基準量を超えるビット量（S) の合計が余剰ビット（R) の合計より多い場合は、基準量を超えるビット量（S) の合計が余剰ビット（R) の合計以下となる迄、各チャンネルの基準量を超えるビット量（S) を減らす（S15) 。

各チャンネルへのビット配分が決まると、まず、配分ビット量の一部で独立配分を行う（S16) 。続いて、配分ビット量の残りで従属配分（S17) を行う。各チャンネルへの配分が終了すると、各チャンネル毎に補助配分を行うか否かの判定を行い（S18) 、基準量を超えるビット配分がなされたチャンネルについては、補助配分を行う（S19) 。基準量を超えないビット配分がなされたチャンネルについては、補助配分を行わない（S20) 。

図 1 8 Aの例では、サブ情報については言及していない。しかし、実際には、データのためのビットだけで無く、そのデータを復元するためのサブ情報のためのビットも考慮しなければならない。そこで、図 1 8 Bには、サブ情報を考慮した例を示す。

まず、 128kbpsと 147kbpsという 2つのスレツショールドを設ける。経験上、 19kbps程度あればサブ情報のためには充分と考えられ。よって、このビット量と、データのためにビット量とを考慮して、 147kbpsが最下限として設定する。

また、あるチャンネルで要求するビット配分量が、 128kbpsを上回り 147kbpsを下回る場合には、 128kbpsを越えるデータ部分により、サブ情報に使用できるビットが少なくなる。このような場合には、このチャンネルは前記補助配分ビットを含まないビット配分で 128kbpsよりも小さく、できるだけ 128kbps近いビット配分を行う。この処理により、若干の音質低下となるが、ビット削減量としては最大 19kbps、即ちサブ情報分であり、互換性を考慮すると、この方がメリットがある。

次に、あるチャンネルで要求するビット配分量が 147kbpsを越える場合について、図 1 8 Bにより説明する。

例えばチャンネル CH1 について、ある一定のビット量、例えば 128kbpsを最大とする部分（la)と 128kbpsを越える部分（l b, S)とに 2分して考える。

即ち、入力信号を、独立配分に相当する 128kbpsで量子化される部分と、 128kbps を越える配分で量子化される部分とに分割し、各々が配分されたビット量にて量子化されるものとする。図 1 8 Aの例と同様、図 1 9において、第 1の量子化器 9 0 1 と第 2の量子化器 9 0 3では、四捨五入処理を含むビット配分を行う

2つの量子化器により、上位のビットは 128kbps以下で、かつ 128kbpsに近いビット配分により量子化され、符号化される。

一方、下位のビットについては、 128kbps を超える部分のビット配分により量子化され、符号化される。

図 1 8 A、図 1 8 Bの何れの場合においても、補助配分に使用できるビット量には、限りがあることに注意が必要である。

尚、補助配分に使用できるビット量には、限りがあることに注意が必要である。例えば、前記図 1 8 Aの例において、補助配分に必要な全ビット量は、 CHI 、 CH3 、及び CH6 の斜線部分（S) の合計、更に詳細には、各チャンネルのサブ情報をも考慮しなければならない。

これに対して、全チャンネルのビット . レートを固定とすれは、図 1 8 Aでは、 CH2、 CH4、 CH5、 CH7 及び CH8 の各チャンネルの余剰ビット（R) の合計が、補助配分に使用できる最大ビット量に相当する。本実施例のように、ビット · レ一トの上限が 800kbpsならば、補助配分に使用できるビット量はかなり少なくなる。

よって、余剰ビットが不足する場合は、優先順位に応じて、補助配分に使用するビットに制限を与えなければならない。前述した図 2 2の例のように、配分ビット量を削減する（S15) 。他に、一律に配分量を削減したり、特定チャンネルを優先して配分することも効果がある。

尚、前述したように、前記補助配分によるデータのスケール · ファクタについては、独立配分に相当するビット配分によるデータのスケール · ファクタとワード · レングスとから算出できるので、ヮ

―ドレングスのみを伝送すれば良い。

以上のようにして量子化器 9 0 1及び 9 0 3で得られた各チャンネルのデ一夕は、所定の時間を単位とするシンク，ブロックに配列される。各チャンネルのデータの並べ方は、図 2 0に模式的に示す o

図 2 0では、前述の図 1 8 Bの例のデ一夕並びを示している。即ち、シンクブロック中に、先ず、

(1) 前記捕助配分を使用しないチャンネル ·データ、即ち 128kbps 以下のビット配分によるチャンネル ·データ（CH2 、 CH4 、 CH5 -、 CH7 、 CH8 ) 、格子模様で示す、

(2) 前記補助配分を使用するチャンネル ·データの内、ある一定のビット量、例えば 128kbpsを最大とする部分のチャンネル ·データ ( CHI 、 CH3 、 CH6 ) 、白抜きで示す、

(3) 前記補助配分を使用するチャンネル ·データのうち、 128kbps を越える補助配分による部分のチャンネル ·データ（CHI 、 CH3 、 CH6 ) 、斜線模様で示す。このように配列することにより、次のような処理が可能となる。

まず、補助配分を使用しないデコーダにおいては、（1) 部、（2) 部のチャンネル ·データのみを使用する。よって、全チャンネルについて、補助配分を使用しないデータと同様に扱うことができる。補助配分によるデ一夕を使用しないため、補助配分によるチャンネル ·データ（CHI 、 CH3 、 CH6 ) は、例えば M S B部のみのデコードとなる。よって、量子化ステップが粗く再量子化されたこととなり、音質は劣化する。しかし、聴覚上は問題とならない程度の劣化とされる。

補助配分を使用するデコーダにおいては、全データが使用される。よって、補助配分によるチャンネル ·データ（CHI 、 CH3 、 CH6) は、 M S B部と L S B部とが合成された完全なワードをなす。よつて、極めて高品質な音声信号をデコードできる。

この例では、補助配分ビットを使用するチャンネル数は、 3を例示している。実際には、音質的に重要な前方の 2チャンネルにのみ補助配分ビットを使用すると決めれば、シンク ·ブロックの処理が簡単になる。逆に、補助配分ビットを使用するチャンネルを決めない、即ち入力信号に応じて適応的に補助配分ビットを使用するチヤンネルが切り替わる場合は、各データにチャンネル IDを付与することで、簡単に対応できる。この IDのためには、チャンネルあたり 3 ビットのデータの増加に過ぎない。

なお、図 1 9において、エンコーダに対応するデコーダでは、ゲィン調整器 9 0 6に対応してゲイン調整器 9 0 7が、ゲイン調整器 9 0 5に対応してゲイン調整器 9 0 8が設けられ、これらゲイン調整器 9 0 7， 9 0 8の出力が加算器 9 0 4で加算される。その加算出力が出力端子 9 1 0から取りだされれる。

加算出力は、独立配分によるデータと、補助配分によるデータとの加算出力であり、完全なデータとされる。

図 2 1は、このようにして高能率符号化された信号を再び復号化するための基本的な本発明実施例の復号化装置を示している。

この図 2 1において、各帯域の量子化された MDCT係数は、復号化装置入力端子 1 2 2〜 1 2 4に与えられ、使用されたブロック ·サィズ情報は、入力端子 1 2 5〜 1 2 7に与えられる。復号化回路 1 1 6〜 1 1 8では適応ビット配分情報を用いてビット割当を解除する

次に、卜 MDCT回路 1 1 3〜 1 1 5では周波数領域の信号が時間領域の信号に変換される。これらの部分帯域の時間領域信号は、 I -QM F 回路 1 1 2、 1 1 1により、全帯域信号に復号化される。

ここで、前記 128kbps 以下のビット配分（1) が行われたチャンネルと、前記 147kbps以上のビット配分（2) が行われたチャンネルにおける 128kbpsを最大とする部分と、補助配分ビットによる部分とのそれぞれが上記復号化回路 1 1 6〜 1 1 8で復号化される。

但し、補助配分を使用するものはそれぞれが復号化された後、 L S B部 . M S B部として 1 ワードとされ、 1つの精度の高いサンプルとなる。

次に、本発明実施例の記録メディアは、上述したような本発明実施例の高能率符号化装置により符号化された信号が記録されるものである。前述した映画フィルの他、光ディスク、光磁気ディスク、磁気ディスク等のディスク状の記録媒体に上記符号化信号が記録されたものや、磁気テープ等に上記符号化信号が記録されたもの、或いは、符号化信号が記憶された半導体メモリ、 I- Cカードなどを挙げることができる。

また、本発明実施例の記録メディァへの本発明実施例の高能率符号化信号記録方法は、一つのシンクブロックの中に、複数チャンネルのための一定の基準量よりも大きいビット量を配分する第 1のビット配分量に関するサンプル群と、複数チャンネルのための前記第

1のビット配分量に関するサンプル群残りの第 2のビット配分サンプル群とを分離して記録している。さらに、この記録は、各チャンネル毎に交互に行われる。

本発明では、デジタル音声信号の圧縮符号化 ·復号化装置、又は方法を実施例として詳細に説明した。

さらに実施例として詳細に説明をしないものの、本発明はデジ夕ル音声信号に止まらず、デジタル画像信号にも適用できることは勿である。

即ち複数の動画像を並列チャンネルにて伝送 ·記録するようなものにおいて、要求されるビット配分が大きい複雑な図柄の画像チヤンネルについては、所定値を上回る部分については、補助配分として同様に扱うことが可能である。産業上の利用可能性以上の説明からも明らかなように、本発明に係る高能率符号化方法と、これに対応する高能率符号の復号化方法、及び高能率符号の復号化再生方法、その高能率符号化方法により符号化された信号を記録する高能率符号化信号記録方法及び記録がなされた記録メディァにおいては、マルチチャンネルシステムの圧縮に対して従属配分技術を用いて音質を上げた圧縮信号を、従属配分を利用して高音質で再生することが可能である。

また通常良く使われる各チャンネル個別に固定値以下のビット · レートを用いてチャンネル毎でのビット配分を行うデコーダでも、大きな音質劣化無く再生できるようになる。さらに、このことにより、例えば映画フィルム上の音声信号は同時に他の光ディスク · メディアへの転用が容易となる。また、フィルム上の信号の再生装置は、安価な通常良く使われる各チャンネル個別に固定値以下のビット · レ一トを用いてチャンネル毎でのビット配分を行うデコーダでも作成することが可能となる。

Claims

請求の範囲

1 . 複数のチャンネルの各デジタル信号のサンプル 'データを所定のビット量により再量子化して、符号化する高能率符号化方法であつ乙、

予め決められた一定の基準量よりも大なるビット量を配分するチヤンネルを特定するステップと、

上記チャンネルへ配分するビット量を、多くとも前記一定の基準量を越えない第 1のビット量と、残りの第 2のビット量とに配分するステップと、

上記第 1のビット量によるビットを使用して、上記サンプル ·デ —夕の一部を再量子化するステップと、

上記第 2のビット量によるビットを使用して、少なくとも上記サンプル ·データの他部を再量子化するステップと、

上記再量子化されたサンプル ·データの一部と上記再量子化されたサンプル ·データの他部とを合成するステップと、

からなる高能率符号化方法。

2 . 上記各チャンネルに配分されるビットのビット量の全チャンネルでの合計が、略一定であることを特徵とする請求の範囲 1記載の高能率符号化方法。

3 . 請求の範囲 1及び 2記載の高能率符号化方法の上記各チャンネルの上記サンプル ·データを再量子化するステップは、更に、複数のサンプル ·データを共通のスケール · ファクタにより正規化するステップと、

上記共通のスケール · ファクタにより正規化された各サンプル · データのヮード長を規定するステップと、

を有する。

4 . 前記第 1のビット量によるデータと前記第 2のビット量によるデータとは、シンク，ブロックにおいて、異なる領域に位置することを特徴とする、請求の範囲 3記載の高能率符号化方法。

5 . 前記第 2のビット量は、補助配分ビットの含まれないビット配分であり、上記第 2のビット配分量は補助配分ビットの含まれたビット配分と上記第 1のビット配分量の含まれないビット配分の差であることを特徴とする請求の範囲 1記載の高能率符号化方法。

6 . 前記第 2のビット量は、余剰ビットの合計ビット量以下であることを特徴とする、請求の範囲 1、 2、 3、又は 4記載の高能率符号化方法。

7 . 前記再量子化をするステップは、入力信号を、時間軸と周波数軸とについて細分化した小ブロック毎のサンプル ·データについて再量子化することを特徴とする請求の範囲 1から 6記載の高能率符号化方法。

8 . 前記時間軸と周波数軸とについて細分化された小ブロック中のサンプル ·データは、

非ブロック化周波数特性の分析を行い、

前記非ブロック化周波数特性の分析の出力をブロック化周波数特性の分析をすることを特徴とする請求の範囲 7記載の高能率符号化方法。

9 . 前記ブロック化周波数特性の分析では入力信号の時間特性により適応的にブロック ·サイズを変更することを特徴とする請求の範囲 8記載の高能率符号化方法。

1 0 . 予め決められた一定の基準量よりも大なるビット量を配分するチャンネルを特定する前記ステップの前記予 A決められた一定の基準量は、さらにデ一夕に使用するビット量の基準量と、サブ情報のためのビット量を考慮した基準量との少なくとも 2つの基準量であることを特徵とする請求の範囲 1記載の高能率符号化方法。

1 1 . 予め決められた一定の基準量よりも大なるビット量を配分するチャンネルを特定する前記ステップの前記予め決められた一定の基準量は、上記サブ情報のためのビット量を考慮した基準量であることを特徴とする請求の範囲 1 0記載の高能率符号化方法。

1 2 . 前記ビットの配分は、上記各チャンネル毎で独立して配分する独立配分と、上記各チャンネル間で関係して配分する従属配分とによることを特徴とする請求の範囲 1記載の高能率符号化方法。

1 3 . 上記第 1のビット量は上記独立配分によるビット配分によるものであり、

上記第 2のビット量は上記従属配分によるビット配分によるものであることを特徴とする請求の範囲 1 2記載の高能率符号化方法。

1 4 . 前記ブロック ·サイズの変更は、少なくとも 2つの前記非ブロック化周波数特性の分析の出力帯域毎に独立に行うことを特徴とする請求の範囲 1 3記載の高能率符号化方法。

1 5 . 各チャンネルの前記第 1のビット配分部分と前記第 2のビット配分部分の和が、各チャンネルのスケール · ファクタ又はサンプル最大値により変化することを特徴とする請求の範囲 1から 1 4 記載の高能率符号化方法。

1 6 . 各チャンネルの信号のエネルギ値又はピーク値又は平均値の振幅情報の時間的変化により、従属配分を変化させることを特徴とする請求の範囲 1 2記載の高能率符号化方法。

1 7 . 各チャンネルのスケール · ファクタの時間的変化により、従属配分を変化させることを特徴とする請求の範囲 1 2記載の高能率符号化方法。

1 8 . 請求の範囲 1から 1 7記載の高能率符号化方法により形成された符号化信号が記録された記録媒体。

1 9 . 一^ Dのシンクブロックの中に、複数チャンネルのデータを記録するための高能率符号化信号の記録方法であって、

予め決められた一定の基準量よりも小なるビット量が配分されたチャンネルのデータを記録するステップと、

予め決められた一定の基準量よりも大なるビット量が配分されたチャンネルのデータを記録するステップとを備え、

このデ一夕を記録するステップは、さらに、

上記第 1のビット量によるビットを使用して、上記サンプル ·デ一夕の一部を再量子化し、この再量子化したデータを記録するステップと、

上記第 2のビット量によるビットを使用して、少なくとも上記サンプル ·データの他部を再量子化し、この再量子化したデータを記録するステップとを備える。

2 0 . 上記再量子化したデータは、シンク ·ブロック内で交互に記録されていることを特徴とする請求の範囲 1 9記載の高能率符号化信号の記録方法。

2 1 . 複数のチャンネルの各デジタル信号のサンプル ·データを所定のビット量により再量子化して、符号化する符号化方法による高能率符号化信号の復号方法であつて、

上記高能率符号化方法は、

予め決められた一定の基準量よりも大なるビット量を配分ずるチヤンネルを特定するステップと、

上記第 2のビット量によるビットを使用して、少なくとも上記サンプル · データの他部を再量子化するステップと、

上記再量子化されたサンプル ·データの一部と上記再量子化されたサンプル ·データの他部とを合成するステップとを備え、上記合成されたサンプル ·データは記録又は伝送され、記録又は伝送されたサンプル ·データのうち、少なくとも上記第 1のビット量によるサンプル■データをそのチャンネルのサンプル ·データとして、上記複数チャンネルの少なくとも 1のデジタル信号を得ることを特徴とする、高能率符号化信号の復号化方法。

2 2 . 複数のチャンネルの各デジタル信号のサンプル■データを所定のビット量により再量子化して、符号化する符号化方法による高能率符号化信号の復号方法であつて、

上記符号化方法は、

上記再量子化されたサンプル ·デ一夕の一部と上記再量子化されたサンプル ·データの他部とを合成するステップとを備え、上記合成されたサンプル ·データは記録又は伝送され、記録又は伝送されたサンプル ·データのうち、上記第 1のビッ小量によるサンプル ·データのみをそのチャンネルのサンプル，データとして、上記複数チャンネルの少なくとも 1のデジタル信号を得ることを特徴とする高能率符号化信号の復号化方法。

2 3 . 請求の範囲 2 1及び 2 2記載の高能率符号化信号の復号化方法の上記各チャンネルの上記サンプル ·データを再量子化するステツプは、さらに、

複数のサンプル ·データを共通のスケール■ ファクタにより正規化するステップと、

上記共通のスケール · ファクタにより正規化された各サンプル · データのヮード長を規定するステップとを備える。

2 4 . 前記第 2のビット配分量に関するサンプル ·データのためのスケール，ファクタを、前記第 1のビット配分量に関するサンプル ·データのためのスケール · ファクタおよびワードレングスから求めていることを特徴とする請求の範囲 2 3記載の高能率符号化信号の復号化方法。

2 5 . 複数のチャンネルの各デジタル信号のサンプル ·デ一夕を所定のビット量により再量子化して、符号化する高能率符号化装置であって、この高能率符号化装置は、

予め決められた一定の基準量よりも大なるビット量を配分するチヤンネルを特定する手段と、

上記チャンネルへ配分するビット量を、多くとも前記一定の基準量を越えない第 1のビット量と、残りの第 2のビット量とに配分する手段と、

上記第 1のビット量によるビットを使用して、上記サンプル ·デ一夕の一部を再量子化する手段と、

上記第 2のビット量によるビットを使用して、少なくとも上記サンプル ·データの他部を再量子化する手段と、

上記再量子化されたサンプル ·データの一部と上記再量子化されたサンプル■データの他部とを合成する手段とを備える。

2 6 . 上記各チャンネルに配分されるビットのビット量の全チヤンネルでの合計が、略一定であることを特徴とする請求の範囲 2 5 記載の高能率符号化装置。

2 7 . 請求の範囲 2 5及び 2 6記載の高能率符号化装置の上記各チャンネルの上記サンプル ·データを再量子化する手段は、さらに複数のサンプル ·データを共通のスケール · ファクタにより正規化する手段と、

上記共通のスケール · ファクタにより正規化された各サンプル · データのヮード長を規定する手段とを備える。

2 8 . 前記第 1のビット量によるデータと前記第 2のビット量によるデータとは、シンク ·ブロックにおいて、異なる領域に位置することを特徴とする請求の範囲 2 5記載の高能率符号化装置。

2 9 . 前記第 2のビット量は、補助配分ビットの含まれないビット配分であり、上記第 2のビット配分量は補助配分ビットの含まれたビット配分と上記第 1のビット配分量の含まれないビット配分の差であることを特徴とする請求の範囲 2 5記載の高能率符号化装置 o

3 0 . 前記第 2のビット量は、余剰ビットの合計ビット量以下であることを特徵とする、請求の範囲 2 5から 2 9記載の高能率符号化装置。

3 1 . 前記再量子化をする手段は、入力信号を、時間軸と周波数軸とについて細分化した小ブロック毎のサンプル ·データについて再量子化することを特徴とする請求の範囲 2 5から 3 0記載の高能率符号化装置。

3 2 . 前記時間軸と周波数軸とについて細分化された小ブロック中のサンプル■データは、

非ブロック化周波数特性の分析を行い、

前記非ブロック化周波数特性の分析の出力をブロック化周波数特性の分析をすることを特徵とする請求の範囲 3 1記載の高能率符号化

3 3 . 前記ブロック化周波数特性の分析では入力信号の時間特性により適応的にブロック ·サイズを変更することを特徴とする請求の範囲 3 2記載の高能率符号化装置。

3 4 . 前記予め決められた一定の基準量は、さらにデータに使用するビット量の基準量と、サブ情報のためのビット量を考慮した基準量との少なくとも 2つの基準量であることを特徴とする、請求の範囲 2 5記載の高能率符号化装置。

3 5 . 前記予め決められた一定の基準量は、上記サブ情報のためのビット量を考慮した基準量であり、この基準量よりも大なるビット量を配分するチャンネルを特定する手段であることを特徴とする、請求の範囲 3 4記載の高能率符号化装置。

3 6 . 前記ビットの配分は、上記各チャンネル毎で独立して配分する独立配分と、上記各チャンネル間で関係して配分する従属配分とによることを特徴とする請求の範囲 2 5記載の高能率符号化装置 o

3 7 . 上記第 1のビット量は上記独立配分によるビット配分によるものであり、

上記第 2のビット量は上記従属配分によるビット配分によるものであることを特徴とする請求の範囲 3 6記載の高能率符号化装置。

3 8 . 前記ブロック ·サイズの変更は、少なくとも 2つの前記非ブロック化周波数特性の分析の出力帯域毎に独立に行うことを特徴とする請求の範囲 3 5記載の高能率符号化装置。

3 9 . 各チャンネルの前記第 1のビット配分部分と前記第 2のビット配分部分の和が、各チャンネルのスケール ' ファクタ又はサンプル最大値により変化することを特徴とする請求項 2 5〜3 6記載の高能率符号化装置。

4 0 . 各チャンネルの信号のエネルギ値又はピーク値又は平均値の振幅情報の時間的変化により、従属配分を変化させることを特徴とする請求の範囲 3 6記載の高能率符号化装置。

4 1 . 各チャンネルのスケール · ファクタの時間的変化により、従属配分を変化させることを特徴とする請求の範囲 3 6記載の高能率符号化装置。

4 2 . 請求の範囲 2 5〜3 9記載の高能率符号化装置により形成された符号化信号が記録された記録媒体。

4 3 . 上記記録媒体ほ、映画フィルムであること特徴とする請求の範囲 4 2記載の符号化信号が記録された記録媒体。

4 4 . 複数のチャンネルの各デジタル信号のサンブル ·デ一夕を所定のビット量により再量子化して、符号化し復号化する高能率符号化 ·復号化システムであって、

この高能率符号化 ·復号化システムは、

上記再量子化されたサンプル ·データの一部と上記再量子化されたサンプル ·データの他部とを合成する手段と、

上記合成されたサンプル ·デ一夕を記録媒体への記録又は伝送路へ伝送する手段と、

上記記録又は伝送されたサンプル ·データのうち、少なくとも上記第 1のビット量によるサンプル ·データを使用して、上記サンプル ·データの一部を再量子化したサンプル ·データを復号して、上記複数チャンネルの少なくとも 1のデジタル信号を得る手段とを備る。

4 5 . 複数のチャンネルの各デジタル信号のサンプル ·デ一夕を所定のビット量により再量子化して、符号化し復号化する高能率符号化 ·復号化システムであって、

この高能率符号化 ·復号化システムは、予め決められた一定の基準量よりも大なるビット量を配分するチヤンネルを特定する手段と、

上記再量子化されたサンプル ·データの一部と上記再量子化されたサンブル ·データの他部とを合成する手段と、

上記合成されたサンプル ·データを記録媒体への記録又は伝送路へ伝送する手段と、

上記記録又は伝送されたサンプル ·データのうち、上記第 1のビット量によるサンプル■デ一夕のみをそのチャンネルのサンプル · データとして復号して、上記複数チャンネルの少なくとも 1のデジタル信号を得る手段とを備える。