WO1995002925A1 - Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite - Google Patents

Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite Download PDF

Info

Publication number
WO1995002925A1
WO1995002925A1 PCT/JP1994/001166 JP9401166W WO9502925A1 WO 1995002925 A1 WO1995002925 A1 WO 1995002925A1 JP 9401166 W JP9401166 W JP 9401166W WO 9502925 A1 WO9502925 A1 WO 9502925A1
Authority
WO
WIPO (PCT)
Prior art keywords
bit
amount
allocation
sample data
channel
Prior art date
Application number
PCT/JP1994/001166
Other languages
English (en)
French (fr)
Inventor
Kenzo Akagiri
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to JP50447495A priority Critical patent/JP3336618B2/ja
Priority to KR1019950701063A priority patent/KR100339324B1/ko
Priority to AU71952/94A priority patent/AU686199B2/en
Priority to US08/403,698 priority patent/US6104321A/en
Priority to EP94921102A priority patent/EP0669724A4/en
Publication of WO1995002925A1 publication Critical patent/WO1995002925A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Definitions

  • High-efficiency coding method, high-efficiency code decoding method, high-efficiency code encoding device, high-efficiency code decoding device, high-efficiency encoding / decoding system, and recording media technology field The present invention relates to encoding and / or decoding of digital audio signals, and more particularly to encoding and / or decoding digital audio signals of a plurality of channels using human auditory characteristics. More specifically, the present invention relates to a stereo sound system of a broadcast, communication, movie, video tape recorder, or disc player, or a multiple surround sound system including three or more channels.
  • the present invention relates to a high-efficiency encoding method for reducing a bit rate, a corresponding high-efficiency code decoding method, and a high-efficiency code decoding / reproduction method suitable for use in these systems. . Furthermore, the present invention relates to a high-efficiency coded signal recording method for recording a signal coded by the high-efficiency coding method, and a recording medium on which recording is performed.
  • the present invention relates to a high efficiency coded signal transmission method for transmitting a signal coded by the high efficiency coding method.
  • Background technology High-efficiency encoding of audio signals such as music signals or audio signals Many techniques are known for the method and the high efficiency coding device.
  • an audio signal in the time domain is divided into blocks in a predetermined unit time along the time axis, and the signal in the time domain for each block is orthogonally transformed into a signal in the frequency domain.
  • a block frequency band division method in which the signal is divided into a plurality of frequency bands, and requantization and encoding are performed for each frequency band.
  • band division coding sub Band Coding: SBC
  • a filter for band division in the above-mentioned band division coding for example, there is a filter such as a quadrature 'mirror' filter (Quarature Mirror Filter: QMF). This is described in 1976 R. E. Crochiere Digital coding of speech in subbands Bell Syst. Tech. J. Vol. 55. No. 8 1976.
  • QMF Quadrature Mirror Filter
  • ICASSP 83 BOSTON Polyphase Quadrature filters- A new subband coding technique Joseph H. Rothweiler (Kon, etc. A width filter splitting method and apparatus is described.
  • an input audio signal is divided into blocks at a predetermined unit time (frame), and a fast Fourier transform (FFT), a discrete cosine transform (DCT) is performed for each block. It is known to convert the time axis to the frequency axis by performing a Modified Discrete Cosine Transform (MDCT).
  • DCT discrete cosine Transform
  • the MDCT is used as the orthogonal transform, and this MDCT is described in ICASSP 1987 Subband / Transform Coding Using Filter Bank Des igns Based on Time Domain Aliasing Cancel lat ion JP Princen AB Bradley Univ. Of Surrey Royal Melbourne Inst. Of Tech.
  • the bandwidth used is such that the higher the band called the critical band, the wider the bandwidth is used, and the audio signal of 0 to 20 kHz is divided into multiple bands (for example, 25 bands). .
  • a critical band is a frequency band that is divided in consideration of human auditory characteristics, and possesses the noise of a pure tone when the pure tone is masked by a narrow band noise near the frequency of the pure tone. It is a band.
  • the encoding is performed using a bit amount determined by a predetermined or adaptive bit allocation (bital location) for each band. Is performed. For example, when encoding the MDCT coefficient data obtained by the MDCT, encoding is performed with the determined bit amount.
  • ICASSP 1980 The critical band coder--digital encoding of the perceptual requirements of the audi tory system
  • M.A. Kransner MIT describes a technology that uses auditory masking to obtain the required signal-to-noise ratio for each band and performs fixed bit allocation.
  • the amount of bits per unit time is limited by the recording density of a recording medium and the bit rate determined by the transmission path capacity or the transmission speed in broadcasting and communication. Therefore, in order to satisfy the bit rate, a high-efficiency coding method as described above is used.
  • independent allocation for simplicity.
  • bit amount of each channel is a fixed amount. Therefore, bit allocation that spans multiple channels is not considered.
  • the inventor's earlier proposal contributed to improving sound quality by securing common bits. However, always keeping common bits is redundant.
  • the The amount of data differs depending on the amount of information in each channel.
  • the bit amount required by the right channel is 120% of the reference, and the bit amount required by the left channel is 50% of the reference.
  • the bit amount allowed for the right channel is up to 100% of the standard, and the lack of 20% causes sound quality degradation.
  • the left channel has as much as 50% extra bit-amount of the reference, and so-called over-quality, 50% of the redundant reference bit is used for the left channel.
  • redundant bits contribute to the improvement of sound quality, but only to the extent that they cannot be perceived by human hearing.
  • the bit amount of 50% of the reference which was redundant in the left channel is reduced to 20% which is short in the right channel (for the sake of simplicity, the auxiliary allocation is called Subs i diary Al locat ion). It may be used.
  • both channels can satisfy a predetermined bit rate while maintaining high sound quality.
  • audio signals of music, movies, etc. unlike telephones, often consist of a set of multiple channels to form one piece of information. Therefore, redundant bits may be generated in any one of the multiple channels, and it is considered that dependent allocation is effective.
  • the conventional decoder (high-efficiency decoding device) decodes a recording medium on which an encode signal based on independent allocation is recorded.
  • the recording medium on which the encoded signal is recorded by the dependent distribution cannot be decoded by the conventional decoder (decoding device).
  • a decoding device for decoding a recording medium on which an encoded signal is recorded by the dependent allocation records a recording medium already on the market, that is, a signal encoded by only the independent allocation. Recording media If they cannot be decoded, there is a significant disadvantage for users.
  • the inventor's earlier proposal contributed to improving sound quality by securing common bits. However, always keeping common bits is redundant.
  • the amount of bits required by each channel differs depending on the amount of information in each channel.
  • the bit amount required by the right channel is 120% of the reference, and the bit amount required by the left channel is 50% of the reference.
  • the bit amount allowed for the right channel is up to 100% of the standard, and the lack of 20% causes sound quality degradation.
  • the left channel has as much as 50% extra bits in the reference, and as so-called over-quality, 50% of the redundant reference bits are used for the left channel.
  • redundant bits contribute to the improvement of sound quality, but only to the extent that they cannot be perceived by human hearing.
  • bit amount of 50% of the reference that was redundant in the left channel is used for the shortage of 20% in the right channel (for the sake of simplicity, auxiliary allocation: Subsidiary Allocation). Can be considered.
  • both channels can satisfy a predetermined bit rate while maintaining high sound quality.
  • audio signals of music, movies, etc. unlike telephones, often consist of a set of multiple channels to form one piece of information. Therefore, redundant bits may be generated in any one of the multiple channels, and it is considered that dependent allocation is effective.
  • a conventional decoder high-efficiency decoding device decodes a recording medium on which an encode signal based on independent allocation is recorded. For this reason, the recording medium on which the encoded signal is recorded by the dependent distribution cannot be decoded by the conventional decoder (decoding device).
  • an object of the present invention is to provide a technique capable of obtaining a compressed signal having high sound quality using dependent allocation.
  • the purpose is to propose a high efficiency coding technology.
  • Still another object of the present invention is to provide an encoding method and an encoded signal decoding method according to the present invention.
  • Still another object of the present invention is to provide an encoding method according to the present invention and a recording medium on which an encoded signal formed by the encoding device is recorded.
  • Another object of the present invention is to provide an encoding method according to the present technology, a transmission method for transmitting an encoded signal formed by the encoding device, and a transmission device.
  • the high efficiency coding method according to the present invention proposed in order to achieve the above-mentioned object is to provide a multi-channel signal for sample data in a time domain or sample data in a frequency domain.
  • This is a highly efficient coding method that adaptively allocates bits between channels. That is, the bit allocation to the channel that requires a bit amount larger than a certain reference value is divided into a first bit allocation amount that does not exceed a certain reference value at most, and a remaining second bit allocation amount. And decompose into
  • the first bit allocation amount is a range of a fixed reference value corresponding to the bit amount that can be used for data at the time of the conventional independent allocation, and considers compatibility with the conventional system.
  • the second bit allocation is a portion that exceeds the number of bits that can be used for data during the conventional independent allocation, and takes into account the sound quality of the channel.
  • the high efficiency coding method of the present invention comprises the following steps.
  • the total bit allocation amount of all the channels is made substantially constant.
  • a sample 'scale for data' factor for the second bit allocation is determined from a scale factor and a single length for the sample data for the first bit allocation.
  • the first bit allocation amount is an amount in consideration of the bit amount for sub information.
  • the second bit allocation is an amount obtained by subtracting the first bit allocation from the bit allocation required by the channel.
  • the same quantization is performed on the samples and data in the small block subdivided on the time axis and the frequency axis in the small block.
  • the output of the analysis of the non-blocking frequency characteristics and the analysis of the blocking frequency characteristics are further performed.
  • the wave number bandwidth is the same in at least the two lowest bands.
  • the analysis of the non-blocking frequency characteristic is a PQF (Polyphase Quadrature filter).
  • the frequency bandwidth for the analysis of the unblocked frequency characteristics is such that the high band is wider than the low band. You.
  • the analysis of the non-blocking frequency characteristics is based on QMF
  • the analysis of the blocking frequency characteristic is MDCT.
  • the block size is adaptively changed according to the time characteristics of the input signal. The block size change is performed independently for at least two outputs of the deblocking frequency characteristic analysis.
  • the sum of the first bit allocation portion and the second bit allocation portion of each channel varies depending on the scale factor of each channel or the maximum value of the sample data.
  • Dependent allocation changes due to temporal changes in the amplitude, such as the energy value, peak value, or average value of the signal of each channel. Or, it changes according to the temporal change of the scale and factor of each channel.
  • the amount of bits that can be used for the auxiliary allocation is at most the total amount of surplus bits of other channels.
  • the decoding method of the high-efficiency code of the present invention at the time of encoding, adaptive sub-allocation to the sample data in a time domain or a frequency domain of a plurality of channels is performed on a signal of a plurality of channels.
  • This is a high-efficiency code decoding method for decoding the encoded signal.
  • the bit allocation amount to the channel to which the bit amount larger than the predetermined reference amount is allocated is set to the first bit allocation amount not exceeding the predetermined reference amount at most and the remaining second bit amount. It is special that it is broken down into bit allocations.
  • the method for decoding a high-efficiency code of the present invention can be performed as follows.
  • the total bit amount for all channels which is the sum of the first bit allocation amount and the second bit allocation amount, is substantially constant.
  • the scale factor for the sample data for the second bit allocation is the scale for the sample data for the first bit allocation. Rules. Obtained from factors and length.
  • the first bit allocation is a bit allocation not including the auxiliary allocation bits
  • the second bit allocation is a bit allocation including the auxiliary allocation bits.
  • the same quantized sample data in the small block subdivided on the time axis and the frequency axis is decoded.
  • the output of the blocked frequency synthesis is used as the input of the non-blocking frequency synthesis to obtain the output of the non-blocking frequency synthesis.
  • the frequency bandwidth of the non-blocking frequency synthesis is the same in at least the two lowest bands.
  • the deblocking frequency synthesis is PQF.
  • the frequency bandwidth of the deblocking frequency synthesis is set wider in a high band than in a low band.
  • the deblocking frequency synthesis may be QMF.
  • the block frequency synthesis is inverse MDCT.
  • the block size is adaptively changed according to the time characteristic of the input signal. The change of the block size is performed independently for at least two input bands of the non-blocking frequency synthesis.
  • the sum of the first bit allocation amount and the second bit allocation amount of each channel is determined substantially by the scale factor or the sample maximum value of each channel. Further, the detection of a channel having a plurality of channels and to which a bit amount larger than a predetermined reference amount is allocated is performed by detecting a channel amount allocated to the channel that is larger than or equal to a second reference amount smaller than the predetermined reference amount. This is done by detecting that
  • the decoding / reproducing method of the high-efficiency code according to the present invention is characterized in that at least two samples separated and recorded in one sync block (block obtained by blocking a continuous signal in a predetermined time unit) are taken out.
  • ⁇ Consists of blocks That is, a first bit allocation sample group that allocates a bit amount larger than a certain reference amount for a plurality of channels, and a remaining second bit allocation sample group of the first bit allocation sample group for a plurality of channels. It consists of two bit allocation samples.
  • a first bit allocation sample group that allocates a bit amount larger than a fixed reference amount of each channel, and a second bit allocation sample group of the first bit allocation sample group Perform decryption reproduction from.
  • the high-efficiency coded signal recording method includes a first bit allocation sample group that allocates a bit amount larger than a fixed reference amount for a plurality of channels in one sync-block.
  • the first bit allocation sample group for a plurality of channels is recorded separately from the remaining second bit allocation sample group.
  • the first bit allocation sample group and the second bit allocation sample group are recorded alternately for each channel.
  • the recording medium of the present invention records a signal encoded by the high-efficiency encoding method of the present invention.
  • This recording medium is a movie film, a disc, a tape, and a force with a built-in semiconductor memory. That is, in the present invention, a bit allocation including the auxiliary allocation bits for the dependent allocation and a bit allocation not including the auxiliary allocation bits are obtained. The bit allocation that does not include the auxiliary allocation bits is obtained independently for each channel, and has a fixed bit allocation amount for each approximate channel.
  • the information sample in the time domain or the frequency domain in which the auxiliary allocation bits are included is used.
  • the information sample based on the bit allocation without the auxiliary allocation bits (A) and the remaining information samples (B) are divided.
  • the remaining information sample (B) is composed of the information sample (C) based on the bit allocation including the auxiliary allocation bit and the information sample based on the bit allocation including the auxiliary allocation bit. It is determined as an information sample that has a difference from the information sample (A) based on the bit allocation.
  • the time domain or frequency domain sample information (C) in which the auxiliary allocation bit is set Is used as the bit allocation of the channel.
  • the bit allocation amount including the auxiliary allocation bits is not included in the decoder.
  • the information sample (A) based on the bit allocation without the auxiliary allocation bit is reproduced.
  • the bit allocation amount including the auxiliary allocation bits is equal to or smaller than the bit allocation amount not including the auxiliary allocation bits, it is sufficient to reproduce the auxiliary allocated information sample (C).
  • the auxiliary allocation bit sample information is replaced with the auxiliary allocation bits.
  • the information sample (A) based on the bit allocation that does not include the information sample and the remaining information sample (B) may be decoded and added together.
  • the bit allocation amount of the information sample (A) and the bit allocation amount of the information sample (B) may be added.
  • the scale factor for normalizing the sample data relating to the bit allocation of the information sample (B) is calculated as
  • the scale factor relating to the bit allocation of the information sample (B) can be sent from the encoder side to the decoder side. This can be generated on the decoding side, and therefore the amount of information required for recording / transmission can be reduced.
  • the bit allocation amount to the channel is larger than the second reference amount smaller than the predetermined reference amount. This is useful because it is not necessary to send dedicated data from the encoder to the decoder.
  • the same quantization is performed on the samples in the small block subdivided on the time axis and the frequency axis in the small block.
  • the output of the analysis of the non-blocking frequency characteristics such as the filter is subjected to the blocking frequency characteristics such as an orthogonal transform. Perform an analysis.
  • the fact that the frequency bandwidth of the analysis of the non-blocking frequency characteristic is the same in at least the two lowest bands is useful in reducing costs.
  • an optimal process corresponding to the time characteristic of the input signal can be performed by adaptively changing the block size according to the time characteristic of the input signal. Performing at least two independent changes of the block size for each of the output bands of the non-blocking frequency characteristic analysis prevents mutual interference between frequency components. This is effective because optimal processing is performed independently for each band component.
  • the amount of bits allocated to each channel is determined by the scale factor or sample maximum value of each channel, which is effective in reducing the number of operations.
  • bit allocation amount given to each channel by the temporal change of amplitude information represented by the scale factor of each channel is also beneficial in making quantization noise difficult to detect. is there.
  • sync block including information for sync the first bit allocation sample group for a plurality of channels and the second bit allocation sample group for a plurality of channels are separated and sd I do.
  • the bit allocation amount to a channel that allocates a bit amount larger than a certain reference amount to a signal of a plurality of channels is set to a first bit allocation amount that does not exceed a certain reference amount at most.
  • a decoder that uses an adaptive bit allocation technique in the frequency domain and the time domain for each channel using a bit rate equal to or less than a fixed value for each channel. Therefore, it is possible to provide an audio system that requires high-quality sound quality and a system that is suitable for recording and reproducing sound of a movie.
  • the scale factor for the sample's data for the second bit allocation is By obtaining the scale factor and word length for the pull data, the scale factor for the sample data for the second bit allocation can be decoded without sending it from the encoder side to the decoder side. It can be made on one side, and the amount of information required for recording and transmission can be reduced.
  • the bit amount of the first bit allocation amount which is a bit allocation that does not include the auxiliary allocation bits that does not exceed the predetermined reference amount at most, is larger than the second reference amount smaller than the predetermined reference amount.
  • the effect of hearing based on the critical band can be used efficiently.
  • an optimal process corresponding to the time characteristics of the input signal can be performed by appropriately changing the block size according to the time characteristics of the input signal.
  • Performing the block size change independently for at least two output bands of the non-blocking frequency characteristic analysis prevents mutual interference between frequency components and performs optimal processing independently for each band component. It is effective to do it.
  • FIG. 1 is a block circuit diagram showing a configuration example of a high efficiency coding apparatus according to the present invention.
  • FIGS. 2A and 2B are diagrams illustrating frequency and time division of a signal in the high efficiency coding apparatus according to the present invention.
  • FIG. 3 is a block circuit diagram showing an example of a configuration for obtaining a bit allocation parameter in multiple channels of the high efficiency coding apparatus according to the present invention.
  • 4A to 4H are diagrams illustrating the concept of performing bit allocation between channels according to the magnitude of the spectrum.
  • FIGS. 5A to 5H are diagrams showing how to determine parameters for bit allocation in consideration of the time characteristics of signals between channels.
  • FIG. 6 is a diagram showing the relationship between the bit allocation amount of bit allocation (1) and tonality.
  • FIG. 7 is a diagram showing the relationship between the bit allocation amount of bit allocation (1) and the time change rate.
  • FIG. 8 is a diagram showing a noise spectrum at the time of uniform distribution.
  • FIG. 9 is a diagram showing an example of a noise spectrum by bit allocation for obtaining an auditory effect having dependency on the frequency spectrum and level of a signal.
  • FIG. 10 is a block circuit diagram showing a configuration for realizing a bit allocation method using two of the signal magnitude and the permissible noise spectrum.
  • FIG. 11 is a block circuit diagram showing a configuration for obtaining an allowable noise level.
  • FIG. 12 is a diagram showing an example of the masking threshold based on the signal level of each band.
  • FIG. 13 is a diagram showing an information spectrum, a masking threshold, and a minimum audible limit.
  • FIG. 14 is a diagram illustrating signal level dependence and permissible noise level dependent bit allocation for signals with low tonality.
  • FIG. 15 is a diagram showing bit allocation depending on the signal level and the permissible noise level for a signal with high tonality.
  • FIG. 16 is a diagram illustrating a quantization noise level for a signal with low tonality.
  • FIG. 17 is a diagram showing a quantization noise level for a signal with high tonality.
  • FIG. 18A and FIG. 18B are diagrams showing the relationship of bit allocation in multi-channel.
  • FIG. 19 is a block circuit diagram showing the relationship between the first and second quantization circuits.
  • FIG. 20 is a diagram schematically showing an array of data in a sync block.
  • FIG. 21 is a block circuit diagram showing a configuration example of a high-efficiency code decoding apparatus according to the present invention.
  • FIG. 22 is a flowchart of bit allocation in the high-efficiency encoding method according to the present invention.
  • BEST MODE FOR CARRYING OUT THE INVENTION a high-efficiency encoding apparatus (encoder) to which the high-efficiency encoding method of the present invention is applied, and a high-efficiency code decoding method (high-efficiency code decoding) of the present invention
  • An embodiment of a high-efficiency code decoding device (decoder) to which the (reproduction method) is applied will be described with reference to the drawings.
  • an input digital signal such as an audio PCM signal is highly encoded using band division coding (SBC), adaptive transform coding (ATC), and adaptive bit allocation (APC-AB). Perform efficiency coding. This technique will be described with reference to FIG.
  • FIG. 1 shows a high efficiency coding apparatus according to an embodiment to which the present invention is applied.
  • the outline is that an input digital signal in the time domain is divided into a plurality of frequency bands by QMF, and orthogonal transform is performed for each frequency band to obtain spectrum data in the frequency domain.
  • It is a high-efficiency encoder that encodes data by adaptively allocating bits for each critical band.
  • the non-blocking frequency division width by QMF may be an equal division width.
  • the block size (block length) is adaptively changed according to the input signal prior to the orthogonal transformation, and the critical band unit is determined.
  • ⁇ Floating processing is performed on bands that are further subdivided.
  • the floating process is a process of normalizing a plurality of data values based on one index.
  • the input terminal 10 is supplied with an audio PCM signal of, for example, 0 to 22 kHz.
  • a normal audio band of 0 to 20 kHz is sufficient, but by extending the high frequency range to 22 kHz, higher quality audio signals are handled.
  • This input signal is first divided into a band of 0 to 11 kHz and a band of 11 k to 22 kHz by a band division filter 11 composed of QMF.
  • the signal in the 0 to 11 kHz band is further divided into a 0 to 5.5 kHz band and a 5.5.k to ll kHz band by the band division filter 12, which is also composed of QMF.
  • the signals in the respective bands from the band division filters 11 and 12 are sent to MDCT circuits 13 to 15 which are orthogonal transform circuits, where they are respectively converted into MDCT coefficients.
  • MDCT is performed for each band based on the block size determined by the block determination circuits 19 to 21.
  • FIGS. 2A and 2B a specific example of the block size in each of the MDCT circuits 13 to 15 determined by the block determination circuits 19 to 21 is shown in FIGS. 2A and 2B.
  • Fig. 2A shows the case where the orthogonal transform block size is long in the time axis (long mode)
  • Fig. 2B shows the case where the orthogonal transform block size is short in the time axis (short mode). Is shown.
  • each of the three filter outputs has two orthogonal transform block sizes.
  • the number of samples in one block is set to 32 o
  • the number of samples of the orthogonal transform block in each band is made the same, so that the higher the frequency, the higher the time resolution, and the number of windows for MDCT is reduced.
  • the signal indicating the block size determined by the block determination circuits 19 to 21 is supplied to each of the MDCT circuits 13 to 15 so that the window is switched, and the adaptive bit allocation coding described later is performed. It is sent to circuits 16 to 18 and output from output terminals 25 to 27, and is used for recording and transmission.
  • the MDCT coefficient data which is the spectrum data in the frequency domain obtained by the MDCT processing in each of the MDCT circuits 13 to 15, is further processed in the critical region or in the high frequency region.
  • the critical bands are divided into bands and sent to the adaptive bit allocation coding circuits 16 to 18.
  • the block size information and the amount of bits allocated for each critical band or for each band obtained by further dividing the critical band in the high frequency band are used.
  • the adaptive bit allocation encoding circuits 16 to 1 allocate the bit amount for each block, with the upper limit of the bit amount specified for each channel.
  • a digital signal (MDCT coefficient) indicating the spectrum distribution of each channel is supplied to the adaptive bit allocation circuit 30 via the terminal 29.
  • the adaptive bit allocation circuit 30 outputs a block signal of each channel.
  • the usable bit amount is supplied to the adaptive bit allocation encoding circuits 16 to 18 via the terminal 28.
  • data encoded with a predetermined bit amount is output. It is taken out via force terminals 22 to 24.
  • the adaptive bit allocation coding circuits 16 to 18 obtain a scale factor signal related to normalization and a code length signal indicating which key length has been requantized. Is output from the output terminals 22 to 24 as sub-information.
  • the outputs of the MDCT circuits 13 to 15 in FIG. 1 are the energy of each band obtained by dividing the critical band or the critical band in the high frequency band, and the square of the amplitude value of each band. It can be obtained by calculating the square root of the average.
  • the scale factor itself may be used for subsequent bit allocation. In this case, the calculation of energy calculation is not required, and the hardware scale is saved. Instead of the energy for each band, it is also possible to use the peak value and the average value of the amplitude value.
  • the number of audio signal channels is set to 8 (CH1 to CH8) for a movie as an example.
  • the input signal from each channel is supplied to the corresponding input terminal 31 of each channel.
  • the terminal 31 corresponds to the terminal 29 in FIG.
  • the input signal is subjected to frequency analysis (spectrum distribution) of the input signal by a mapping circuit (Mapping) 32.
  • time-domain sample data will be obtained as a subband signal.
  • frequency domain sample data When orthogonal transform is used or when orthogonal transform is used after filtering, frequency domain sample data must be obtained. become.
  • sample data are grouped by a plurality of samples data by a blocking circuit 33.
  • a filter when a filter is used, multiple samples in the time domain are combined, and when orthogonal transform is used after orthogonal transform and filtering, multiple samples in the frequency domain are combined.
  • the time change (V) of the sample data sequentially mapped according to the input signal is calculated by the time change calculation circuit 34. By reflecting the transient change of the input signal in the bit allocation, a higher quality signal can be obtained.
  • Each sample collected for each of the plurality of samples by the blocking circuit 33 is normalized by a normalization circuit 37.
  • the scale factor (SF) which is a coefficient for normalization, is obtained by the scale factor calculating circuit 35. Efficiently compress digital signals by using one common scale factor for multiple samples
  • Tonality (T) refers to the undulation of the spectrum distribution of the input signal, and an input signal having a large undulation is referred to as a signal having a high tonality. Details will be described later.
  • the parameters such as the time change (V), scale, facsimile (SF), and tonality (T) of the sample data obtained above are used by the bit allocation circuit 38 for calculating the bit allocation.
  • the bit allocation calculation is basically an adaptive bit allocation according to the input signal. More specifically, there are independent allocation according to the spectrum distribution and transient characteristics of the input signal of each channel, and dependent allocation using correlation between channels. In addition, the distribution is adjusted according to the importance of each channel, the purpose of use, and the signal bandwidth.
  • the bit allocation circuit 38 of this embodiment uses the first bit allocation including the dependent allocation bits (the first bit allocation). Bit allocation) and the second bit allocation not including the dependent allocation bits (second bit allocation).
  • bit allocations are supplied to an adaptive bit allocation encoding circuit via a terminal 39 (terminal 28 in FIG. 1) for each channel.
  • bit allocation including the dependent allocation bits.
  • bit allocation is performed appropriately by looking at the frequency distribution of the scale factor (SF).
  • effective bit allocation can be performed by performing dependent allocation according to the frequency domain distribution of the scale factor (SF) of all channels.
  • SF scale factor
  • bit allocation is performed as in the following equation.
  • Bm is the bit allocation to each channel
  • B is the bit allocation to all channels
  • SFn is the scale factor index, which roughly corresponds to the logarithm of the peak value.
  • n is the block for each channel. • The floating band number, m is the channel number, and St is the sum of the scale and factor indices for all channels.
  • FIGS. 4A and 4H only the channel CH1 and the channel CH8 are shown, and the illustration of the channels CH2 to CH7 is omitted.
  • the bit allocation circuit 38 has a process of detecting the time change characteristic (V) of the signal of each channel and changing the independent allocation amount based on this index. A method of obtaining the index indicating the time change will be described with reference to FIGS. 5A to 5H.
  • a bit allocation time block which is a time unit of bit allocation, is temporally divided into four for each information input signal of each channel.
  • bits are shared between channels according to the magnitude of the difference where the peak value of each sub-block changes from small to large.
  • the magnitude of the difference where the peak value of each sub-block of each channel changes from small to large is a (Fig. 5A ), B (Fig. 5B), ⁇ ⁇ ⁇ ⁇ h (Fig. 5H)
  • FIGS. 5A to 5H show only FIGS. 5A, 5B, and 5H corresponding to channels CH1, CH2, and CH8, and FIGS. 5C to 5G corresponding to channels CH3 to CH7. Is omitted for Next, a second bit allocation method that does not include the dependent allocation bits will be described. As the second bit allocation method, two more bit allocation methods will be described.
  • bit allocation (2-1) and bit allocation (2-2), respectively.
  • bit allocation the bit amount assigned to each channel is a fixed value for each channel.
  • two relatively important bits of 147 kbps are allocated to two channels that carry important parts such as voice, the sub-channels are assigned at most 2 kbps, and the other channels are at most 2 kbps.
  • the amount of bits to be used for bit allocation (2-1) is determined.
  • the tonality information (T) and the time change information (V) of the signal information (b) are used among the spectrum information of the signal information (a).
  • the tonality information (T) is explained.
  • the value obtained by dividing the sum of the absolute values of the differences between adjacent values of the signal spectrum by the number of signal spectra is used as an index. More simply, use the average value of the differences between adjacent scale and factor indices for each block's scale factor for block 'floating'.
  • the scale factor indicator corresponds to the approximate logarithmic value of the scale factor.
  • the bit amount to be used for the bit allocation (2-1) is set to a maximum of 80 kbps and a minimum of 10 kbps in correspondence with the value indicating the tonality.
  • the allocation for all channels is equally set to 100 kbps.
  • Tonality calculation is performed as follows.
  • SFn is a scale factor index that roughly corresponds to the logarithm of the peak value.
  • n is the block number of the floating band.
  • the bit allocation amount of -1) is associated as shown in FIG.
  • the division ratio between the bit allocation (2-1) and at least one other bit allocation added thereto depends on the time change characteristic (V) of the signal.
  • V time change characteristic
  • the peak value of the signal information is compared for each of the adjacent blocks in each of the time sections in which the size of the orthogonal transform time block is further divided.
  • a portion where the amplitude of the signal sharply increases is detected by comparing two dimensions on the time axis and the frequency axis, and the division ratio is determined according to the state.
  • the calculation of the time change rate is performed as follows.
  • V t ⁇ Vm
  • V a v UZVma x) * (1 / C h) V t
  • Vt is the sum of the change in the peak value of the time sub-block for each channel from small to large in dB, but for the channel
  • Vm is the change in the peak value of the time sub-block for each channel from small to large Is expressed in dB and the size of the largest one (however, the maximum value is limited to 30 dB and expressed as Vmax.
  • M is the channel number
  • Ch is the number of channels
  • V a V is the smaller peak value of the time sub-block.
  • the change from large to large is expressed in dB and is the channel average.
  • the time rate of change Va V thus obtained and the amount of bit allocation (2-1) are associated with each other as shown in FIG. Finally, the amount allocated to bit allocation (2-1) can be calculated by the following formula.
  • B is the amount allocated to the final bit allocation (2-1)
  • B f is the bit allocation amount obtained from Tva
  • B t is the bit allocation amount obtained from V a V.
  • bit allocation (2-1) here is performed in the frequency and time domain depending on the scale factor.
  • bit allocation (2-1) the amount of bits used for bit allocation (2-1) is determined. Then, the allocation for the bits not used in the bit allocation (2-1) is determined, that is, the bit allocation (2-2). In the bit allocation (2-2), the following various bit allocations are performed.
  • FIG. 8 shows an example of the quantization noise spectrum in this case.
  • the noise level is reduced uniformly in all frequency bands. That is, the noise level (dotted line NL 1) in the first bit distribution is uniformly reduced to the noise level indicated by the dotted line NL 2 by the uniform distribution.
  • Such a uniform distribution is effective when the input signal is a low-tonality, smooth signal.
  • the bit allocation for obtaining the audible effect is made dependent on the frequency spectrum and level of the signal information. Do.
  • FIG. 9 shows an example of the quantization noise spectrum for the bit allocation in this case.
  • bits are allocated depending on the spectrum of the signal, and in particular, bits are allocated with weights on the lower side of the spectrum of the signal, and compared with those on the higher side.
  • weights on the lower side of the spectrum of the signal, and compared with those on the higher side.
  • bit allocation is performed with emphasis on low frequencies. That is, the noise level (dotted line NL 1) in the first bit allocation is changed to the dotted line NL 2 by the bit allocation for obtaining the auditory effect having a dependency on the frequency spectrum and the level. Reduce to the noise level indicated by.
  • bit allocation circuit 38 in FIG. The final bit allocation is given as the sum of the above bit allocations.
  • the input signal is given as the sum of the outputs (MDCT coefficients) of the MDCT circuits 13 to 15.
  • the MDCT coefficient is supplied to input terminal 801.
  • the MDCT coefficient supplied to the input terminal 801 is supplied to the energy calculation circuit 803 for each band.
  • the energy calculation circuit 803 for each band calculates, in the critical band or the high band, the signal energy of each band obtained by further subdividing the critical band.
  • the energy for each band calculated by the energy calculation circuit 803 for each band is supplied to the energy-dependent bit distribution circuit 804.
  • the total available bits from the total available bit generation circuit 802 a bit of 128 kbps in this embodiment, for example, a bit that creates white quantization noise using 100 kbps. Make an allocation. At this time, the higher the tonality of the input signal, that is, the greater the unevenness of the spectrum of the input signal, the greater the ratio of this bit amount to the above 128 kbps.
  • bit allocation is performed in proportion to the logarithmic value of the energy of each band.
  • the bit allocation calculation circuit 805 depending on the permissible noise level of the critical band takes into account the so-called masking effect and the like. Find the allowable noise amount.
  • a permissible noise spectrum was given. In this way, bits are calculated by subtracting the energy-dependent bits from the total available bits. The energy-dependent bits thus obtained and the bits depending on the permissible noise level are added, and output from the output terminal 807 as a bit distribution signal.
  • the bit allocation signal is converted into the bit amount allocated to each critical band or to a band obtained by further dividing the critical band into a plurality of bands in the high band. Accordingly, each spectrum data (or MDCT coefficient data) is requantized. The data encoded in this way is taken out via the output terminals 22 to 24 in FIG.
  • the MDCT coefficients obtained by the MDCT circuits 13 to 15 are calculated as follows. Provided to the calculation circuit.
  • FIG. 11 is a block circuit diagram showing a schematic configuration of a specific example in which the allowable noise calculation circuit is collectively described.
  • spectrum data in the frequency domain from the MDCT circuits 13 to 15 is supplied to the input terminal 5 21.
  • the input data in the frequency domain is sent to the energy calculation circuit 522 for each band, and the energy for each critical band (critical band) is calculated, for example, by summing the square of each amplitude value in the band. It can be obtained by calculating. Instead of the energy for each band, a peak value or an average value of the amplitude value may be used.
  • the spectrum of the total value of each band is generally called a bark spectrum.
  • Figure 12 shows such a bark vector SB for each critical band. However, in FIG. 12, for simplicity of illustration, the number of the critical bands is represented by 12 nodes (Bl to B12).
  • the convolution filter circuit 523 includes, for example, a plurality of delay elements for sequentially delaying input data, and a plurality of multipliers (for example, for each band) for multiplying an output from these delay elements by a filter coefficient (weighting function). (The corresponding 25 multipliers) and a sum adder that sums the outputs of the multipliers.
  • the above-mentioned masking is a phenomenon in which a certain signal masks another signal and becomes inaudible due to human auditory characteristics, and the masking effect includes a time caused by an audio signal in a time domain.
  • the masking effect includes a time caused by an audio signal in a time domain.
  • the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 523 when the coefficient of the multiplier M corresponding to an arbitrary band is set to 1, the multiplier M — 1 for coefficient 0.15, multiplier M—2 for coefficient 0.019, multiplier M-3 for coefficient 0.00 0 0 86, multiplier M + 1 for coefficient
  • the fold of the Barks vector SB is multiplied. Is performed.
  • M is any integer from 1 to 25.
  • the subtracter 524 calculates a level corresponding to an allowable noise level described later in the convolved region.
  • the level ⁇ corresponding to the permissible noise level is determined by performing inverse convolution processing as described later to determine the permissible noise level of each critical band. It is at such a level.
  • an allowance function (a function expressing a masking level) for obtaining the level ⁇ is supplied to the subtractor 524.
  • the level is controlled by increasing or decreasing the allowable function.
  • the permissible function is supplied from a (II-ai) function generation circuit 525 as described below.
  • the level corresponding to the allowable noise level can be obtained by the following equation, where i is a number sequentially given from the lower band of the critical band.
  • n and a are constants, a> 0, and S is the intensity of the convolution-processed bark vector, where (n-ai) is an allowable function.
  • the divider 526 is for inversely convolving the level in the convolved region. Therefore, by performing the inverse convolution processing, a masking threshold can be obtained from the above level. That is, this masking 'threshold' is the allowable noise spectrum. Note that the above inverse convolution process requires complicated calculations, but in this embodiment, inverse convolution is performed using a simplified divider 526.
  • the masking threshold is transmitted to the subtracter 528 via the synthesis circuit 527.
  • the output from the energy detection circuit 522 for each band, that is, the above-described bark vector SB is supplied to the subtracter 528 via the delay circuit 529. I have.
  • the subtraction of the masking threshold and the bark vector SB is performed by the subtractor 528, as shown in FIG. 13, so that the bark vector SB becomes the masking threshold.
  • the delay circuit 529 is provided for delaying the bark vector SB from the energy detection circuit 522 in consideration of the amount of delay in each circuit before the synthesis circuit 527.
  • the output from the subtracter 528 is taken out via an allowable noise correction circuit 530 and via an output terminal 531.
  • the output to a ROM or the like (not shown) in which distribution bit amount information is stored in advance.
  • Sent. The ROM and the like are provided in accordance with the output (the level of the difference between the energy of each band and the output of the noise level setting means) obtained from the subtraction circuit 528 via the permissible noise correction circuit 530. Outputs the allocated bit amount information for each band.
  • each spectrum data in the frequency domain from the MDCT circuits 13 to 15 is quantized by the bit amount allocated to each band.
  • the critical band is further divided into a plurality of bands for each of the critical and band bands (critical band) or in the high band.
  • the spectrum data for each band is quantized by the bit amount distributed according to the level of the difference between the energy or peak value of the noise and the output of the noise level setting means.
  • the human audible curve shown in FIG. It is possible to combine the data showing the so-called minimum audible curve RC, which is a perceptual characteristic, with the above masking threshold MS. At this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard.
  • This minimum audible curve differs depending on the playback volume at the time of the era, even if the encoding method is the same.
  • a digital audio system that actually uses music as a sound source, for example, in digital recording using 16-bit quantization, there is no significant difference in the minimum audible curve.
  • quantization noise in the most audible frequency band around 4 kHz is not heard, quantization noise below the level of the minimum audible curve in other frequency bands may not be heard.
  • the allowable noise level in this case can be up to the shaded portion in FIG.
  • the 4 kHz level of the minimum audible curve is adjusted to the lowest level corresponding to, for example, 20 bits.
  • FIG. 13 also shows the signal spectrum S S at the same time.
  • the allowable noise correction circuit 530 corrects the allowable noise level in the output from the subtracter 528 based on, for example, information on the equal loudness and the curve sent from the correction information output circuit 533. are doing.
  • the equal loudness curve is a characteristic curve relating to human auditory characteristics.
  • the loudness curve is obtained by calculating the sound pressure of sound at each frequency that sounds as loud as a pure tone of 1 kHz. Also called the loudness isosensitivity curve.
  • This equal loudness curve is almost the same as the minimum audible curve RC shown in Fig. 13.
  • this equal loudness curve For example, at around 4 kHz, even if the sound pressure is 8 to 10 dB lower than at 1 kHz, it sounds the same as 1 kHz, and conversely, at around 50 Hz, the sound pressure is not higher than the sound pressure at 1 kHz by about 15 dB. It doesn't sound large.
  • the noise (allowable noise level) exceeding the level of the minimum audible curve should have a frequency characteristic given by a curve corresponding to the equal loudness curve. From this, it can be understood that the above-mentioned permissible noise level is corrected in consideration of the above equal loudness curve, and that it is more suitable for human auditory characteristics.
  • the spectrum shape depending on the permissible noise level described above is created with a certain percentage of the available bits of 128 kbps. This ratio decreases as the tonality of the input signal increases.
  • the signal from the input terminal 801 to which the output of the MDCT circuit is supplied is also supplied to the spectrum smoothness calculation circuit 808, where the spectrum smoothness is calculated. Is calculated.
  • a value obtained by dividing the sum of the absolute values of the differences between the adjacent values of the absolute value of the signal spectrum by the sum of the absolute values of the signal spectrum is defined as the smoothness of the above-mentioned spectrum. It has been calculated.
  • the output of the above-described spectrum smoothness calculation circuit 808 is supplied to a bit division ratio determination circuit 809, where the energy-dependent bit allocation and the bit allocation based on the permissible noise vector are determined.
  • the bit division ratio is determined.
  • the bit division ratio is considered that the larger the output value of the spectrum smoothness calculation circuit 808 is, the less smooth the spectrum is, and the permissible noise spectrum is more than the energy-dependent bit allocation.
  • Bit allocation is performed with emphasis on the bit allocation by.
  • the bit division ratio determining circuit 809 is a multiplier that controls the size of the energy-dependent bit allocation and the size of the bit allocation based on the permissible noise vector. Sends control output to input 811 and 812.
  • the output of the bit division ratio decision circuit 809 to the multiplier 810 takes a value of 0.8 so that the spectrum is smooth and the weight of the energy-dependent bit distribution is emphasized.
  • Figures 14 and 15 show how the bits are allocated at this time.
  • Figures 16 and 17 show the corresponding quantization noise.
  • FIG. 14 shows the case where the signal spectrum shows low tonality
  • FIG. 15 shows the case where the signal spectrum shows high tonality.
  • QS indicated by oblique lines indicates a bit amount corresponding to a signal level.
  • QN shown in white represents the amount of bits dependent on the permissible noise level.
  • SS indicates the signal level
  • NS indicates the noise reduction due to the bit allocation depending on the signal level
  • NN indicates the noise reduction due to the bit allocation depending on the permissible noise level.
  • bit allocation depending on the permissible noise level helps to obtain a large signal-to-noise ratio over the entire band.
  • relatively low bit allocation is used in the low and high bands. This is because the sensitivity to noise in this band is small.
  • the amount of bit allocation depending on the signal energy level is small in amount, in order to generate a white noise spectrum, in this case, it is mainly allocated to the frequency region where the signal level in the middle and low frequencies is high. I have.
  • the improvement of the characteristics in the isolated spectrum input signal is achieved by the sum of the two bit allocations.
  • the first and second quantizations are performed as follows using the bit allocation including the dependent allocation bits and the bit allocation not including the dependent allocation bits obtained as described above. .
  • FIG. 18A and FIG. 18B show the number of bits required for each channel for the eight-channel audio signal, that is, the number of bits required without deteriorating the sound quality of each channel.
  • Fig. 18A only the grid pattern (CH2, CH4, CH5, CH7, CH8) or the sum of both the grid pattern and the diagonal pattern (CHI, CH3, CH6) indicates the bits required by each channel. Indicates the amount. Among these, the hatched pattern indicates the bit amount corresponding to the auxiliary distribution bit. The dot pattern indicates the surplus bits (R).
  • the channels that require a bit amount exceeding 147 kbps out of all eight channels are channel CH1, channel CH3, and channel CH6.
  • the part (I) that maximizes a certain bit amount for example, 147 kbps, and 147 kbps And the part beyond (S).
  • the input signal is divided into a portion quantized by the bit amount of 147 kbps corresponding to the independent allocation and a portion quantized by the bit amount of the auxiliary allocation. And each is quantized by that bit amount.
  • the input signal of a 16-bit digital code is decomposed into a 10-bit part including the MSB and a 6-bit part including the LSB, and the 10-bit part is quantized by independent allocation and the 6-bit part by auxiliary allocation ⁇
  • the signal supplied to the input terminal 900 is gain-adjusted by the gain adjuster 905.
  • the quantizer 901 performs requantization at each sample word length according to the bit amount (147 kbps) in the bit allocation not including the auxiliary allocation bits. At this time, in order to reduce the quantization noise, re-quantization by rounding is performed.
  • the sample word length can be fixed. In this case, it is difficult to set the bit amount close to the bit amount (147 kbps).
  • the sample word length adaptively variable according to the input signal.
  • the data amount from the quantizer 901 is integrated, and the quantizer 901 is subjected to feedback control so as to approach 147 kbps.
  • the difference between the input and output of the quantizer 901 is taken by a differentiator 902, and the gain is adjusted by a gain adjuster 906. Given.
  • the difference between the sample word length of the input signal and the sample word length by the bit allocation not including the auxiliary allocation bits is calculated.
  • the sample word length is obtained. That is, several bits on the LSB side of the input signal are obtained.
  • the floating coefficient at this time is automatically determined from the floating coefficient and word length used in the first quantizer 901. That is, when the word length used in the first quantizer 90 1 is N bits, the floating coefficient used in the second quantizer 93 is obtained by (2 ** N). .
  • a channel whose required bit amount exceeds 147 kbps is divided into data with a bit allocation of less than 147 kbps and as close to 147 kbps as possible and data with the remaining bit allocation.
  • the channel uses that bit allocation as it is.
  • the bits based on the dependent allocation are included in the bits corresponding to the independent allocation indicated by the lattice pattern (I) and the auxiliary allocation bits (S) indicated by the hatched pattern.
  • all bits of each channel are the sum of the independently allocated bits and the dependent allocated bits regardless of the presence or absence of the auxiliary bits.
  • the portion below 147kbps indicated by the grid pattern (I) is allocated independently. Bits are allocated, and the auxiliary allocation bits (S) indicated by the hatched portions are allocated by the dependent allocation. In other words, for all the bits of each channel, all the auxiliary bits are dependent bits.
  • the bit allocation is performed only for the channels CH1, CH3, and CH6 in consideration of the correlation between the channels, that is, the bit allocation is performed using the dependent allocation. And the auxiliary allocation bit.
  • the advantage of this method is that the calculation for bit allocation is easier.
  • the size of the remaining components of the bit allocation can be calculated from the scale factor of the bit allocation (1) and the word length as shown in FIG. Only the length is needed for the decoder.
  • Figure 22 shows an example of a flow chart for performing the above bit allocation.
  • the required bit amount is calculated for each channel (S10).
  • the channel requesting the bit amount exceeding the reference amount is specified (S11).
  • bit allocation to each channel When the bit allocation to each channel is determined, first, independent allocation is performed for a part of the allocated bit amount (S16). Subsequently, dependent allocation (S17) is performed with the remainder of the allocated bit amount.
  • S18 When the distribution to each channel is completed, it is determined whether or not the auxiliary distribution is performed for each channel (S18), and the auxiliary distribution is performed for the channels for which the bit allocation exceeding the reference amount is performed (S19). Auxiliary allocation is not performed for channels for which the bit allocation does not exceed the reference amount (S20).
  • FIG. 18A does not mention sub-information. However, in practice, not only bits for data but also bits for sub-information for restoring the data must be considered. Therefore, Fig. 18B shows an example that considers sub-information.
  • the bit allocation required for a certain channel is more than 128 kbps and less than 147 kbps, the data portion exceeding 128 kbps reduces the bits available for sub information.
  • this channel has a bit allocation smaller than 128 kbps and does not include the auxiliary allocation bits, and performs a bit allocation as close as possible to 128 kbps.
  • the bit reduction amount is a maximum of 19 kbps, that is, the amount of sub-information, and this is more advantageous in consideration of compatibility.
  • channel CH1 is divided into two parts: a certain bit amount, for example, a part (la) maximizing 128 kbps and a part exceeding 128 kbps (lb, S).
  • a certain bit amount for example, a part (la) maximizing 128 kbps and a part exceeding 128 kbps (lb, S).
  • the input signal is divided into a portion quantized at 128 kbps corresponding to independent distribution and a portion quantized at a distribution exceeding 128 kbps, and each is quantized by the allocated bit amount.
  • the first quantizer 90 1 and the second quantizer 90 3 perform bit allocation including rounding processing.
  • the upper bits are quantized and coded by the two quantizers with a bit allocation of less than 128 kbps and close to 128 kbps.
  • the lower-order bits are quantized and coded by bit allocation over 128 kbps.
  • the amount of bits that can be used for auxiliary allocation is limited.
  • the total amount of bits required for the auxiliary allocation is the sum of the shaded portions (S) of CHI, CH3, and CH6, and more specifically, the sub information of each channel is also considered.
  • S shaded portions
  • bit rate of all channels is fixed, in Fig. 18A, the sum of the surplus bits (R) of channels CH2, CH4, CH5, CH7 and CH8 can be used for auxiliary allocation.
  • the maximum bit amount corresponds to the maximum bit amount. If the upper limit of the bit rate is 800 kbps as in the present embodiment, the amount of bits that can be used for auxiliary allocation is considerably reduced.
  • the allocated bit amount is reduced (S15). In addition, it is also effective to uniformly reduce the amount of distribution or to prioritize the allocation of specific channels.
  • the scale factor of the data by the auxiliary allocation can be calculated from the scale factor and the word length of the data by the bit allocation corresponding to the independent allocation.
  • each channel obtained by the quantizers 90 1 and 90 3 The data of the flannel is arranged into a sink and a block in units of a predetermined time.
  • the arrangement of data for each channel is schematically shown in Figure 20.
  • FIG. 20 shows the data arrangement in the example of FIG. 18B described above. That is, during the sync block,
  • Channel data not using the auxiliary allocation that is, channel data (CH2, CH4, CH5-, CH7, CH8) with bit allocation of 128 kbps or less, indicated by a grid pattern
  • Channel data (CHI, CH3, CH6) of the part of the channel data using the auxiliary distribution, which is based on the auxiliary distribution exceeding 128 kbps, is indicated by a hatched pattern.
  • a decoder that does not use auxiliary allocation uses only the channel data in (1) and (2). Therefore, all channels can be treated in the same way as data without auxiliary allocation.
  • the channel data (CHI, CH3, CH6) based on the sub-allocation is, for example, only the data in the MSB section because the sub-allocation data is not used. Therefore, the quantization step is coarsely requantized, and the sound quality is degraded. However, it is considered to be a deterioration that is not a problem for hearing.
  • the channel data (CHI, CH3, CH6) by the auxiliary distribution forms a complete word in which the MSB portion and the LSB portion are combined.
  • extremely high-quality audio signals can be decoded.
  • the number of channels using the auxiliary allocation bits is three. In fact, only the front two channels that are If you decide to use the auxiliary allocation bits, it will simplify the processing of the sync blocks. Conversely, when the channel that uses the auxiliary allocation bit is not determined, that is, when the channel that uses the auxiliary allocation bit is switched adaptively according to the input signal, it is easy to assign a channel ID to each data. Can respond to. For this ID, it is only an increase of 3 bits of data per channel.
  • a gain adjuster 907 corresponding to the gain adjuster 906 and a gain adjuster 908 corresponding to the gain adjuster 905 are provided in the decoder corresponding to the encoder.
  • the outputs of these gain adjusters 907 and 908 are added by an adder 904. The sum output is taken from the output terminal 910.
  • the addition output is the addition output of the data from the independent allocation and the data from the auxiliary allocation, and is considered to be complete data.
  • FIG. 21 shows a basic decoding apparatus according to an embodiment of the present invention for decoding a signal which has been thus efficiently coded, again.
  • the quantized MDCT coefficients of each band are given to the input terminals 122 to 124 of the decoding device, and the block size information used is input to the input terminals 125 to 1 2 7 is given.
  • Decoding circuits 1 16 to 1 18 release bit allocation using adaptive bit allocation information
  • the frequency domain signal is converted into a time domain signal.
  • These partial band time domain signals are decoded into full band signals by the I-QMF circuits 112, 111.
  • the channel where the bit allocation of 128 kbps or less (1) is performed, the portion where the bit allocation of 147 kbps or more (2) is performed and the portion where the maximum is 128 kbps, and the portion by the auxiliary allocation bit are decoded by the decoding circuits 116 to 118, respectively.
  • the recording medium of the embodiment of the present invention is for recording the signal encoded by the high-efficiency encoding apparatus of the embodiment of the present invention as described above.
  • the above-mentioned encoded signal is recorded on a disk-shaped recording medium such as an optical disk, a magneto-optical disk, a magnetic disk, or the like, or the above-mentioned encoded signal is recorded on a magnetic tape or the like.
  • the method of recording a highly efficient coded signal of the embodiment of the present invention on the recording medium of the embodiment of the present invention includes a method of storing a bit amount larger than a fixed reference amount for a plurality of channels in one sync block. A sample group for the first bit allocation to be allocated, and the
  • the sample group for the bit allocation amount of 1 is recorded separately from the remaining second bit allocation sample group. Further, this recording is performed alternately for each channel.
  • the present invention is not limited to a digital audio signal, but can be applied to a digital image signal.
  • the high-efficiency encoding method according to the present invention in the case of transmitting and recording a plurality of moving images on parallel channels, for image channels with complicated patterns requiring a large bit allocation, the portion exceeding a predetermined value is used as an auxiliary allocation as well. It is possible to handle.
  • Industrial Applicability As is clear from the above description, the high-efficiency encoding method according to the present invention, the corresponding high-efficiency code decoding method, and the high-efficiency code In a decoding / reproduction method, a high-efficiency coded signal recording method for recording a signal coded by the high-efficiency coding method, and a recording medium on which recording has been performed, a sub-distribution technique is used for compression in a multi-channel system. It is possible to reproduce a compressed signal whose sound quality has been improved by using subordinate distribution with high sound quality.

Description

明 細 書 高能率符号化方法、 高能率符号の復号化方法、 高能率符号の符号 化装置、 高能率符号の復号化装置、 高能率符号化 ·復号化システム 、 及び記録メディア 技 術 分 野 本発明は、 デジタル音声信号の符号化及び又は復号化に関し、 特 に複数チャンネルのデジタル音声信号について、 人間の聴覚特性を 利用して高能率符号化及び又は復号化するものに関する。 詳しくは 、 本発明は、 放送、 通信、 映画、 ビデオテープレコーダ、 又はディ スクプレーヤのステレオ音響システム、 又は 3チャンネル以上のチ ヤンネルからなるマルチプル ·サラウンド音響システムに関する。 さらに、 これらのシステムにおいて使用されるに好適なる、 ビッ ト · レートの削減を行う高能率符号化方法と、 これに対応する高能 率符号の復号化方法、 及び高能率符号の復号化再生方法に関する。 さらにまた、 その高能率符号化方法により符号化された信号を記 録する高能率符号化信号記録方法及び記録がなされた記録メディア に関するものである。
さらにまた、 その高能率符号化方法により符号化された信号を伝 送する高能率符号化信号伝送方法に関するものである。 背 景 技 術 音楽信号、 或いは音声信号等のオーディオ信号の高能率符号化方 法及び高能率符号化装置には、 多くの技術が知られている。
例えば一^つの方法として、 時間領域のオーディオ信号を、 時間軸 に沿って、 所定の単位時間でブロック化し、 このブロック毎の時間 領域の信号を周波数領域の信号に直交変換する。 さらに、 複数の周 波数帯域にブロック化し、 各周波数帯域毎に再量子化 ·符号化する 、 ブロック化周波数帯域分割方式がある。 一般には、 変換符号方法
(Transform Coding)と呼ばれる。
この方法は、 本発明者及び本出願人による特許出願があり、 例え ば米国特許明細書第 5, 3 0 1 , 2 0 5号に開示されている。
また別の方法として、 時間領域のオーディオ信号を、 単位時間毎 にブロック化しないで、 20程度の複数の周波数帯域に分割して符号 化する非ブロック化周波数帯域分割方法がある。 一般には帯域分割 符号化 (Sub Band Coding : SBC ) と呼ばれるものが知られている 。 例えば、 米国特許明細書第 4, 8 9 6, 3 6 2号、 米国特許明細 書 5, 1 0 5, 4 6 3号に開示されている。
また、 上述の帯域分割符号化と変換符号化とを組み合わせた高能 率符号化の方法及び装置も考えられている。 この場合には、 上記帯 域分割符号化で帯域分割を行った後、 各帯域毎の信号を周波数領域 の信号に直交変換し、 この直交変換された各帯域毎の信号に符号化 を施す方法である。
この方法としては、 例えば、 米国特許明細書第 4, 9 7 2, 4 8 4に開示されている。
ここで、 上述した帯域分割符号化の帯域分割用フィルタとしては 、 例えばクオドラチヤ ' ミラー ' フィルタ(Quarature Mirror Filter: QMF)等のフィルタがある。 これは 1976 R. E. Crochiere Digital coding of speech in subbands Bell Syst. Tech. J. Vol.55. No.8 1976において、 述べられている。
また ICASSP 83, BOSTON Polyphase Quadrature filters- A new subband coding technique Joseph H. Rothweiler (こ {ま、 等ノくン ド 幅のフィルタ分割方法及び装置が述べられている。
また、 上述した直交変換の方法としては、 入力オーディオ信号を 所定単位時間 (フレーム) でブロック化し、 ブロック毎に高速フー リエ変換 ( Fast Fourier Transform : FFT ) 、 離散コサイン変換 ( Discrete Cosine Transform : DCT) 、 モディファイ ド離散コサ ィン変換 (Modi f ied Discrete Cosine Transform: MDCT) などを行 うことで時間軸を周波数軸に変換する方法が知られている。
本出願の実施例では、 直交変換として MDCTを使用し、 この MDCTに ついては.,, ICASSP 1987 Subband/Transf orm Coding Using Fi l ter Bank Des i gns Based on Time Domain Al iasing Cancel lat ion J. P. Princen A. B. Bradley Univ. of Surrey Royal Melbourne Inst. of Tech. に述べられている。
更に、 各周波数成分を量子化する場合の周波数分割幅としては、 人間の聴覚特性を考慮して帯域分割幅を決めることが有効である。 具体的には、 クリティカル ·バンドと呼ばれている高域程、 帯域幅 が広くなるような帯域幅が使用され、 0〜20 kHzのオーディオ信号 は複数 (例えば 25バンド) の帯域に分割される。
クリティカル ·バンドとは、 人間の聴覚特性を考慮して分割され た周波数帯域をいい、 ある純音の周波数近傍の同じ強さの狭帯域バ ンドノイズによって、 当該純音がマスクされるときのそのノイズの 持つ帯域のことである。
また、 この時の各帯域毎のデータを符号化する際には、 各帯域毎 に所定の又は適応的なビット配分(bi t al locat i on)によって決定さ れたビット量にて、 符号化が行われる。 例えば、 上記 MDCTにより得 られた MDCT係数データを符号化する際に、 決定されたビット量で符 号化が行われることになる。
上記ビット配分に関しては、 次の 2つの文献が知られている。
IEEE Transact i ons of Accoust ics, Speech, and Si gnal
Processing, vol. ASSP-25, No. 4, August 1977 では、 各帯域毎の 信号の大きさをもとに、 適応的なビット配分を行う技術が述べられ ている。
また ICASSP 1980 The cri tical band coder—digi tal encoding of the perceptual requirements of the audi tory system
M. A. Kransner MIT では、 聴覚マスキングを利用することで、 各帯 域毎に必要な信号対雑音比を得て、 固定的なビット配分を行う技術 が述べられている。
ところで、 記録媒体においては記録密度、 放送 ·通信においては 伝送路容量、 又は伝送速度で決まるビット · レートにより、 単位時 間あたりのビット量に制限がある。 そこで、 ビット · レートを満た すために、 前述したような、 高能率符号化方法が使用される。
しかし、 上述した従来のビット配分技術は、 それぞれ独立に各チ ヤンネル毎でのビット配分を考慮したものである (以下簡単のため 、 独立配分: Independent Al locat ion という) 。 言い換えれば、 各 チャンネルのビット量は、 ある固定量である。 よって複数チャンネ ルの間にまたがるようなビット配分は考慮されていない。
これに対して、 先に本発明者は、 日本特許出願として平成 5年特 許願第 1 5, 4 9 2号及びこの出願に対応る米国特許出願 0 8 Z 1 8 4 , 4 7 1号の明細書及び図面において、 複数のチャンネルに使 用できる共通のビットを確保しておき、 ビットが必要とされるチヤ ンネルに対して、 適当な量のビットを配分することを提案している このような方法は、 ビット配分が各チャンネル毎に独立していな いことから、 チャンネル間ビット配分 (以下簡単のため、 従属配分 : Dependent Al locat ion とレヽラ) とレヽラ。
本発明者の先の提案は、 共通のビットを確保することで、 音質向 上には寄与するものであった。 しかし、 共通のビットを常に確保し ておく ことは、 冗長なことでもある。
通常、 複数のチャンネルがある場合、 各チャンネルが要求するビ ット量には、 各チャンネルの情報量により、 差が生じる。
例えばオーディオ信号がステレオである場合、 右チャンネルが要 求するビット量が基準の 120%であり、 逆に左チャンネルが要求す るビット量が基準の 50%であったとする。 このような場合、 右チヤ ンネルに許容されるビット量は、 基準の 100%迄であり、 不足する 20%により、 音質劣化を生じる。
これに対して、 左チャンネルでは基準の 50%もの余分なビッ卜-量 があり、 いわゆるオーバー · クオリティとして、 冗長な基準の 50% のビット量はその左チャンネルのために使用される。 もちろん、 冗 長なビットは音質向上に寄与するが、 人間の聴覚には知覚されない 程度の向上に過ぎない。
ところで、 この例において、 左チャンネルで冗長であった基準の 50%のビット量を、 右チャンネルで不足する 20% (以下簡単のため 、 補助配分: Subs i diary Al locat i onという) のために使用すること が考えられる。
これを実現できれば、 両チャンネル共、 高音質を維持したまま、 所定のビット ■ レートを満足することができる。
特に、 音楽や映画等のオーディオ信号は、 電話と異なり、 複数チ ヤンネルの組により 1つの情報を構成する場合が多い。 よって、 複 数チャンネルの何れかのチャンネルで冗長なビットが発生する場合 があり、 従属配分が有効であると考えられる。
ところで、 この場合、 もう一つの別の問題が生じる。 すなわち、 従来のデコーダ (高能率復号化装置) では、 独立配分に基づくェン コ一ド信号が記録された記録媒体を復号するものである。
このため、 従属配分により、 エンコードされた信号が記録された 記録媒体は、 従来のデコーダ (復号化装置) では復号できない。
また、 従属配分により、 エンコードされた信号が記録された記録 媒体を復号するための復号化装置が、 既に市場にある記録媒体、 即 ち、 独立配分でのみェンコ一ドされた信号が記録された記録媒体を もデコードできなければ、 使用者の著しい不利となる。
本発明者の先の提案は、 共通のビットを確保することで、 音質向 上には寄与するものであった。 しかし、 共通のビットを常に確保し ておく ことは、 冗長なことでもある。
通常、 複数のチャンネルがある場合、 各チャンネルが要求するビ ット量には、 各チャンネルの情報量により、 差が生じる。
例えばオーディオ信号がステレオである場合、 右チャンネルが要 求するビット量が基準の 120%であり、 逆に左チャンネルが要求す るビット量が基準の 50%であったとする。 このような場合、 右チヤ ンネルに許容されるビット量は、 基準の 100%迄であり、 不足する 20%により、 音質劣化を生じる。
これに対して、 左チャンネルでは基準の 50%もの余分なビット量 があり、 いわゆるオーバ一 · クオリティとして、 冗長な基準の 50% のビット量はその左チャンネルのために使用される。 もちろん、 冗 長なビットは音質向上に寄与するが、 人間の聴覚には知覚されない 程度の向上に過ぎない。
ところで、 この例において、 左チャンネルで冗長であった基準の 50%のビット量を、 右チャンネルで不足する 20% (以下簡単のため 、 補助配分: Subsidiary Al locat ionという) のために使用すること が考えられる。
これを実現できれば、 両チャンネル共、 高音質を維持したまま、 所定のビット · レートを満足することができる。
特に、 音楽や映画等のオーディオ信号は、 電話と異なり、 複数チ ヤンネルの組により 1つの情報を構成する場合が多い。 よって、 複 数チャンネルの何れかのチャンネルで冗長なビットが発生する場合 があり、 従属配分が有効であると考えられる。
ところで、 この場合、 もう一^ ^の別の問題が生じる。 すなわち、 従来のデコーダ (高能率復号化装置) では、 独立配分に基づくェン コード信号が記録された記録媒体を復号するものである。 このため、 従属配分により、 エンコードされた信号が記録された 記録媒体は、 従来のデコーダ (復号化装置) では復号できない。
また、 従属配分により、 エンコードされた信号が記録された記録 媒体を復号するための復号化装置が、 既に市場にある記録媒体、 即 ち、 独立配分でのみェンコ一ドされた信号が記録された記録媒体を もデコードできなければ、 使用者の著しい不利となる。 発 明 の 開 示 そこで、 本発明は、 従属配分を用いて高音質とした圧縮信号を得 ることができる技術を提供することを目的とする。
さらに、 この従属配分技術を使用して高音質の再生が可能で、 か つ、 従来の独立配分が行われていても、 復号化の際に大きな音質劣 化を生ずること無く再生できるようにする、 高能率符号化技術を提 案することを目的とする。
さらに、 本発明技術による符号化方法、 符号化信号の復号化方法 の提供を目的とする
さらに、 本発明技術による符号化装置、 符号化信号の復号化装置 、 及び符号化装置と復号化装置とからなるシステムの提供を目的と する
さらに、 本発明技術による符号化方法、 及び符号化装置により形 成された符号化信号が記録された記録メディアを提供することを目 的とするものである。
さらに、 本発明技術による符号化方法、 及び符号化装置により形 成された符号化信号を伝送する伝送方法、 伝送装置を提供すること を目的とする。
上述の目的を達成するために提案された本発明に係る高能率符号 化方法は、 複数チャンネルの信号に対し、 複数チャンネルの時間領 域でのサンプル ·データ若しくは周波数領域でのサンプル ·データ へのチャンネル間で、 適応的ビット配分を行う高能率符号化方法で ある。 即ち、 一定の基準値よりも大きいビット量を要求するチャン ネルへのビット配分を、 多くても一定の基準値を越えない第 1のビ ット配分量と、 残りの第 2のビット配分量とに分解する。
第 1のビット配分量は、 従来の独立配分時にデータに使用できた ビット量に相当する一定の基準値の範囲とし、 従来のシステムとの 互換性を考慮したものである。
第 2のビット配分量は、 従来の独立配分時にデータに使用できた ビット量を上 0る部分であり、 そのチャンネルの音質を考慮したも のである。
本発明の高能率符号化方法は、 以下のステップよりなる。
即ち、 あるシンク ·ブロック (単位ブロック) において、 全チヤ ンネルの総ビット配分量は、 略一定にする。
前記第 1のビット配分量に関するサンプル ·デ一夕のためのスケ —ル · ファクタ及びヮ一ドレングスから、 前記第 2のビット配分量 に関するサンプル 'データのためのスケール ' ファクタを求める。 上記第 1のビット配分量は、 サブ情報のためのビット量を考慮し た量とされる。
上記第 2のビット配分量は、 そのチャンネルが要求するビット配 分量から上記第 1のビット配分量を引いた量である。
時間軸と周波数軸とについて細分化された小ブロック中のサンプ ル,データに対し、 前記小ブロック内では同一の量子化を行う。 前 記小ブロック中のサンプル ·データを得るために、 非ブロック化周 波数特性の分析を行った後、 前記非ブロック化周波数特性の分析の 出力を、 更にブロック化周波数特性の分析を行う。
前記非ブロック化周波数特性の分析の周 、波数帯域幅は、 少なく と も最低域の 2帯域で同じである。 前記非ブロック化周波数特性の分 析は、 PQF (Polyphase Quadrature f i l ter ) である。 前記非ブロ ック化周波数特性の分析の周波数帯域幅は、 高域は低域より広くす る。 なお、 前記非ブロック化周波数特性の分析には、 QMF
(Quadrature Mirror f i l ter) をも使用できる。
前記ブロック化周波数特性の分析は、 MDCTである。 前記ブロック 化周波数特性の分析では、 入力信号の時間特性により適応的にプロ ック 'サイズを変更する。 前記ブロック ·サイズの変更は、 少なく とも 2つの前記非ブロック化周波数特性の分析の出力毎に独立に行 ラ
各チャンネルの前記第 1のビット配分部分と、 前記第 2のビット 配分部分との和は、 各チャンネルのスケール ' ファクタ又はサンプ ル ·データの最大値により変化する。
従属配分は、 各チャンネルの信号のエネルギ値、 ピーク値又は平 均値等の振幅の時間的変化により、 変化する。 または、 各チャンネ ルのスケール, ファクタの時間的変化により、 変化する。
補助配分に使用できるビット量は、 最大でも他のチャンネルの余 剰ビッ卜の合計ビット量である。
次に、 本発明の高能率符号の復号化方法は、 符号化時に、 複数チ ヤンネルの信号に対し、 複数チャンネルの時間領域若しくは周波数 領域でのサンプル ·デ一夕への適応的従属配分が行われた符号化信 号を、 復号化するための高能率符号の複号化方法である。 上記符号 化時には、 一定の基準量よりも大きいビット量が配分されるチャン ネルへのビット配分量を、 多くても前記一定の基準量を越えない第 1のビット配分量と残りの第 2のビット配分量に分解していること を特徵としいてる。
ここで、 本発明の高能率符号の復号化方法は、 以下に示すように することも可能である。
前記第 1のビット配分量と前記第 2のビット配分量との合計の全 チャンネルについての総ビット量は略一定である。 前記第 2のビッ ト配分量に関するサンプル ·データのためのスケール · ファクタは 、 前記第 1のビット配分量に関するサンプル 'データのためのスケ ール。 ファクタおよぴヮ一 ドレングスから求める。
上記第 1のビット配分量は補助配分ビットを含まないビット配分 量であり、 上記第 2のビット配分量は補助配分ビットを含むビット 配分量である。
時間軸と周波数軸とについて細分化された小ブロック中の同一の 量子化を行ったサンプル ·データを、 復号化する。 前記小ブロック 中のサンプル 'データを、 ブロック化周波数合成した後、 前記プロ ック化周波数合成の出力を非ブロック化周波数合成の入力とし、 非 ブロック化周波数合成の出力を得る。 前記非ブロック化周波数合成 の周波数帯域幅が少なく とも最低域の 2帯域で同じである。
前記非ブロック化周波数合成は、 P Q Fである。 前記非ブロック 化周波数合成の周波数帯域幅は、 高域は低域より広く設定される。 前記非ブロック化周波数合成は、 QMF とすることもできる。 前記ブ ロック化周波数合成は逆 MDCTである。 前記ブロック化周波数合成で は、 入力信号の時間特性により適応的にそのブロック ·サイズを変 更する。 前記ブロック ·サイズの変更は、 少なく とも 2つの前記非 ブロック化周波数合成の入力帯域毎に独立に行う。
各チャンネルの前記第 1 のビット配分量と、 前記第 2のビット配 分量との和が略各チャンネルのスケール · ファクタ又はサンプル最 大値により決定されている。 また、 複数のチャンネルを持ち、 一定 の基準量よりも大きいビット量が配分されたチャンネルの検出を、 チャンネルへの配分ビット量が前記一定の基準量より小さい第 2の 基準量よりも大きいか等しいことを検出することにより行う。
また、 本発明の高能率符号の復号化再生方法は、 一つのシンク · ブロック (連続信号を所定時間単位でブロック化したもの) の中に 分離して記録され取り出された、 少なく とも 2つのサンプル ·プロ ック群よりなる。 即ち、 複数チャンネルのための一定の基準量より も大きいビット量を配分する第 1 のビット配分のサンプル群と、 複 数チャンネルのための前記第 1のビット配分サンプル群の残りの第 2のビット配分のサンプル群とよりなる。
ここで、 各チャンネルでは、 各チャンネルの一定の基準量よりも 大きいビット量を配分する第 1のビット配分サンプル群と、 当該第 1のビット配分サンプル群の残りの第 2のビット配分サンプル群と から復号再生を行う。
次に、 本発明の高能率符号化信号記録方法は、 一つのシンク -ブ ロックの中に、 複数チャンネルのための一定の基準量よりも大きい ビット量を配分する第 1のビット配分サンプル群と、 複数チャンネ ルのための前記第 1のビット配分サンプル群の残りの第 2のビット 配分サンプル群とを分離して記録することを特徴とする。
さらに一^ Dのシンク ·ブロックの中では、 上記第 1のビット配分 サンプル群と、 上記第 2のビット配分サンプル群とが、 各チャンネ ル毎に交互に記録される。
また、 本発明の記録メディアは、 本発明の高能率符号化方法によ り符号化した信号を記録してなるものである。
この記録メディアは、 映画フィルムであり、 ディスクであり、 テ ーブであり、 さらには半導体メモリーを内蔵した力一ドである。 すなわち、 本発明では、 従属配分のための補助配分ビットの含ま れたビット配分と、 補助配分ビッ卜の含まれないビット配分を求め るようにしている。 上記補助配分ビットの含まれないビット配分は 、 各チャンネル毎に独立に求められ、 概略チャンネル毎に一定のビ ット配分量を持つ。
ここで、 上記補助配分ビットの含まれたビット配分量が、 補助配 分ビットの含まれないビット配分量よりも大きいチャン ルについ ては、 補助配分された時間領域もしくは周波数領域の情報サンプル を、 補助配分ビットの含まれないビット配分に基づく情報サンプル ( A ) と残りの情報サンプル (B ) とに分割する。
前記残りの情報サンプル (B ) は、 補助配分ビットの含まれたビ ット配分に基づく情報サンプル (C ) と補助配分ビットの含まれな いビット配分に基づく情報サンプル (A ) との差の大きさを持つ情 報サンプルとして求める。
一方、 補助配分ビットを含むビット配分量が、 補助配分ビットを 含まないビット配分量と同じかそれよりも小さいチャンネルについ ては、 補助配分ビットされた時間領域もしくは周波数領域のサンプ ル情報 (C ) を、 そのチャンネルのビット配分として用いる。
この事により、 独立配分のみでビット配分が行われた符号化信号 を復号化するデコーダを用いた場合に、 当該デコーダでは、 補助配 分ビットの含まれたビット配分量が補助配分ビットの含まれないビ ット配分量よりも大きいチャンネルについては、 補助配分ビットの 含まれないビット配分に基づく情報サンプル (A ) を再生する。 逆に、 補助配分ビットの含まれたビット配分量が、 補助配分ビッ トの含まれないビット配分量と同じかそれよりも小さいチャンネル については補助配分された情報サンプル (C ) を再生すればよいこ とになる。
また、 完全な再生をする場合、 補助配分ビットの含まれたビット 配分量が補助配分ビットの含まれないビット配分量よりも大きいチ ヤンネルについては、 補助配分ビットされたサンプル情報を、 補助 配分ビットの含まれないビット配分に基づく情報サンプル (A ) と 、 残りの情報サンプル (B ) との両者を用いて、 より高音質な再生 音を再生することができる。 そのためには情報サンプル (A ) と情 報サンブル (B ) とをそれぞれデコードしたものを加算すればよい また、 前記情報サンプル (A ) のビット配分量と前記情報サンプ ル (B ) のビット配分量の合計の全チャンネルについての総ビット 配分量を概略一定とする事により、 ビット · レートが一定であるこ とが望まれる記録メディア上への記録を可能にする事ができる。 以上の場合に、 前記情報サンプル (B ) のビット配分に関するサ ンプル ·データの正規化の為のスケール · ファクタを、 前記情報サ ンプル (A ) のサンプル ·データの為のスケール · ファクタおよび ワードレングスから求めることにより、 前記情報サンプル (B ) の ビット配分に関するスケール ' ファクタをェンコ一ド側からデコ一 ド側に送付することなく、 デコード側で発生でき、 したがって、 記 録ゃ伝送に必要な情報量を低減することができる。
また、 補助配分ビットの含まれないビット配分に基づくサンプル 情報 (A ) を得るために、 四捨五入処理を含む量子化を行うことは 量子化雑音の低減のために有効である。
更に前記情報サンプル (B ) の為のビット配分を行ったチャンネ ルがどれかをデコーダ側が知るためには、 チャンネルへのビット配 分量が前記一定の基準量より小さい第 2の基準量よりも大きいこと により行う事はェンコ一ド側からデコード側に専用のデータを送付 する必要がなく有益である。
また、 本発明では、 時間軸と周波数軸とについて細分化された小 ブロック中のサンプルに対し、 当該小ブロック内では同一の量子化 を行うようにしている。 前記小ブロック中のサンプルを得るために は、 フィルタなどの非ブロック化周波数特性の分析を行った後、 当 該フィルタなどの非ブロック化周波数特性の分析の出力を直交変換 等のブロック化周波数特性の分析を行う。
この時、 前記非ブロック化周波数特性の分析の周波数帯域幅が少 なく とも最低域の 2帯域で同じであることはコストを低減するうえ で役に立つ。 また、 前記非ブロック化周波数特性の分析の.周波数帯 域幅が高域が低域より広いことは、 臨界帯域に基づく聴覚の効果を 利用するうえで重要である。
前記ブロック化周波数特性の分析は、 入力信号の時間特性により 適応的にそのブロック ·サイズを変更することにより入力信号の時 間特性に対応した最適な処理が可能となる。 前記ブロック 'サイズ の変更を少なぐとも 2つの前記非ブロック化周波数特性の分析の出 力帯域毎に独立に行うことは、 周波数成分の間の相互干渉を防いで 各帯域成分独立に最適な処理を行うえで効果的である。
さらに各チャンネルに与えられるビット配分量は、 各チャンネル のスケール · ファクタまたはサンプル最大値により決めるのは、 演 算を低減させるうえで効果的である。
またこれに加えて、 各チャンネルのスケール · ファクタで代表さ れる振幅情報の時間的変化により各チャンネルに与えられるビット 配分量を変化させることも、 量子化雑音を検知し難くするうえで有 益である。 更にシンクの為の情報を含むひとつのシンクブロックの 中に、 複数チャンネルの為の前記第 1のビット配分サンプル群と複 数チャンネルの為の前記第 2のビット配分サンプル群とを分離して sd^する。
本発明によれば、 複数チャンネルの信号に対し、 一定の基準量よ りも大きいビット量を配分するチャンネルへのビット配分量を、 多 くても一定の基準量を越えない第 1のビット配分量と残りの第 2の ビット配分量に分解し、 複数チャンネルの時間領域でのサンプル若 しくは周波数領域でのサンプル ·データへのチャンネル間で可変ビ ット配分を行うようにすることにより、 従属配分を利用した高音質 再生が可能となる。 さらに、 通常良く使われる各チャンネル個別に 固定値以下のビット · レートを用いてチャンネル毎で周波数領域及 び時間領域での適応ビット配分技術が適用されるデコーダでも大き な音質劣化無く再生できるようにすることができる。 従って、 互換 性を保ち、 異なる記録メディア間での情報の授受が可能となる。
また特に映写装置では、 各チャンネル別に固定値以下のビット · レートを用いて、 各チャンネル毎で周波数領域及び時間領域での適 応ビット配分技術を使用するデコーダを用いることが可能となる。 したがって高品質の音質を必要とするオーディオシステムや映画の 音声記録再生に好適なシステムを与えることができる。
この時に、 前記第 2のビット配分量に関するサンプル 'データの 為のスケール · ファクタを、 前記第 1のビット配分量に関するサン プル ·データの為のスケール · ファクタおよびワードレングスから 求めることにより、 前記第 2のビット配分に関するサンプル ·デー 夕の為のスケール · ファクタをェンコ一ド側からデコ一ド側に送付 することなくデコ一ド側で作り、 記録や伝送に必要な情報量を低減 することができる。
更に多くても前記一定の基準量を越えない補助配分ビットの含ま れないビット配分である第 1のビット配分量のビット量が、 前記一 定の基準量より小さい第 2の基準量よりも大きいことにより、 前記 第 2のビット配分を行ったチャンネルをデコード側が知る事は、 ェ ンコード側からデコード側に専用のデータを送付する必要がなくな 補助配分ビットの含まれないビット配分に基づくサンプル情報を 得るために四捨五入処理を含む量子化を行うことは、 各チャンネル 別に固定値以下のビット · レートを用いてチャンネル毎に周波数領 域及び時間領域での適応ビット配分技術を使用するデコードにおい て、 量子化雑音の低減のために有効である。
さらに、 時間軸と周波数軸とについて細分化された小ブロック中 のサンプルを得るために、 フィルタなどの非ブロック化周波数特性 の分析を行つた後、 このフィル夕などの非ブロック化周波数特性の 分析の出力を直交変換等でブロック化周波数特性の分析する事によ り、 時間領域、 周波数領域で聴覚マスキングを生かした量子化雑音 の求め方が可能となり、 聴覚上好ましい周波数特性の分析を得るこ とが可能となる。
この時、 前記非ブロック化周波数特性の分析の周波数帯域幅が少 なく とも最低域の 2帯域で同じであることはコストを低減するうえ で役に立つ。
前記非ブロック化周波数特性の分析の周波数帯域幅を少なく とも 最高域で高域程広くすることにより臨界帯域に基づく聴覚の効果を 効率的に利用することが可能となる。 前記ブロック化周波数特性の分析は入力信号の時間特性により適 応的にそのブロック ·サイズが変更されることにより入力信号の時 間特性に対応した最適な処理が可能となる。
前記ブロック ·サイズの変更を少なく とも 2つの前記非ブロック 化周波数特性の分析の出力帯域ごとに独立に行うことは、 周波数成 分の間の相互干渉を防いで各帯域成分独立に最適な処理を行うえで 効果的である。
補助配分ビットの際には、 各チャンネルのスケール ' ファクタに よって計算することによりそのビット配分計算の簡易化が図られる
図面の簡単な説明 図 1は、 本発明に係る高能率符号化装置の構成例を示すブロック 回路図である。
図 2 A及び図 2 Bは、 本発明に係る高能率符号化装置における信 号の周波数及び時間分割を示す図である。
図 3は、 本発明に係る高能率符号化装置のマルチチャンネルでの ビット配分用パラメ一夕を求める構成の一例を示すブロック回路図 である。
図 4 A〜図 4 Hは、 チャンネル間でスぺク トルの大きさからビッ ト配分を行う概念を示す図である。
図 5 A〜図 5 Hは、 チャンネル間での信号の時間特性を考慮した ビット配分の為のパラメータの求め方を示す図である。
図 6は、 ビット配分(1) のビット配分量とトーナリティとの間の 関係を示す図である。
図 7は、 ビット配分(1) のビット配分量と時間変化率との間の関 係を示す図である。
図 8は、 均一配分の時のノイズスぺク トルを示す図である。 図 9は、 信号の周波数スぺク トル及びレベルに対する依存性を持 たした聴覚的な効果を得るためのビット配分によるノイズスぺク ト ルの例を示す図である。
図 1 0は、 信号の大きさ及び聴覚許容雑音スペク トルの 2者を用 いたビット配分方法を実現する構成を示すブロック回路図である。 図 1 1は、 許容雑音レベルを求める構成を示すブロック回路図で あ o
図 1 2は、 各帯域の信号レベルによるマスキング ·スレシヨール ドの例を示す図である。
図 1 3は、 情報スぺク トル、 マスキング ·スレショールド、 最小 可聴限を示す図である。
図 1 4は、 トーナリティが低い信号に対する信号レベル依存およ び聴覚許容雑音レベル依存のビット配分を示す図である。
図 1 5は、 トーナリティが高い信号に対する信号レベル依存およ び聴覚許容雑音レベル依存のビット配分を示す図である。
図 1 6は、 トーナリティが低い信号に対する量子化雑音レベルを 示す図である。
図 1 7は、 トーナリティが高い信号に対する量子化雑音レベルを 示す図である。
図 1 8 A及び図 1 8 Bは、 マルチチャンネルにおけるビット配分 の関係を示す図である。
図 1 9は、 第 1 と第 2の量子化回路の関係を示すブロック回路図 である。
図 2 0は、 シンク ·ブロックへのデータの配列を模式的に示す図 である。
図 2 1は、 本発明に係る高能率符号の復号化装置の構成例を示す ブロック回路図である。
図 2 2は、 本発明に係る高能率符号化方法のビット配分のフロー チヤ一トである。 発明を実施るための最良の形態 以下、 本発明の高能率符号化方法が適用される高能率符号化装置 (エンコーダ) と、 本発明の高能率符号の復号化方法 (高能率符号 の復号化再生方法) が適用される高能率符号の復号化装置 (デコ一 ダ) の実施例について、 図面を参照しながら説明する。
本実施例では、 オーディオ P C M信号等の入力ディジ夕ル信号を 、 帯域分割符号化 (S B C ) 、 適応変換符号化 (A T C ) 及び適応 ビット配分にて (A P C— A B ) の各技術を用いて高能率符号化す る。 この技術について、 図 1を参照しながら説明する。
図 1は、 本発明が適用される実施例の高能率符号化装置を示す。 概要は、 時間領域の入力ディジタル信号を QMF により複数の周波 数帯域に分割し、 各周波数帯域毎に直交変換を行って周波数領域の スぺク トル ·データとし、 得られたスぺク トル ·データを、 クリテ イカル ·バンド毎に適応的にビット配分して符号化する、 高能率符 号化装置である。
この時、 高域ではクリティカル ·バンドを更に分割した帯域を用 いる。 もちろん QMF による非ブロッキングの周波数分割幅は、 等分 割幅としてもよい。
さらに、 本発明実施例においては、 直交変換の前に入力信号に応 じて、 適応的にブロック ·サイズ (ブロック長) を変化させると共 に、 クリティカル ·バンド単位、 もしぐは高域ではクリティカル · バンドを更に細分化した帯域でフローティング処理を行っている。 フローティング処理とは、 複数のデータ値を 1の指標に基づき正 規化する処理をいう。
さらに図 1の高能率符号化装置を詳細に説明する。 入力端子 1 0には例えば 0〜22 kHzのオーディオ P CM信号が供 給されている。 通常のオーディオ帯域は、 0〜20 kHzで充分とされ るが、 22 kHzまで高域を拡張することで、 より高品位のオーディオ 信号を扱う。
この入力信号は、 まず QMF で構成されるの帯域分割フィルタ 1 1 により、 0〜11 kHz帯域と 11 k〜22 kHz帯域とに分割される。 更に 0〜11 kHz帯域の信号は、 同じく QMF で構成されるの帯域分割フィ ル夕 1 2により、 0〜5.5 kHz 帯域と 5.5. k〜ll kHz帯域とに分割 される。
帯域分割フィルタ 1 1、 1 2からのそれぞれの帯域の信号は、 直 交変換回路である MDCT回路 1 3〜 1 5に送られることにより、 それ ぞれ MDCT係数に変換される。 なお、 各 MDCT回路 1 3〜 1 5では、 各 帯域毎に、 ブロック決定回路 1 9〜2 1により決定されたブロック •サイズに基づいて MDCTされる。
ここで、 上記ブロック決定回路 1 9〜2 1により決定される 各 MDCT回路 1 3〜 1 5でのブロック ·サイズの具体例を図 2 A及び 図 2 Bに示す。 なお、 図 2 Aには直交変換ブロック ·サイズが時間 軸で長い場合 (ロング 'モードという) を、 図 2 Bには直交変換ブ ロック 'サイズが時間軸で短い場合 (ショート ·モードという) を 示ししている。
この図 2の具体例においては、 上記 3つのフィルタ出力は、 それ ぞれ 2つの直交変換ブロック ·サイズを持つ。
すなわち、 図 2 Aに示すように長いブロック長 (11.6msec) の場 合、 低域側の 0〜5.5 kHz帯域の信号及び中域の 5.5 k〜llkHz帯 域の信号に対しては、 1ブロック内のサンプル数を 128サンプルと する。 これに対して、 図 2 Bに示すように短いブロック長
(2.9msec ) の場合には、 1ブロック内のサンプル数を 32としてい る o
なお、 高域側の llk〜22kHz帯域の信号に対しては、 長いブロッ ク長の場合 (図 2 A ) は、 1ブロック内のサンプル数を 256サンプ ルとし、 短いブロック長 (1. 45msec) の場合 (図 2 B ) には、 1ブ ロック内のサンプル数を 32サンプルとしている。
このようにして短いブロックが選ばれた場合には、 各帯域の直交 変換ブロックのサンプル数を同じにして高域程時間分解能を上げ、 なおかつ MDCTのためのウインドウの種類を減らしている。
なお、 上記ブロック決定回路 1 9〜2 1で決定されたブロック · サイズを示す信号は、 各 MDCT回路 1 3〜 1 5に供給されてそのウイ ンドウが切り換えられ、 また後述の適応ビット配分符号化回路 1 6 〜 1 8に送られると共に、 出力端子 2 5〜2 7から出力され、 記録 •伝送のために使用される。
再び図 1において、 各 MDCT回路 1 3〜 1 5にて MDCT処理されて得 られた周波数領域のスぺク トル ·デ一夕である MDCT係数データは、 クリティカル ' ノくンドまたは高域では更にクリティカル ·バンドを 分割した帯域毎にまとめられて、 適応ビット配分符号化回路 1 6〜 1 8に送られている。
適応ビット配分符号化回路 1 6〜 1 8では、 上記ブロック ·サイ ズの情報、 及びクリティカル ·バンド毎または高域では更にクリテ イカル ·バンドを分割した帯域毎に、 割り当てられたビット量に応 じて各 MDCT係数データを正規化及び再量子化する。
この時、 適応ビット配分符号化回路 1 6〜 1 では、 各チャンネ ルに指定されたビット量を上限として、 各ブロック毎にビット量の 配分を行う。
各チャンネルのスぺク トル分布を示すデジタル信号 (M D C T係 数) が適応ビット配分回路 3 0へ端子 2 9を介して供給され、 一方 、 適応ビット配分回路 3 0からは、 各チャンネルのブロックで使用 できるビット量が、 端子 2 8を介して適応ビット配分符号化回路 1 6〜 1 8に供給される。
このようにして、 所定のビット量にて符号化されたデータは、 出 力端子 2 2 〜 2 4を介して取り出される。 同時に、 当該適応ビット 配分符号化回路 1 6 〜 1 8からは、 正規化に関するスケール · ファ クタ信号と、 どのヮ一ド長で再量子化がされたかを示すヮード長信 号が得られ、 これらの信号もサブ情報として、 出力端子 2 2 〜 2 4 から出力される。
また、 図 1における各 MDCT回路 1 3 〜 1 5の出力は、 上記クリテ イカル ·バンドまたは高域では更にクリティカル ·バンドを分割し た帯域毎のエネルギを、 当該帯域毎の各振幅値の 2乗平均の平方根 を計算すること等により求められる。
もちろん、 上記エネルギの代わりに、 上記スケール · ファクタそ のものを以後のビット配分の為に用いるようにしてもよい。 この場 合にはエネルギ計算の演算が不要となるため、 ハード規模の節約と なる。 また、 各バンド毎のエネルギの代わりに、 振幅値のピーク値 、 平均値を用いることも可能である。
次に、 上記ビット配分を行うための適応ビット配分回路 3 0の具 体的な構成及び動作を、 図 3を用いて説明する。 なお、 この図 3の 例では、 映画を例として、 オーディオ信号のチャンネル数を 8 ( CH 1 〜CH8 ) としている。
この図 3において、 各チャンネルで共通の部分については、 チヤ ンネル CH1 を用いて説明する (他のチャンネルについては同一の指 示符号を付して説明は省略している) 。
各チャンネルからの入力信号は、 対応する各チャンネルの入力端 子 3 1に供給される。 なお、 この端子 3 1は、 図 1の端子 2 9と対 応している。 この入力信号はマッピング回路 (Mappi ng) 3 2により 入力信号の周波数分析 (スぺク トル分布) が得られる。
ここでマッピング回路として、 フィルタを使用する場合には、 サ ブバンド信号として時間領域サンプル ·データが得られることにな り。 また直交変換を使用する場合及びフィルタリ ング後に直交変換 を使用する場合には、 周波数領域サンプル ·データが得られること になる。
これらのサンプル 'データは、 ブロッキング(Blocking)回路 3 3 によって複数サンプル ·データ毎にまとめられる。 前述のように、 フィルタを使用した場合には時間領域の複数サンプルがまとめられ ることになり、 直交変換及びフィルタリング後に直交変換を使用し た場合には、 周波数領域の複数サンプルがまとめられることになる また、 本実施例では、 入力信号に応じて逐次マッピングされるサ ンプルデータの時間変化(V) を、 時間変化算出回路 3 4により算出 する。 入力信号の過渡的変化を、 ビット配分に反映させることによ り、 より高品位な信号が得られる。
上記ブロッキング回路 3 3により複数のサンプル毎にまとめられ た各サンプルは、 正規化回路 3 7で正規化される。 ここで、 正規化 のための係数であるスケール■ ファクタ(SF)は、 スケール · ファク 夕算出回路 3 5によって得られる。 複数のサンプルに 1の共通する スケール · ファクタを使用することで、 デジタル信号を効率的に圧 縮する
同時にトーナリティが、 トーナリティ算出回路 3 6で算出される 。 トーナリティ(T) とは、 入力信号のスペク トル分布の起伏を示し 、 起伏が大きい入力信号をトーナリティが高い信号という。 詳紬は 後述する。
以上で求まるサンプルデータの時間変化(V) 、 スケール . ファク 夕(SF)及びトーナリティ(T) 等のパラメ一夕は、 ビット配分回路 3 8でビット配分計算のために使用される。
ビット配分計算は、 基本的には入力信号に応じた適応的ビット配 分である。 さらに詳細には、 各チャンネルの入力信号のスペク トル 分布や過渡特性に応じた独立配分と、 各チャンネル間の相関を利用 した従属配分とがある。 更に各チャンネルの重要度 ·使用目的 ·信 号の帯域幅等により配分に調整が加えられる。 ここで、 MDCT係数を表現して伝送または記録に使えるビット量を 、 全チャンネルで 800kbpsとすると、 本実施例のビット配分回路 3 8では、 従属配分ビットを含む第 1のビット配分 (第 1のビット配 分量) と、 従属配分ビットを含まない第 2のビット配分 (第 2のビ ット配分量) の 2つを求める。
これらのビット配分が、 各チャンネルに端子 3 9 (図 1では端子 2 8 ) を介して、 適応ビット配分符号化回路に供給される。
先ず、 従属配分ビットを含む第 1のビット配分について説明する 。 ここでは、 スケール · ファクタ(SF)の周波数領域の分布をみて適 応的にビット配分を行う。
この場合、 全チャンネルのスケール · ファクタ(SF)の周波数領域 の分布に応じて、 従属配分を行うことで、 有効なビット配分を行う ことが可能である。
このとき、 複数チャンネルの信号情報が、 スピーカにより再生さ れる場合のように、 同一音場のなかで混合されて左右の耳に達する 場合を考える。 この場合、 全チャンネル信号が加算されたものによ りマスキング効果が作用すると考えられる。
したがって、 図 4 A、 図 4 Hに示すように、 同一帯域において各 チャンネルが同一のノイズ · レベルになるようにビット配分を行う ことが有効である。
なぜならば、 あるチャンネルが他のチャンネルに比べてのノイズ • レベルが大きい場合は、 そのチャンネルでノイズとして知覚され てしまうからである。 またあるチャンネルを他のチャンネルに比べ てのノイズ · レベルを小さく しても、 結局は、 他のチャンネルのノ ィズ . レベルで全体のノイズ . レベルが決まるからである。
このための 1方法としてはスケール · ファクタ指標の大きさに比 例したビット配分を行えばよい。 すなわち、 以下の式にようてビッ ト配分を行う。
B m = B * (∑S F n ) / S t St =∑ (∑ S F n)
ここで、 Bmは各チャンネルへのビット配分量、 Bは全チャンネ ルへのビット配分量、 S F nはスケール · ファクタ指標であり、 概 略ピーク値の対数に対応している。 nは各チャンネル毎のブロック • フローティングバンド番号、 mはチャンネル番号、 St は全チヤ ンネルのスケール · ファクタ指標の和である。 なお、 図 4 A、 図 4 Hでは、 チャンネル CH1 とチャンネル CH8 のみ示しチャンネル CH2 〜CH7 については図示を省略している。
以上に加えて、 ビット配分回路 3 8は、 各チャンネルの信号の時 間変化特性(V) を検出して、 この指標によって独立配分量を変える プロセスを持つ。 この時間変化を表す指標を求める方法を、 図 5 A 〜図 5 Hにより説明する。
図 5 A〜図 5 Hに示すように、 チャンネルが 8チャンネルあると すると、 それぞれのチャンネルの情報入力信号について、 ビット配 分の時間単位であるビット配分時間ブロックを時間的に 4分割し、 それぞれの小時間ブロック (サブブロック) のピーク値を得る。 そして各サブブロックのピーク値が小から大へと変わるところの 差分の大きさに応じてチャンネル間でビットを分け合う。 ここで、 このビット配分のために 8チャンネル合計で Cbit 使えるとしたと き、 各チャンネルの各サブブロックのピーク値が小から大へと変わ るところの差分の大きさがそれぞれ a (図 5 A) 、 b (図 5 B) 、 • · · · h (図 5 H) デシベル (dB) とすると、 それぞれ
C * aZT、 C * bZT、 、 C * hZTビット (bit )
(ここで、 T= a +b + c + d + e + f + g+hである) と配分することができる。
ピーク値の変化が大である程、 そのチャンネルに対してのビット 配分量を大きくする。 なお、 図 5 A〜図 5 Hには、 チャンネル CH1 、 CH2、 CH8 に対応する図 5 A、 図 5 B、 図 5 Hのみ示し、 チャン ネル CH3 〜CH7 に対応する図 5 C〜図 5 Gについては省略している 次に、 従属配分ビットを含まない第 2のビット配分方法について 説明する。 第 2のビット配分方法として、 更に 2つのビット配分方 法について説明する。
この 2つのビット配 をそれぞれビット配分(2-1) とビット配分 (2-2) とする。 以下のビット配分では各チャンネルに割り当てるビ ット量は、 各チャンネルで固定された値とする。
例えば、 8チャンネルの内で音声など重要部分を担う 2つのチヤ ンネルには 147kbpsという比較的大きいビットを割り当て、 サブゥ ーハ—チャンネルには高々 2kbps、 それ以外のチャンネルには
100kbpsを割り当てておく。
先ず、 ビット配分(2-1) に使うべきビット量を確定する。 そのた めには、 信号情報 (a) のスぺク トル情報のうち、 トーナリティ情 報(T) 及び信号情報 (b) の時間変化情報(V) を使用する。
ここで、 トーナリティ情報(T) について説明すると、 信号スぺク トルの隣接値間の差の絶対値の和を、 信号スペク トル数で割った値 を、 指標として用いている。 より簡単にはブロック ' フローテイン グの為のブロックごとのスケール . ファクタの、 隣接スケール · フ ァクタ指標の間の差の平均値を用いる。 スケール · ファクタ指標は 、 概略スケール · ファクタの対数値に対応している。
本実施例では、 ビット配分(2-1) に使うべきビット量を、 このト ーナリティを表す値に対応させて最大 80kbps、 最小 10kbpsに設定す る。 ここでは簡単のために、 全チャンネルそれぞれの割当を等しく 100kbpsとしている。
ト一ナリティ計算は次式のように行う。
Τ= ( 1 /WLma x) (∑AB S (S F n - 1 ) )
なお、 WLm a xはワードレングス最大値 =16、 S F nはスケ一 ル · ファクタ指標で概略ピーク値の対数に対応している。 nはプロ ック · フローティングバンド番号である。 このようにして求められたトーナリティ情報(T) とビット配分(2
-1) のビット配分量とは、 図 6に示すように対応付けられる。
これと共に本実施例においては、 ビット配分(2-1) とそれに付加 するその他の少なく とも 1つのビット配分との分割率は、 信号の時 間変化特性(V) に依存する。 本実施例では、 直交変換時間ブロック •サイズを更に分割した時間区間毎に、 信号情報のピーク値を隣接 ブロック毎に比較している。 このことにより、 時間軸及び周波数軸 の 2次元で比較して、 信号の振幅が急激に大きくなる部分を検出し 、 その状態により分割率を決定している。
時間変化率計算は次式のように行う。
V t =∑ Vm
V a v= UZVma x) * ( 1 /C h) V t
ここで、 V tは各チャンネルの時間サブブロックのピーク値の小 から大への変化を dB値で表しもののチャンネルに関する和、 Vmは 各チャンネルの時間サブブロックのピーク値の小から大への変化を dB値で表しもので一番大きいものの大きさ (但し最大値を 30dBに制 限し Vma xであらわす。 mはチャンネル番号、 Chはチャンネル 数、 V a Vは時間サブブロックのピーク値の小から大への変化を dB 値で表しもののチヤンネル平均である。
このようにして求められた時間変化率 Va Vとビット配分(2 - 1) の配分量とは、 図 7に示すように対応付けられる。 最終的にビット 配分(2-1) への配分量は次の式で求められる。
B= 1/2 (B f +B t)
ここで、 Bは最終的なビット配分(2-1) への配分量、 B f は Tv aより求められたビット配分量、 B tは V a Vより求められたビッ ト配分量である。
ここでのビット配分(2-1) はスケール · ファクタに依存した周波 数、 時間領域上の配分がなされる。
このようにしてビット配分(2-1) に使用されるビット量が決定さ れたならば、 次にビット配分(2-1) で使われなかったビットについ ての配分、 即ちビット配分(2-2) を決定する。 ビット配分(2-2) で は、 以下に示す様々なビット配分が行われる。
第 1に、 ビット配分(2-2) で使用できるビットの一部を使用して 、 全てのサンプル値に対する均一配分を行う。
この場合の量子化雑音スぺク:トルの一例を図 8に示す。 この場合 、 雑音レベルは全周波数帯域で均一に低減する。 即ち、 第 1のビッ ト配分でのノイズ · レベル (点線 N L 1 ) が、 均一配分により、 点 線 N L 2で示すノイズ · レベルに均一に低減する。
このような均一配分は、 入力信号がトーナリティの低い、 滑らか な信号であるときに有効である。
第 2に、 ビット配分(2-2) で使用できる残りビットを使用して、 信号情報の周波数スぺク トル及びレベルに対する依存性を持たせた 、 聴覚的な効果を得るためのビット配分を行う。
この場合のビット配分に対する量子化雑音スぺク トルの一例を図 9に示す。 この例では信号のスぺク トルに依存させたビット配分を 行っていて、 特に信号のスぺク トルの低域側にウェイ トをおいたビ ット配分を行い、 高域側に比して起きる低域側でのマスキング効果 の減少を補償している。 これは隣接臨界帯域間でのマスキングを考 慮して、 スぺク トルの低域側を重視したマスキングカーブの非対象 性に基づいている。
このように、 図 9の例では低域を重視したビット配分が行われて いる。 即ち、 第 1のビット配分でのノイズ · レベル (点線 N L 1 ) が、 上記周波数スぺク トル及びレベルに対する依存性を持たせた聴 覚的な効果を得るためのビット配分により、 点線 N L 2で示すノィ ズ · レベルに低減する。
なお、 図 8、 図 9の図中 S Sで示した太線は、 信号スぺク トルの ピークをつなげたものを示す。
そして最終的にビット配分(2-1) とビット配分(2- 2) に付加され るビット配分との和が、 図 3のビット配分回路 3 8で得られる。 最 終的なビット配分は以上の各ビット配分の和として与えられる。 次に従属配分ビットを含まないビット配分の別の方法を次に説明 する。
この場合の適応ビット配分回路 8 0 0の動作を図 1 0で説明する 図 1 0の実施例では、 入力信号は MDCT回路 1 3〜 1 5の出力 (MDCT係数) の和として与えられる。 MDCT係数は、 入力端子 8 0 1 に供給される。 当該入力端子 8 0 1に供給された MDCT係数は、 帯域 毎のエネルギ算出回路 8 0 3に与えられる。 帯域毎のエネルギ算出 回路 8 0 3では、 クリティカル ·バンドまたは高域においては、 ク リティカル ·バンドを更に再分割したそれぞれの帯域に関する信号 エネルギを算出する。 帯域毎のエネルギ算出回路 8 0 3で算出され たそれぞれの帯域に関するエネルギは、 エネルギ依存ビット配分回 路 8 0 4に供給される。
エネルギ依存ビット配分回路 8 0 4では、 使用可能総ビット発生 回路 8 0 2からの使用可能総ビット、 本実施例では 128kbpsのある 割合、 例えば 100kbpsを用いて白色の量子化雑音を作り出すような ビット配分を行う。 このとき、 入力信号のトーナリティが高いほど 、 すなわち入力信号のスペク トルの凸凹が大きいほど、 このビット 量が上記 128kbpsに占める割合が増加する。
なお、 入力信号のスペク トルの凸凹を検出するには、 隣接するブ ロックのブロック . フローティング係数の差の絶対値の和を指標と して使う。 そして、 求められた使用可能なビット量につき、 各帯域 のエネルギの対数値に比例したビット配分を行う。
聴覚許容雑音レベルに依存したビット配分算出回路 8 0 5は、 ま ず上記クリティカル ·バンド毎に分割されたスぺク トル 'データに 基づき、 いわゆるマスキング効果等を考慮した各クリティカル ·バ ンド毎の許容ノイズ量を求める。 次に聴覚許容雑音スぺク トルを与 えるように使用可能総ビットからエネルギ依存ビットを引いたビッ ト分が配分される。 このようにして求められたエネルギ依存ビット と聴覚許容雑音レベルに依存したビットは加算されて、 ビット配分 信号として、 出力端子 8 0 7から出力される。
ビット配分信号は、 図 1の適応ビット配分符号化回路 1 6〜 1 8 において、 各クリティカル ·バンド毎もしくは高域においてはクリ ティカル ·バンドを更に複数帯域に分割した帯域に割り当てられた ビット量に応じて、 各スペク トル ·データ (あるいは MDCT係数デ一 夕) を再量子化するようにしている。 このようにして符号化された データは、 図 1の出力端子 2 2〜2 4を介して取り出される。
さらに詳しく上記聴覚許容雑音スぺク トル依存のビット配分回路 8 0 5中の聴覚許容雑音スぺク トル算出回路について説明すると、 MDCT回路 1 3〜 1 5で得られた MDCT係数が上記許容雑音算出回路に 与えられる。
図 1 1は上記許容雑音算出回路をまとめて説明した一具体例の概 略構成を示すブロック回路図である。 この図 1 1において、 入力端 子 5 2 1には、 MDCT回路 1 3〜 1 5からの周波数領域のスぺク トル •データが供給されている。
この周波数領域の入力データは、 帯域毎のエネルギ算出回路 5 2 2に送られて、 上記クリティカル ·バンド (臨界帯域) 毎のエネル ギが、 例えば当該バンド内での各振幅値 2乗の総和を計算すること 等により求められる。 この各バンド毎のエネルギの代わりに、 振幅 値のピーク値、 平均値等が用いられることもある。 このエネルギ算 出回路 5 2 2からの出力として、 例えば各バンドの総和値のスぺク トルは、 一般にバークスぺク トルと称されている。 図 1 2はこのよ うな各クリティカル 'バンド毎のバークスぺク トル S Bを示してい る。 ただし、 この図 1 2では、 図示を簡略化するため、 上記クリテ イカル ·バンドのバンド数を 1 2ノくンド (B l 〜B 12) で表現して いる。 ここで、 上記バークスぺク トル S Bのいわゆるマスキングに於け る影響を考慮するために、 該バークスぺク トル S Bに所定の重み付 け関数を掛けて加算するような畳込み (コンボリューシヨン) 処理 を施す。 このため、 上記帯域毎のエネルギ算出回路 5 2 2の出力す なわち該バークスぺク トル S Bの各値は、 畳込みフィルタ回路 5 2 3に送られる。 該畳込みフィルタ回路 5 2 3は、 例えば、 入力デー 夕を順次遅延させる複数の遅延素子と、 これら遅延素子からの出力 にフィルタ係数 (重み付け関数) を乗算する複数の乗算器 (例えば 各バンドに対応する 2 5個の乗算器) と、 各乗算器出力の総和をと る総和加算器とから構成されるものである。
なお、 上記マスキングとは、 人間の聴覚上の特性により、 ある信 号によって他の信号がマスクされて聞こえなくなる現象をいうもの であり、 このマスキング効果には、 時間領域のオーディオ信号によ る時間軸マスキング効果と、 周波数領域の信号による同時刻マスキ ング効果とがある。 これらのマスキング効果により、 マスキングさ れる部分にノイズがあつたとしても、 このノイズは聞こえないこと になる。 このため、 実際のオーディオ信号では、 このマスキングさ れる範囲内のノイズは許容可能なノイズとされる。
ここで、 上記畳込みフィルタ回路 5 2 3の各乗算器の乗算係数 ( フィルタ係数) の一具体例を示すと、 任意のバンドに対応する乗算 器 Mの係数を 1 とするとき、 乗算器 M— 1で係数 0 . 1 5を、 乗算 器 M— 2で係数 0 . 0 0 1 9を、 乗算器 M— 3で係数 0 . 0 0 0 0 0 8 6を、 乗算器 M + 1で係数 0 . 4を、 乗算器 M + 2で係数 0 . 0 6を、 乗算器 M + 3で係数 0 . 0 0 7を各遅延素子の出力に乗算 することにより、 上記バークスぺク トル S Bの畳込み処理が行われ る。 ただし、 Mは 1〜2 5の任意の整数である。
次に、 上記畳込みフィルタ回路 5 2 3の出力は引算器 5 2 4に送 られる。 該引算器 5 2 4は、 上記畳込んだ領域での後述する許容可 能なノイズ ' レベルに対応するレベルひを求めるものである。 なお 、 当該許容可能なノイズ · レベル (許容ノイズ · レベル) に対応す るレベル αは、 後述するように、 逆コンボリューシヨン処理を行う ことによって、 クリティカル .バンドの各バンド毎の許容ノイズ · レベルとなるようなレベルである。 ここで、 上記引算器 5 2 4には 、 上記レベル αを求めるるための許容関数 (マスキングレベル 表 現する関数) が供給される。 この許容関数を増減させることで上記 レベル の制御を行っている。 当該許容関数は、 次に説明するよう な (II一 a i ) 関数発生回路 5 2 5から供給されているものである ο
すなわち、 許容ノイズ · レベルに対応するレベルなは、 クリティ カル ·バンドのバンドの低域から順に与えられる番号を i とすると 、 次の式で求めることができる。
α = S - ( η— a i )
この式において、 n, aは定数で a > 0、 Sは畳込み処理された バークスぺク トルの強度であり、 式中(n- ai)が許容関数となる。 例 として n = 38、 a = - 0. 5 を用いることができる。
このようにして、 上記レベル が求められ、 このデータは、 割算 器 5 2 6に伝送される。 当該割算器 5 2 6では、 上記畳込みされた 領域での上記レベルなを逆コンボリュ一ションするためのものであ る。 したがって、 この逆コンボリューシヨン処理を行うことにより 、 上記レベル からマスキング ·スレツショールドが得られるよう になる。 すなわち、 このマスキング 'スレツショールドが許容ノィ ズスペク トルとなる。 なお、 上記逆コンボリューシヨン処理は、 複 雑な演算を必要とするが、 本実施例では簡略化した割算器 5 2 6を 用いて逆コンボリューシヨンを行っている。
次に、 上記マスキング ·スレツショールドは、 合成回路 5 2 7を 介して減算器 5 2 8に伝送される。 ここで、 当該減算器 5 2 8には 、 上記帯域毎のエネルギ検出回路 5 2 2からの出力、 すなわち前述 したバークスぺク トル S Bが、 遅延回路 5 2 9を介して供給されて いる。
したがって、 この減算器 5 2 8で上記マスキング · スレツショー ルドとバークスぺク トル S Bとの減算演算が行われることで、 図 1 3に示すように、 上記バークスぺク トル S Bは、 該マスキング ·ス レツショールド M Sのレベルで示すレベル以下がマスキングされる ことになる。 なお、 遅延回路 5 2 9は上記合成回路 5 2 7以前の各 回路での遅延量を考慮してエネルギ検出回路 5 2 2からのバークス ぺク トル S Bを遅延させるために設けられている。
当該減算器 5 2 8からの出力は、 許容雑音補正回路 5 3 0を介し 、 出力端子 5 3 1を介して取り出され、 例えば配分ビット量情報が 予め記憶された R O M等 (図示せず) に送られる。 この R O M等は 、 上記減算回路 5 2 8から許容雑音補正回路 5 3 0を介して得られ た出力 (上記各バンドのエネルギと上記ノイズ · レベル設定手段の 出力との差分のレベル) に応じ、 各バンド毎の配分ビット量情報を 出力する。
このようにしてエネルギ依存ビットと聴覚許容雑音レベルに依存 したビットは加算されてその配分ビット量情報が図 1の端子 2 8を 介して上記適応ビット配分符号化回路 1 6〜 1 8に送られることで 、 ここで MDCT回路 1 3〜 1 5からの周波数領域の各スぺク トル ·デ 一夕がそれぞれのバンド毎に割り当てられたビット量で量子化され るわけである。
すなわち要約すれば、 適応ビット配分符号化回路 1 6〜 1 8では 、 上記クリティカル,バンドの各バンド帯域 (クリティカル ·バン ド) 毎もしくは高域においてはクリティカル ·バンドを更に複数帯 域に分割した帯域のエネルギもしくはピーク値と上記ノイズ · レべ ル設定手段の出力との差分のレベルに応じて配分されたビット量で 上記各バンド毎のスぺク トル ·データを量子化することになる。
ところで、 上述した合成回路 5 2 7での合成の際には、 最小可聴 カーブ発生回路 5 3 2から供給される図 1 3に示すような人間の聴 覚特性であるいわゆる最小可聴カーブ R Cを示すデータと、 上記マ スキング ·スレツショールド M Sとを合成することができる。 この 最小可聴カーブにおいて、 雑音絶対レベルがこの最小可聴カーブ以 下ならば該雑音は聞こえないことになる。
この最小可聴カーブは、 エンコード方法が同じであっても、 苒生 時の再生音量の違いで異なるものとなる。 しかし、 実際に音楽を音 源とするようなディジタル ·オーディオ · システムでは、 例えば 16 ビット量子化によるデジタル記録では、 最小可聴カーブに大差が無 い。
したがって、 4kHz付近の最も聴覚されやすい周波数帯域の量子化 雑音が聞こえなければ、 他の周波数帯域の最小可聴カーブのレベル 以下の量子化雑音は聞こえないと考えてよい。
したがって、 このように例えばシステムの持つダイナミックレン ジの 4kHz付近の雑音が聞こえない使い方をすると仮定し、 この最小 可聴カーブ R Cとマスキング ·スレツショールド M Sとを共に合成 することで許容ノイズ ' レベルを得るようにすると、 この場合の許 容ノイズ · レベルは、 図 1 3中の斜線で示す部分までとすることが できるようになる。 なお、 本実施例では、 上記最小可聴カーブの 4k Hzのレベルを、 例えば 20ビット相当の最低レベルに合わせている。 また、 この図 1 3は、 信号スぺク トル S Sも同時に示している。 また、 上記許容雑音補正回路 5 3 0では、 補正情報出力回路 5 3 3から送られてくる例えば等ラウドネス,カーブの情報に基づいて 、 上記減算器 5 2 8からの出力における許容雑音レベルを補正して いる。 ここで、 等ラウドネス ·カーブとは、 人間の聴覚特性に関す る特性曲線であり、 例えば 1kHzの純音と同じ大きさに聞こえる各周 波数での音の音圧を求めて曲線で結んだもので、 ラウドネスの等感 度曲線とも呼ばれる。
またこの等ラウドネス曲線は、 図 1 3に示した最小可聴カーブ R Cと略同じ曲線を描く ものである。 この等ラウドネス曲線において は、 例えば 4kHz付近では 1 kHzのところより音圧が 8〜10dB下がって も 1 kHzと同じ大きさに聞こえ、 逆に、 50Hz付近では 1 kHzでの音圧よ りも約 15dB高くないと同じ大きさに聞こえない。
このため、 上記最小可聴カーブのレベルを越えた雑音 (許容ノィ ズ . レベル) は、 該等ラウドネス曲線に応じたカーブで与えられる 周波数特性を持つようにするのが良いことがわかる。 このようなこ とから、 上記等ラウドネス曲線を考慮して上記許容ノイズ · レベル を補正することほ、 人間の聴覚特性に適合していることがわかる。 以上述べた聴覚許容雑音レベルに依存したスぺク トル形状を使用 可能総ビット 128kbpsの内の、 ある割合のビット配分でつくる。 こ の割合は入力信号のトーナリティが高くなるほど減少する。
次に 2つのビット配分方法の間でのビット量分割方法について説 明する。
図 1 0に戻って、 MDCT回路出力が供給される入力端子 8 0 1から の信号は、 スペク トルの滑らかさ算出回路 8 0 8にも与えられ、 こ こでスぺク トルの滑らかさが算出される。 本実施例では、 信号スぺ グトルの絶対値の隣接値間の差の絶対値の和を、 信号スぺク トルの 絶対値の和で割った値を、 上記スぺク トルの滑らかさとして算出し ている。
上記スぺク トルの滑らかさ算出回路 8 0 8の出力は、 ビット分割 率決定回路 8 0 9に与えられ、 ここでエネルギ依存のビット配分と 、 聴覚許容雑音スぺク トルによるビット配分間のビット分割率とが 決定される。 ビット分割率はスぺク トルの滑らかさ算出回路 8 0 8 の出力値が大きいほど、 スペク トルの滑らかさが無いと考えて、 ェ ネルギ依存のビット配分よりも、 聴覚許容雑音スぺク トルによるビ ット配分に重点をおいたビット配分を行う。 ビット分割率決定回路 8 0 9は、 それぞれエネルギ依存のビット配分及び聴覚許容雑音ス ぺク トルによるビット配分の大きさをコントロールするマルチプラ ィャ 8 1 1及び 8 1 2に対してコントロール出力を送る。 ここで、 仮にスぺク トルが滑らかであり、 エネルギ依存のビット配分に重き をおくように、 マルチプライヤ 8 1 1へのビット分割率決定回路 8 0 9の出力が 0 . 8の値を取ったとき、 マルチプライヤ 8 1 2への ビット分割率決定回路 8 0 9の出力は
1 - 0 . 8 = 0 . 2
とする。 これら 2つのマルチプライヤの出力はァダ一 8 0 6で足し 合わされて最終的なビット配分情報となって、 出力端子 8 0 7から 出力される。
このときのビット配分の様子を図 1 4、 図 1 5に示す。 また、 こ れに対応する量子化雑音の様子を図 1 6、 図 1 7に示す。
図 1 4は信号スぺク トルが低いト一ナリティを示す場合を示して おり、 図 1 5は信号スぺク トルが高いトーナリティを示す場合を示 している。 また、 図 1 4及び図 1 5の図中、 斜線で示す Q Sは信号 レベル依存分のビット量を示す。
また図中、 白抜きで示す Q Nは聴覚許容雑音レベル依存分のビッ ト量を示す。 図 1 6及び図 1 7の図中において、 S Sは信号レベル を示し、 N Sは信号レベル依存分のビット割当による雑音低下分を 、 N Nは聴覚許容雑音レベル依存のビット割当による雑音低下分を 示している。
先ず、 信号のスぺク トルが、 割合平坦である場合を示す図 1 4に おいて、 聴覚許容雑音レベルに依存したビット配分は、 全帯域に渡 り大きい信号雑音比を取るために役立つ。 しかし低域及び高域では 比較的少ないビット配分が使用されている。 これは聴覚的にこの帯 域の雑音に対する感度が小さいためである。 信号エネルギレベルに 依存したビット配分の分は量としては少ないが、 白色雑音スぺク ト ルを生じるように、 この場合には中低域の信号レベルの高い周波数 領域に重点的に配分されている。
これに対して、 図 1 5に示すように、 信号スぺク トルが高いトー ナリティを示す場合には、 信号エネルギレベルに依存したビット配 分量が多くなり、 量子化雑音の低下は極めて狭い帯域の雑音を低減 するために使用される。 聴覚許容雑音レベルに依存したビット配分 の集中はこれよりもきつくない。
図 1 0に示すように、 この両者のビット配分の和により、 孤立ス ぺク トル入力信号での特性の向上が達成される。
以上の様にして得られた従属配分ビットを含むビット配分と、 従 属配分ビットを含まないビット配分との 2つを用いて、 次のように して第 1 と第 2の量子化を行う。
図 1 8 A及び図 1 8 Bは 8チャンネルのオーディオ信号について 、 各チャンネルが要求する、 言い換えれば各チャンネルの音質を低 下させずに必要とされるビット数を示す。
図 1 8 Aにおいて、 格子模様部のみ(CH2,CH4, CH5, CH7, CH8) 、 又 は格子模様部及び斜線模様部の両者の和(CHI , CH3, CH6) が各チャン ネルが要求するビット量を示す。 この内、 斜線模様部は補助配分ビ ットに相当するビット量を示す。 点模様部は余剰ビット(R) を示し 、 ビット · レートで許容される各チャンネルの上限ビット量(147kb ps) と各チャンネルが実際に要求するビット量 (各チャンネル内で の許容ビット量を少ない値、 例えば 2 kbpsに規定している場合は、 その上限) との差である。
図 1 8 Aの例では、 全 8チャンネルのなかで要求するビット量が 147kbpsを越えるチャンネルは、 チャンネル CH1 、 チャンネル CH3 、 チャンネル CH6 である。
まず、 入力信号によって要求される、 補助配分ビットを含むビッ ト配分量が 147kbpsを越えるチャンネルについて、 例えばチャンネ ル CH1 について、 ある一定のビット量、 例えば 147kbpsを最大とす る部分(I ) と 147kbpsを越える部分(S) とに 2分して考える。
即ち、 入力信号を、 独立配分に相当する 147kbpsのビット量で量 子化される部分と、 補助配分のビット量で量子化される部分とに分 割し、 各々がそのビット量にて量子化されるものとする。
例えば 16ビッ卜のデジタル · ヮードの入力信号を、 M S Bを含む 10ビット部と L S Bを含む 6 ビット部とに分解し、 10ビット部を独 立配分で、 6 ビット部を補助配分にて量子化するような処理を考え る ο
この処理を行う構成を図 1 9に示す。
図 1 9の構成では、 ビット量が 147kbpsを越えるビット配分の各 サンプルについて、 複数サンプルごとのブロックについての正規化 処理、 すなわちブロック · フローティングを行う。 この時どの程度 のブロック · フローティングが行われたかを示す係数として、 スケ ール ' ファクタが得られる。
この図 1 9において、 入力端子 9 0 0に供給された信号はゲイン 調整器 9 0 5でゲイン調整される。
次に、 前記補助配分ビットを含まないビット配分でのビット量(1 47kbps) により、 各サンプル語長で量子化器 (quant i zer ) 9 0 1 が再量子化を行う。 この時、 量子化雑音を少なくするためには、 四 捨五入による再量子化が行われる。
また、 M S B側の数ビットがサンプル語長とされる。 この場合の サンプル語長を固定とすることも可能である。 この場合、 前記ビッ ト量(147kbps) に接近したビット量とすることは難しい。
そこで最良なのは、 入力信号に応じてサンプル語長を適応可変と することである。 このためには、 例えば上記量子化器 9 0 1からの データ量を積算し、 147kbps に接近するように、 上記量子化器 9 0 1をフィ一ド ·バック制御する。
次に、 量子化器 9 0 1の入力と出力の差が差分器 9 0 2で取られ 、 それがゲイン調整器 9 0 6でゲイン調整された後、 第 2の量子化 器 9 0 3に与えられる。
当該量子化器 9 0 3では、 前記入力信号のサンプル語長と、 前記 補助配分ビットを含まないビット配分によるサンプル語長との差の サンプル語長が得られる。 即ち、 前記入力信号の L S B側の数ビッ トが得られる。
この時のフローティング係数は第 1の量子化器 9 0 1で用いられ たフローティング係数と語長から自動的に決定される。 すなわち第 1の量子化器 9 0 1で用いられた語長が Nビットであったときには 、 ( 2 * * N ) で第 2の量子化器 9 0 3で用いられるフローティン グ係数が得られる。
第 2の量子化器 9 0 3では、 第 1の量子化器 9 0 1 と同じように 、 ビット配分による、 四捨五入処理を含む再量子化を行う。
このようにして 2つの量子化により、 要求ビット量が 147kbpsを こえるチャンネルは、 147kbps以下でなるべく 147kbpsに近いビッ ト配分によるデータと、 残りのビット配分によるデータとに分けら れる。
また、 要求されるビット配分が 147kbpsよりも小さいビット配分 となったチャンネルは、 そのままそのビット配分を使用する。
以上の例において、 前記従属配分によるビットは、 格子模様部(I ) で示す独立配分に相当するビットにも、 斜線模様部で示す補助配 分ビット(S) にも含まれるようにする。
即ち、 各チャンネルの全ビットは、 補助ビットの有無に関係無く 、 独立配分ビットと従属配分ビットとの和とする。
従って、 例えば前述のチャンネル CH1 に関し、 格子模様部(I) の 70%を独立配分によるビットとし、 残りの 30%を従属配分によるビ ットとする。 また、 補助ビット (斜線部分(S) ) については、 同様 に、 70 を独立配分によるビットとし、 残りの 30%を従属配分によ るビットとする。 この場合、 補助ビットの 50%を独立配分によるビ ットとし、 残りの 50%を従属配分によるビットとすることもできる o
さらに、 処理を簡単にするため、
格子模様部(I ) で示す 147kbps 未満の部分については、 独立配分 によるビットが配分されるとし、 斜線模様部で示す補助配分ビット (S) は従属配分によるビットが配分されるとする。 即ち、 各チャン ネルの全ビットについて、 補助ビットは全て従属配分ビットによる ものとする。
従って、 例えば前述の図 1 8 Aの例では、 チャンネル CH1 、 チヤ ンネル CH3 、 及びチャンネル CH6 についてのみ、 チャンネル間の相 関を考慮したビット配分、 即ち従属配分を使用してビット配分を行 レ、、 補助配分ビットとする。 この方法でのメリットは、 ビット配分 のための計算が容易になることである。
なお、 前述したように、 前記残りのビット配分の成分の大きさは 、 図 1 9で示されるようにビット配分(1) のスケール · ファクタと ワード . レングスからスケール · ファクタを算出できるので、 ヮー ド · レングスのみがデコーダに必要とされる。
以上のビット配分を行うためのフロー ·チヤートの例を図 2 2に 示す。
先ず、 各チャンネル毎に要求ビット量を算出する(S10) 。 次に基 準量を超えるビット量を要求しているチャンネルを特定する(S11) 。 続いて、 各チャンネルの余剰ビット(R) の合計( ∑R)を算出する
(512) 。 ここで、 基準量を超えるビット量を要求しているチャンネ ルについては、 基準量を超えるビット量(S) の合計を( ∑S)求める
(513) 。
余剰ビット(R) の合計と基準量を超えるビット量(S) の合計とを 比較し(S14) 、 もし基準量を超えるビット量(S) の合計が余剰ビッ ト(R) の合計より多い場合は、 基準量を超えるビット量(S) の合計 が余剰ビット(R) の合計以下となる迄、 各チャンネルの基準量を超 えるビット量(S) を減らす(S15) 。
各チャンネルへのビット配分が決まると、 まず、 配分ビット量の 一部で独立配分を行う(S16) 。 続いて、 配分ビット量の残りで従属 配分(S17) を行う。 各チャンネルへの配分が終了すると、 各チャンネル毎に補助配分 を行うか否かの判定を行い(S18) 、 基準量を超えるビット配分がな されたチャンネルについては、 補助配分を行う(S19) 。 基準量を超 えないビット配分がなされたチャンネルについては、 補助配分を行 わない(S20) 。
図 1 8 Aの例では、 サブ情報については言及していない。 しかし 、 実際には、 データのためのビットだけで無く、 そのデータを復元 するためのサブ情報のためのビットも考慮しなければならない。 そこで、 図 1 8 Bには、 サブ情報を考慮した例を示す。
まず、 128kbpsと 147kbpsという 2つのスレツショールドを設け る。 経験上、 19kbps程度あればサブ情報のためには充分と考えられ 。 よって、 このビット量と、 データのためにビット量とを考慮して 、 147kbpsが最下限として設定する。
また、 あるチャンネルで要求するビット配分量が、 128kbpsを上 回り 147kbpsを下回る場合には、 128kbpsを越えるデータ部分によ り、 サブ情報に使用できるビットが少なくなる。 このような場合に は、 このチャンネルは前記補助配分ビットを含まないビット配分で 128kbpsよりも小さく、 できるだけ 128kbps近いビット配分を行う 。 この処理により、 若干の音質低下となるが、 ビット削減量として は最大 19kbps、 即ちサブ情報分であり、 互換性を考慮すると、 この 方がメリットがある。
次に、 あるチャンネルで要求するビット配分量が 147kbpsを越え る場合について、 図 1 8 Bにより説明する。
例えばチャンネル CH1 について、 ある一定のビット量、 例えば 128kbpsを最大とする部分(la)と 128kbpsを越える部分(l b, S)とに 2分して考える。
即ち、 入力信号を、 独立配分に相当する 128kbpsで量子化される 部分と、 128kbps を越える配分で量子化される部分とに分割し、 各 々が配分されたビット量にて量子化されるものとする。 図 1 8 Aの例と同様、 図 1 9において、 第 1の量子化器 9 0 1 と 第 2の量子化器 9 0 3では、 四捨五入処理を含むビット配分を行う
2つの量子化器により、 上位のビットは 128kbps以下で、 かつ 128kbpsに近いビット配分により量子化され、 符号化される。
一方、 下位のビットについては、 128kbps を超える部分のビット 配分により量子化され、 符号化される。
図 1 8 A、 図 1 8 Bの何れの場合においても、 補助配分に使用で きるビット量には、 限りがあることに注意が必要である。
尚、 補助配分に使用できるビット量には、 限りがあることに注意 が必要である。 例えば、 前記図 1 8 Aの例において、 補助配分に必 要な全ビット量は、 CHI 、 CH3 、 及び CH6 の斜線部分(S) の合計、 更に詳細には、 各チャンネルのサブ情報をも考慮しなければならな い。
これに対して、 全チャンネルのビット . レートを固定とすれは、 図 1 8 Aでは、 CH2、 CH4、 CH5、 CH7 及び CH8 の各チャンネルの 余剰ビット(R) の合計が、 補助配分に使用できる最大ビット量に相 当する。 本実施例のように、 ビット · レ一トの上限が 800kbpsなら ば、 補助配分に使用できるビット量はかなり少なくなる。
よって、 余剰ビットが不足する場合は、 優先順位に応じて、 補助 配分に使用するビットに制限を与えなければならない。 前述した図 2 2の例のように、 配分ビット量を削減する(S15) 。 他に、 一律に 配分量を削減したり、 特定チャンネルを優先して配分することも効 果がある。
尚、 前述したように、 前記補助配分によるデータのスケール · フ ァクタについては、 独立配分に相当するビット配分によるデータの スケール · ファクタとワード · レングスとから算出できるので、 ヮ
―ドレングスのみを伝送すれば良い。
以上のようにして量子化器 9 0 1及び 9 0 3で得られた各チャン ネルのデ一夕は、 所定の時間を単位とするシンク ,ブロックに配列 される。 各チャンネルのデータの並べ方は、 図 2 0に模式的に示す o
図 2 0では、 前述の図 1 8 Bの例のデ一夕並びを示している。 即 ち、 シンクブロック中に、 先ず、
(1) 前記捕助配分を使用しないチャンネル ·データ、 即ち 128kbps 以下のビット配分によるチャンネル ·データ (CH2 、 CH4 、 CH5 -、 CH7 、 CH8 ) 、 格子模様で示す、
(2) 前記補助配分を使用するチャンネル ·データの内、 ある一定の ビット量、 例えば 128kbpsを最大とする部分のチャンネル ·データ ( CHI 、 CH3 、 CH6 ) 、 白抜きで示す、
(3) 前記補助配分を使用するチャンネル ·データのうち、 128kbps を越える補助配分による部分のチャンネル ·データ (CHI 、 CH3 、 CH6 ) 、 斜線模様で示す。 このように配列することにより、 次の ような処理が可能となる。
まず、 補助配分を使用しないデコーダにおいては、 (1) 部、 (2) 部のチャンネル ·データのみを使用する。 よって、 全チャンネルに ついて、 補助配分を使用しないデータと同様に扱うことができる。 補助配分によるデ一夕を使用しないため、 補助配分によるチャンネ ル ·データ (CHI 、 CH3 、 CH6 ) は、 例えば M S B部のみのデコー ドとなる。 よって、 量子化ステップが粗く再量子化されたこととな り、 音質は劣化する。 しかし、 聴覚上は問題とならない程度の劣化 とされる。
補助配分を使用するデコーダにおいては、 全データが使用される 。 よって、 補助配分によるチャンネル ·データ (CHI 、 CH3 、 CH6) は、 M S B部と L S B部とが合成された完全なワードをなす。 よつ て、 極めて高品質な音声信号をデコードできる。
この例では、 補助配分ビットを使用するチャンネル数は、 3を例 示している。 実際には、 音質的に重要な前方の 2チャンネルにのみ 補助配分ビットを使用すると決めれば、 シンク ·ブロックの処理が 簡単になる。 逆に、 補助配分ビットを使用するチャンネルを決めな い、 即ち入力信号に応じて適応的に補助配分ビットを使用するチヤ ンネルが切り替わる場合は、 各データにチャンネル IDを付与するこ とで、 簡単に対応できる。 この IDのためには、 チャンネルあたり 3 ビットのデータの増加に過ぎない。
なお、 図 1 9において、 エンコーダに対応するデコーダでは、 ゲ ィン調整器 9 0 6に対応してゲイン調整器 9 0 7が、 ゲイン調整器 9 0 5に対応してゲイン調整器 9 0 8が設けられ、 これらゲイン調 整器 9 0 7, 9 0 8の出力が加算器 9 0 4で加算される。 その加算 出力が出力端子 9 1 0から取りだされれる。
加算出力は、 独立配分によるデータと、 補助配分によるデータと の加算出力であり、 完全なデータとされる。
図 2 1は、 このようにして高能率符号化された信号を再び復号化 するための基本的な本発明実施例の復号化装置を示している。
この図 2 1において、 各帯域の量子化された MDCT係数は、 復号化 装置入力端子 1 2 2〜 1 2 4に与えられ、 使用されたブロック ·サ ィズ情報は、 入力端子 1 2 5〜 1 2 7に与えられる。 復号化回路 1 1 6〜 1 1 8では適応ビット配分情報を用いてビット割当を解除す る
次に、 卜 MDCT回路 1 1 3〜 1 1 5では周波数領域の信号が時間領 域の信号に変換される。 これらの部分帯域の時間領域信号は、 I -QM F 回路 1 1 2、 1 1 1により、 全帯域信号に復号化される。
ここで、 前記 128kbps 以下のビット配分(1) が行われたチャンネ ルと、 前記 147kbps以上のビット配分(2) が行われたチャンネルに おける 128kbpsを最大とする部分と、 補助配分ビットによる部分と のそれぞれが上記復号化回路 1 1 6〜 1 1 8で復号化される。
但し、 補助配分を使用するものはそれぞれが復号化された後、 L S B部 . M S B部として 1 ワードとされ、 1つの精度の高いサンプ ルとなる。
次に、 本発明実施例の記録メディアは、 上述したような本発明実 施例の高能率符号化装置により符号化された信号が記録されるもの である。 前述した映画フィルの他、 光ディスク、 光磁気ディスク、 磁気ディスク等のディスク状の記録媒体に上記符号化信号が記録さ れたものや、 磁気テープ等に上記符号化信号が記録されたもの、 或 いは、 符号化信号が記憶された半導体メモリ、 I- Cカードなどを挙 げることができる。
また、 本発明実施例の記録メディァへの本発明実施例の高能率符 号化信号記録方法は、 一つのシンクブロックの中に、 複数チャンネ ルのための一定の基準量よりも大きいビット量を配分する第 1のビ ット配分量に関するサンプル群と、 複数チャンネルのための前記第
1のビット配分量に関するサンプル群残りの第 2のビット配分サン プル群とを分離して記録している。 さらに、 この記録は、 各チャン ネル毎に交互に行われる。
本発明では、 デジタル音声信号の圧縮符号化 ·復号化装置、 又は 方法を実施例として詳細に説明した。
さらに実施例として詳細に説明をしないものの、 本発明はデジ夕 ル音声信号に止まらず、 デジタル画像信号にも適用できることは勿 である。
即ち複数の動画像を並列チャンネルにて伝送 ·記録するようなも のにおいて、 要求されるビット配分が大きい複雑な図柄の画像チヤ ンネルについては、 所定値を上回る部分については、 補助配分とし て同様に扱うことが可能である。 産業上の利用可能性 以上の説明からも明らかなように、 本発明に係る高能率符号化方 法と、 これに対応する高能率符号の復号化方法、 及び高能率符号の 復号化再生方法、 その高能率符号化方法により符号化された信号を 記録する高能率符号化信号記録方法及び記録がなされた記録メディ ァにおいては、 マルチチャンネルシステムの圧縮に対して従属配分 技術を用いて音質を上げた圧縮信号を、 従属配分を利用して高音質 で再生することが可能である。
また通常良く使われる各チャンネル個別に固定値以下のビット · レートを用いてチャンネル毎でのビット配分を行うデコーダでも、 大きな音質劣化無く再生できるようになる。 さらに、 このことによ り、 例えば映画フィルム上の音声信号は同時に他の光ディスク · メ ディアへの転用が容易となる。 また、 フィルム上の信号の再生装置 は、 安価な通常良く使われる各チャンネル個別に固定値以下のビッ ト · レ一トを用いてチャンネル毎でのビット配分を行うデコーダで も作成することが可能となる。

Claims

請 求 の 範 囲
1 . 複数のチャンネルの各デジタル信号のサンプル 'データを所 定のビット量により再量子化して、 符号化する高能率符号化方法で あつ 乙、
予め決められた一定の基準量よりも大なるビット量を配分するチ ヤンネルを特定するステップと、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す るステップと、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ —夕の一部を再量子化するステップと、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル ·データの他部を再量子化するステップと、
上記再量子化されたサンプル ·データの一部と上記再量子化され たサンプル ·データの他部とを合成するステップと、
からなる高能率符号化方法。
2 . 上記各チャンネルに配分されるビットのビット量の全チャン ネルでの合計が、 略一定であることを特徵とする請求の範囲 1記載 の高能率符号化方法。
3 . 請求の範囲 1及び 2記載の高能率符号化方法の上記各チャン ネルの上記サンプル ·データを再量子化するステップは、 更に、 複数のサンプル ·データを共通のスケール · ファクタにより正規 化するステップと、
上記共通のスケール · ファクタにより正規化された各サンプル · データのヮード長を規定するステップと、
を有する。
4 . 前記第 1のビット量によるデータと前記第 2のビット量によ るデータとは、 シンク ,ブロックにおいて、 異なる領域に位置する ことを特徴とする、 請求の範囲 3記載の高能率符号化方法。
5 . 前記第 2のビット量は、 補助配分ビットの含まれないビット 配分であり、 上記第 2のビット配分量は補助配分ビットの含まれた ビット配分と上記第 1のビット配分量の含まれないビット配分の差 であることを特徴とする請求の範囲 1記載の高能率符号化方法。
6 . 前記第 2のビット量は、 余剰ビットの合計ビット量以下であ ることを特徴とする、 請求の範囲 1、 2、 3、 又は 4記載の高能率 符号化方法。
7 . 前記再量子化をするステップは、 入力信号を、 時間軸と周波 数軸とについて細分化した小ブロック毎のサンプル ·データについ て再量子化することを特徴とする請求の範囲 1から 6記載の高能率 符号化方法。
8 . 前記時間軸と周波数軸とについて細分化された小ブロック中 のサンプル ·データは、
非ブロック化周波数特性の分析を行い、
前記非ブロック化周波数特性の分析の出力をブロック化周波数特性 の分析をすることを特徴とする請求の範囲 7記載の高能率符号化方 法。
9 . 前記ブロック化周波数特性の分析では入力信号の時間特性に より適応的にブロック ·サイズを変更することを特徴とする請求の 範囲 8記載の高能率符号化方法。
1 0 . 予め決められた一定の基準量よりも大なるビット量を配分 するチャンネルを特定する前記ステップの前記予 A決められた一定 の基準量は、 さらにデ一夕に使用するビット量の基準量と、 サブ情 報のためのビット量を考慮した基準量との少なく とも 2つの基準量 であることを特徵とする請求の範囲 1記載の高能率符号化方法。
1 1 . 予め決められた一定の基準量よりも大なるビット量を配分 するチャンネルを特定する前記ステップの前記予め決められた一定 の基準量は、 上記サブ情報のためのビット量を考慮した基準量であ ることを特徴とする請求の範囲 1 0記載の高能率符号化方法。
1 2 . 前記ビットの配分は、 上記各チャンネル毎で独立して配分 する独立配分と、 上記各チャンネル間で関係して配分する従属配分 とによることを特徴とする請求の範囲 1記載の高能率符号化方法。
1 3 . 上記第 1のビット量は上記独立配分によるビット配分によ るものであり、
上記第 2のビット量は上記従属配分によるビット配分によるもの であることを特徴とする請求の範囲 1 2記載の高能率符号化方法。
1 4 . 前記ブロック ·サイズの変更は、 少なく とも 2つの前記非 ブロック化周波数特性の分析の出力帯域毎に独立に行うことを特徴 とする請求の範囲 1 3記載の高能率符号化方法。
1 5 . 各チャンネルの前記第 1のビット配分部分と前記第 2のビ ット配分部分の和が、 各チャンネルのスケール · ファクタ又はサン プル最大値により変化することを特徴とする請求の範囲 1から 1 4 記載の高能率符号化方法。
1 6 . 各チャンネルの信号のエネルギ値又はピーク値又は平均値 の振幅情報の時間的変化により、 従属配分を変化させることを特徴 とする請求の範囲 1 2記載の高能率符号化方法。
1 7 . 各チャンネルのスケール · ファクタの時間的変化により、 従属配分を変化させることを特徴とする請求の範囲 1 2記載の高能 率符号化方法。
1 8 . 請求の範囲 1から 1 7記載の高能率符号化方法により形成 された符号化信号が記録された記録媒体。
1 9 . 一^ Dのシンクブロックの中に、 複数チャンネルのデータを 記録するための高能率符号化信号の記録方法であって、
予め決められた一定の基準量よりも小なるビット量が配分された チャンネルのデータを記録するステップと、
予め決められた一定の基準量よりも大なるビット量が配分された チャンネルのデータを記録するステップとを備え、
このデ一夕を記録するステップは、 さらに、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す るステップと、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ 一夕の一部を再量子化し、 この再量子化したデータを記録するステ ップと、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル ·データの他部を再量子化し、 この再量子化したデータを記 録するステップとを備える。
2 0 . 上記再量子化したデータは、 シンク ·ブロック内で交互に 記録されていることを特徴とする請求の範囲 1 9記載の高能率符号 化信号の記録方法。
2 1 . 複数のチャンネルの各デジタル信号のサンプル ·データを 所定のビット量により再量子化して、 符号化する符号化方法による 高能率符号化信号の復号方法であつて、
上記高能率符号化方法は、
予め決められた一定の基準量よりも大なるビット量を配分ずるチ ヤンネルを特定するステップと、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す るステップと、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ —夕の一部を再量子化するステップと、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル · データの他部を再量子化するステップと、
上記再量子化されたサンプル ·データの一部と上記再量子化され たサンプル ·データの他部とを合成するステップとを備え、 上記合成されたサンプル ·データは記録又は伝送され、 記録又は伝 送されたサンプル ·データのうち、 少なく とも上記第 1のビット量 によるサンプル■データをそのチャンネルのサンプル ·データとし て、 上記複数チャンネルの少なく とも 1のデジタル信号を得ること を特徴とする、 高能率符号化信号の復号化方法。
2 2 . 複数のチャンネルの各デジタル信号のサンプル■データを 所定のビット量により再量子化して、 符号化する符号化方法による 高能率符号化信号の復号方法であつて、
上記符号化方法は、
予め決められた一定の基準量よりも大なるビット量を配分するチ ヤンネルを特定するステップと、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す るステップと、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ —夕の一部を再量子化するステップと、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル ·データの他部を再量子化するステップと、
上記再量子化されたサンプル ·デ一夕の一部と上記再量子化され たサンプル ·データの他部とを合成するステップとを備え、 上記合成されたサンプル ·データは記録又は伝送され、 記録又は伝 送されたサンプル ·データのうち、 上記第 1のビッ小量によるサン プル ·データのみをそのチャンネルのサンプル,データとして、 上 記複数チャンネルの少なく とも 1のデジタル信号を得ることを特徴 とする高能率符号化信号の復号化方法。
2 3 . 請求の範囲 2 1及び 2 2記載の高能率符号化信号の復号化 方法の上記各チャンネルの上記サンプル ·データを再量子化するス テツプは、 さらに、
複数のサンプル ·データを共通のスケール■ ファクタにより正規 化するステップと、
上記共通のスケール · ファクタにより正規化された各サンプル · データのヮード長を規定するステップとを備える。
2 4 . 前記第 2のビット配分量に関するサンプル ·データのため のスケール, ファクタを、 前記第 1のビット配分量に関するサンプ ル ·データのためのスケール · ファクタおよびワードレングスから 求めていることを特徴とする請求の範囲 2 3記載の高能率符号化信 号の復号化方法。
2 5 . 複数のチャンネルの各デジタル信号のサンプル ·デ一夕を 所定のビット量により再量子化して、 符号化する高能率符号化装置 であって、 この高能率符号化装置は、
予め決められた一定の基準量よりも大なるビット量を配分するチ ヤンネルを特定する手段と、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す る手段と、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ 一夕の一部を再量子化する手段と、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル ·データの他部を再量子化する手段と、
上記再量子化されたサンプル ·データの一部と上記再量子化され たサンプル■データの他部とを合成する手段とを備える。
2 6 . 上記各チャンネルに配分されるビットのビット量の全チヤ ンネルでの合計が、 略一定であることを特徴とする請求の範囲 2 5 記載の高能率符号化装置。
2 7 . 請求の範囲 2 5及び 2 6記載の高能率符号化装置の上記各 チャンネルの上記サンプル ·データを再量子化する手段は、 さらに 複数のサンプル ·データを共通のスケール · ファクタにより正規 化する手段と、
上記共通のスケール · ファクタにより正規化された各サンプル · データのヮード長を規定する手段とを備える。
2 8 . 前記第 1のビット量によるデータと前記第 2のビット量に よるデータとは、 シンク ·ブロックにおいて、 異なる領域に位置す ることを特徴とする請求の範囲 2 5記載の高能率符号化装置。
2 9 . 前記第 2のビット量は、 補助配分ビットの含まれないビッ ト配分であり、 上記第 2のビット配分量は補助配分ビットの含まれ たビット配分と上記第 1のビット配分量の含まれないビット配分の 差であることを特徴とする請求の範囲 2 5記載の高能率符号化装置 o
3 0 . 前記第 2のビット量は、 余剰ビットの合計ビット量以下で あることを特徵とする、 請求の範囲 2 5から 2 9記載の高能率符号 化装置。
3 1 . 前記再量子化をする手段は、 入力信号を、 時間軸と周波数 軸とについて細分化した小ブロック毎のサンプル ·データについて 再量子化することを特徴とする請求の範囲 2 5から 3 0記載の高能 率符号化装置。
3 2 . 前記時間軸と周波数軸とについて細分化された小ブロック 中のサンプル■データは、
非ブロック化周波数特性の分析を行い、
前記非ブロック化周波数特性の分析の出力をブロック化周波数特性 の分析をすることを特徵とする請求の範囲 3 1記載の高能率符号化
3 3 . 前記ブロック化周波数特性の分析では入力信号の時間特性 により適応的にブロック ·サイズを変更することを特徴とする請求 の範囲 3 2記載の高能率符号化装置。
3 4 . 前記予め決められた一定の基準量は、 さらにデータに使用 するビット量の基準量と、 サブ情報のためのビット量を考慮した基 準量との少なく とも 2つの基準量であることを特徴とする、 請求の 範囲 2 5記載の高能率符号化装置。
3 5 . 前記予め決められた一定の基準量は、 上記サブ情報のため のビット量を考慮した基準量であり、 この基準量よりも大なるビッ ト量を配分するチャンネルを特定する手段であることを特徴とする 、 請求の範囲 3 4記載の高能率符号化装置。
3 6 . 前記ビットの配分は、 上記各チャンネル毎で独立して配分 する独立配分と、 上記各チャンネル間で関係して配分する従属配分 とによることを特徴とする請求の範囲 2 5記載の高能率符号化装置 o
3 7 . 上記第 1のビット量は上記独立配分によるビット配分によ るものであり、
上記第 2のビット量は上記従属配分によるビット配分によるもの であることを特徴とする請求の範囲 3 6記載の高能率符号化装置。
3 8 . 前記ブロック ·サイズの変更は、 少なく とも 2つの前記非 ブロック化周波数特性の分析の出力帯域毎に独立に行うことを特徴 とする請求の範囲 3 5記載の高能率符号化装置。
3 9 . 各チャンネルの前記第 1のビット配分部分と前記第 2のビ ット配分部分の和が、 各チャンネルのスケール ' ファクタ又はサン プル最大値により変化することを特徴とする請求項 2 5〜3 6記載 の高能率符号化装置。
4 0 . 各チャンネルの信号のエネルギ値又はピーク値又は平均値 の振幅情報の時間的変化により、 従属配分を変化させることを特徴 とする請求の範囲 3 6記載の高能率符号化装置。
4 1 . 各チャンネルのスケール · ファクタの時間的変化により、 従属配分を変化させることを特徴とする請求の範囲 3 6記載の高能 率符号化装置。
4 2 . 請求の範囲 2 5〜3 9記載の高能率符号化装置により形成 された符号化信号が記録された記録媒体。
4 3 . 上記記録媒体ほ、 映画フィルムであること特徴とする請求 の範囲 4 2記載の符号化信号が記録された記録媒体。
4 4 . 複数のチャンネルの各デジタル信号のサンブル ·デ一夕を 所定のビット量により再量子化して、 符号化し復号化する高能率符 号化 ·復号化システムであって、
この高能率符号化 ·復号化システムは、
予め決められた一定の基準量よりも大なるビット量を配分するチ ヤンネルを特定する手段と、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す る手段と、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ 一夕の一部を再量子化する手段と、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル ·データの他部を再量子化する手段と、
上記再量子化されたサンプル ·データの一部と上記再量子化され たサンプル ·データの他部とを合成する手段と、
上記合成されたサンプル ·デ一夕を記録媒体への記録又は伝送路 へ伝送する手段と、
上記記録又は伝送されたサンプル ·データのうち、 少なく とも上 記第 1のビット量によるサンプル ·データを使用して、 上記サンプ ル ·データの一部を再量子化したサンプル ·データを復号して、 上 記複数チャンネルの少なく とも 1のデジタル信号を得る手段とを備 る。
4 5 . 複数のチャンネルの各デジタル信号のサンプル ·デ一夕を 所定のビット量により再量子化して、 符号化し復号化する高能率符 号化 ·復号化システムであって、
この高能率符号化 ·復号化システムは、 予め決められた一定の基準量よりも大なるビット量を配分するチ ヤンネルを特定する手段と、
上記チャンネルへ配分するビット量を、 多く とも前記一定の基準 量を越えない第 1のビット量と、 残りの第 2のビット量とに配分す る手段と、
上記第 1のビット量によるビットを使用して、 上記サンプル ·デ 一夕の一部を再量子化する手段と、
上記第 2のビット量によるビットを使用して、 少なく とも上記サ ンプル ·データの他部を再量子化する手段と、
上記再量子化されたサンプル ·データの一部と上記再量子化され たサンブル ·データの他部とを合成する手段と、
上記合成されたサンプル ·データを記録媒体への記録又は伝送路 へ伝送する手段と、
上記記録又は伝送されたサンプル ·データのうち、 上記第 1のビ ット量によるサンプル■デ一夕のみをそのチャンネルのサンプル · データとして復号して、 上記複数チャンネルの少なく とも 1のデジ タル信号を得る手段とを備える。
PCT/JP1994/001166 1993-07-16 1994-07-15 Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite WO1995002925A1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP50447495A JP3336618B2 (ja) 1993-07-16 1994-07-15 高能率符号化方法及び高能率符号化信号の復号化方法
KR1019950701063A KR100339324B1 (ko) 1993-07-16 1994-07-15 고능률부호화방법,고능률부호의복호화방법,고능률부호의부호화장치,고능률부호의복호화장치,및고능률부호화.복호화시스템
AU71952/94A AU686199B2 (en) 1993-07-16 1994-07-15 High-efficiency encoding method, high-efficiency decoding method, high-efficiency encoding device, high-efficiency decoding device, high-efficiency encoding/decoding system and recording media
US08/403,698 US6104321A (en) 1993-07-16 1994-07-15 Efficient encoding method, efficient code decoding method, efficient code encoding apparatus, efficient code decoding apparatus, efficient encoding/decoding system, and recording media
EP94921102A EP0669724A4 (en) 1993-07-16 1994-07-15 HIGH EFFICIENCY ENCODING METHOD AND DEVICE, HIGH EFFICIENCY DECODING METHOD AND DEVICE, HIGH EFFICIENCY ENCODING / DECODING SYSTEM AND RECORDING MEDIUM.

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP5/176760 1993-07-16
JP17676093 1993-07-16

Publications (1)

Publication Number Publication Date
WO1995002925A1 true WO1995002925A1 (fr) 1995-01-26

Family

ID=16019335

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1994/001166 WO1995002925A1 (fr) 1993-07-16 1994-07-15 Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite

Country Status (8)

Country Link
US (1) US6104321A (ja)
EP (1) EP0669724A4 (ja)
JP (1) JP3336618B2 (ja)
KR (1) KR100339324B1 (ja)
CN (1) CN1065382C (ja)
AU (1) AU686199B2 (ja)
TW (1) TW272341B (ja)
WO (1) WO1995002925A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264811A (ja) * 2002-09-04 2004-09-24 Microsoft Corp オーディオの量子化および逆量子化
US7801735B2 (en) 2002-09-04 2010-09-21 Microsoft Corporation Compressing and decompressing weight factors using temporal prediction for audio data
US7930171B2 (en) 2001-12-14 2011-04-19 Microsoft Corporation Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
CN101872618B (zh) * 1995-12-01 2012-08-22 Dts(Bvi)有限公司 多通道音频编码器

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6366888B1 (en) * 1999-03-29 2002-04-02 Lucent Technologies Inc. Technique for multi-rate coding of a signal containing information
JP2001134295A (ja) * 1999-08-23 2001-05-18 Sony Corp 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
US7016835B2 (en) * 1999-10-29 2006-03-21 International Business Machines Corporation Speech and signal digitization by using recognition metrics to select from multiple techniques
WO2002017582A2 (en) * 2000-08-25 2002-02-28 Applied Micro Circuits Corporation Transmitting a multibit signal on a single connector
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
US6476735B2 (en) * 2000-12-02 2002-11-05 Daniel David Lang Method of encoding bits using a plurality of frequencies
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7199954B2 (en) * 2003-07-15 2007-04-03 Hitachi Global Storage Technologies Netherlands, B.V. Method, apparatus and program storage device for determining sector block sizes using existing controller signals
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP3909709B2 (ja) * 2004-03-09 2007-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、方法、及びプログラム
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7966175B2 (en) 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
WO2008100098A1 (en) 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101197774B (zh) * 2007-12-12 2012-01-04 上海华为技术有限公司 一种对业务流量进行控制的方法与装置
EP2248263B1 (en) * 2008-01-31 2012-12-26 Agency for Science, Technology And Research Method and device of bitrate distribution/truncation for scalable audio coding
US20120095729A1 (en) * 2010-10-14 2012-04-19 Electronics And Telecommunications Research Institute Known information compression apparatus and method for separating sound source
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63110830A (ja) * 1986-10-28 1988-05-16 Nec Corp 帯域分割符号化復号化装置
JPH05114888A (ja) * 1991-03-08 1993-05-07 Nec Corp 可変ビツト型adpcmトランスコーダ
JPH0629934A (ja) * 1992-07-10 1994-02-04 Nippon Hoso Kyokai <Nhk> 適応差分符号化伝送方法
JPH06149292A (ja) * 1992-11-11 1994-05-27 Sony Corp 高能率符号化方法及び装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
NL8101199A (nl) * 1981-03-12 1982-10-01 Philips Nv Systeem voor het kwantiseren van signalen.
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPS59223032A (ja) * 1983-06-01 1984-12-14 Sony Corp ディジタル信号伝送装置
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
EP0267344B1 (en) * 1986-10-30 1993-09-01 International Business Machines Corporation Process for the multi-rate encoding of signals, and device for carrying out said process
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
FR2625060B1 (fr) * 1987-12-16 1990-10-05 Guichard Jacques Procede et dispositifs de codage et de decodage pour la transmission d'images a travers un reseau a debit variable
US5034965A (en) * 1988-11-11 1991-07-23 Matsushita Electric Industrial Co., Ltd. Efficient coding method and its decoding method
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
DE69031517T2 (de) * 1989-06-30 1998-02-26 Nec Corp Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5502789A (en) * 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
US5049992A (en) * 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder
CA2052604A1 (en) * 1991-03-04 1992-09-05 Andrew F. Lum Carrier-free metalworking lubricant and method of making and using same
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63110830A (ja) * 1986-10-28 1988-05-16 Nec Corp 帯域分割符号化復号化装置
JPH05114888A (ja) * 1991-03-08 1993-05-07 Nec Corp 可変ビツト型adpcmトランスコーダ
JPH0629934A (ja) * 1992-07-10 1994-02-04 Nippon Hoso Kyokai <Nhk> 適応差分符号化伝送方法
JPH06149292A (ja) * 1992-11-11 1994-05-27 Sony Corp 高能率符号化方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP0669724A4 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872618B (zh) * 1995-12-01 2012-08-22 Dts(Bvi)有限公司 多通道音频编码器
US7930171B2 (en) 2001-12-14 2011-04-19 Microsoft Corporation Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
JP2004264811A (ja) * 2002-09-04 2004-09-24 Microsoft Corp オーディオの量子化および逆量子化
US7801735B2 (en) 2002-09-04 2010-09-21 Microsoft Corporation Compressing and decompressing weight factors using temporal prediction for audio data
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化

Also Published As

Publication number Publication date
EP0669724A1 (en) 1995-08-30
JP3336618B2 (ja) 2002-10-21
EP0669724A4 (en) 1998-09-16
US6104321A (en) 2000-08-15
CN1113401A (zh) 1995-12-13
AU7195294A (en) 1995-02-13
TW272341B (ja) 1996-03-11
AU686199B2 (en) 1998-02-05
KR100339324B1 (ko) 2002-10-04
CN1065382C (zh) 2001-05-02

Similar Documents

Publication Publication Date Title
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
JP3404837B2 (ja) 多層符号化装置
EP0692881B1 (en) Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media
JP3278900B2 (ja) データ符号化装置及び方法
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
EP0575110B1 (en) Compressing and expanding digital signals
JP3397001B2 (ja) 符号化方法及び装置、復号化装置、並びに記録媒体
KR100512208B1 (ko) 디지탈신호처리방법,디지탈신호처리장치,디지탈신호기록방법,디지탈신호기록장치,기록매체,디지탈신호전송방법,및디지탈신호전송장치
US5781586A (en) Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium
JP3250376B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
US5758316A (en) Methods and apparatus for information encoding and decoding based upon tonal components of plural channels
JPH0846517A (ja) 高能率符号化及び復号化システム
US20010047256A1 (en) Multi-format recording medium
EP0734019A1 (en) Information processing method, information processing device and media
JP3879250B2 (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3318824B2 (ja) デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
JP3227945B2 (ja) 符号化装置
JP3227948B2 (ja) 復号化装置
JP3879249B2 (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
JP3362476B2 (ja) 高能率符号化装置及びインタフェース装置
JPH07161140A (ja) ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU CN JP KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT DE ES FR GB IT

WWE Wipo information: entry into national phase

Ref document number: 1994921102

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 1019950701063

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 08403698

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1994921102

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 1994921102

Country of ref document: EP