WO1995034884A1

WO1995034884A1 - Analyseur de signaux

Info

Publication number: WO1995034884A1
Application number: PCT/JP1995/001154
Authority: WO
Inventors: Eiichi Tsuboka; Junichi Nakahashi
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 1994-06-13
Filing date: 1995-06-09
Publication date: 1995-12-21
Also published as: KR100324988B1; CN1129485A; CN1159704C; US6061652A; KR960704299A

Description

明細書

技術分野

本発明は、音^:識装の信" 装置に関するものである。背景技術

音 ^識を行う方法として、 HMM (Hi dden Markov Model) を用いる方 pマッチングを用いる方法が知られている。何れも音識の基本技術として多用されているが、これらの方式において、性能を落とすことなく如何に計算量を減ずる力と言うことは、大語彙化や連続音 m ^を魏する上で重要な問題の

3である。この問題の解決法の一^ 5としてべクトル量子化を用いるものが既に提案されている。本願発明は、この改良に関わるものである。そこで、本題にはいる前に、先ず、 HMMと D Pマッチングの一般的な説明と、 HUBベクトル量子化の技術が如何なる形で用いられているかと言うことを説明する。

ΗΜΜは、ある確率的性質に従って時系列信号を発生するモデルの 1つであると考えられる。 ΗΜΜを用いた音^^識は、認識すべき単語^^節、等の認 WM-^L (以後代表的に単語とする） r (= 1，.. .，R)に対応して HMM rを設けておき、ベクトル系列 Y Cy y ^ . - ^ y T) ( y _t：時点 tで観測されるべクトル）が観測されたとき ItflB各 HMM rから Yの発生する度合を計算し、その度合が最大の HMMに対応する単語を認識結果とするものである。

図 1は、 HMMの一例を示すものである。〇はその HMMでモデル化しようとするシステムの状態、 →は状態の遷移の方向、 Q iは状態 iを表す。状態 i力ゝら状

差替え用紙（規則 26) 態 jへの遷移は確率 a i jで生じるとする。状態とその遷移確率のみが^ ¾されているはマルコフと呼ばれるが、 HMMではさらに、各状態遷移にともなつてベクトルが発生するとし、状態遷移 Q i—cijに伴って、ベクトル yが発生する度合 ωϋ(3τ)が定義されている。 yが状態の遷移に伴ってではなく、状態に伴って発生するとして0> _; 3 = 0) ）=(^ ）、または0> 1』）=0)』』）= o> j(y)とする場合も多い。本願では、状態にともなって yが発生するものとして説明する。ここで、 HMMの構状態遷移確率、ベクトルの発生確率は、その HMMでモデル化しようとする対象（音声認識に用いる場合は単語などの音声パターン）の挙動をできるだけ忠実に説明できるように決定される。図 2は音声認識でよく用いられる HMMの構成の 1例である。

ある HMMがされると、観測ベクトル系列 Yがあるモデル（λと名付ける）力ら発生する度合 L (Υ I λ)は次のようにして計算できる。

(数 1)

L(Y\ l)=∑ π_Χι II a x_tx_t+1 o)_Xt(y_t)

X t-1 t-=l

ここで、！， …，て"）は状態系列、は t =lで状態 iである確率である。このモデノレでは、 x_te{l，2 J，J + 1}であって、 x_T+1=J + l は; ft 状態であるとしている。最終状態では、そこへの遷移のみ起こり、そこではべクトルの発生はないものとする。

HMMには大きく分けて連顧と離 βがある。連顧は ω i (y)は確率密度関数等の yの連続関数であつて、 y tの発生度合は y = y_tのときの o) i(y)の値として与えられる。状態 i毎に o> i(y)を規定するパラメータが^されており、 y_t を o> i(y)に代入することによって、状態 iでの y_tの発生度合が計算される。例

¾替え用 ¾ (規則 26) えば、 ω i (y)を多次元の正規分布で与えるものとすれば、

(数 2)

ω i

y； β i ,∑ i)

であって、状態 iで規定される ttfia関数のパラメータは iと∑ iである。

離觀は、べクトル量子化により y _tが変換されるべきラベル me {1,2,..., M}の発生確率 b i _mが状態 i毎にテーブルとして記憶されており、状態 iでの y【の発合は、 y_tの変換されたラベルが mであるときは、 b_imとするものである。ベクトル量子化はコードブックを用いて行われる。コードブックは、そのサイズを Mとするとき、学習サンプルとして集められた特徴べクトルを 1， 2，…，M のクラスタにクラスタリングし、クラスタ m (=1 , 2,...,M) の代表べクトル

(平均ベクトル、セントロイド、コードべクトノとも呼ばれる） x_mをラベノレ m で職可能な形で記憶したものである。クラスタリング法としては L. B.G.アルゴリズムと呼ばれる方法がよく知られている。 y _tのべクトル量子化はそれに最も近いセントロイドのラベルに y_tを変換することによって行われる。従って、 y_t の状態 iにおける発生度合は、数式的には

(数 3)

o> i(y t) [d y t， z m)]

で与えられる。 d(y _t，Atm)は y _tと mとの距離であって、ユークリッド距離を始めとして種々のものが考えられる。

図 3は、離 βΗΜΜを用いた音識装置のブロック図である。 301は特徴抽出部であって、入力音声信号をフィルタパンク、フーリエ変換、 LPC分析等の周知の方法により、一定時間間隔（フレームと呼ぶ）例えば 10msec毎に特

差替え用紙（規則 26) 徴べクトルに変換する。従って、入力音声信号は特徴べクトルの系列

y ₂，' ' '，y_T)に変換される。 Tはフレーム数である。 3 0 2はコードブックと呼ばれるもので、ラベルにより可能な形で各ラベルに対応した代表べクトルを保持している。 3 0 3はベクトル量子化部であって、前記ベクトル系列 Yのそれぞれのべクトルをそれに最も近い、前記コードブックに登録されている代表べクトルに対応するラベルに置き換える（符号化する）ものである。 3 0 4はパラメータ推定部であって、学習サンプルから認識語彙たる各単語に対応する HMMのパラメータを推定するものである。即ち、単語 rに対応する HMMを作るには、先ず、 HMMの構造（状態数やその遷移規則）を適当に定め、然る後に単語 rを多数回発声して得られたラベル系列から、それらラベル系列の発生度合が出来るだけ高くなるように、 lirtaモデルにおける状態遷移確率や状態に伴って発生するラベルの発生確率を求めるものである。 3 0 5は HMM記憶部であって、このようにして得られた HMMを各単語毎に記 HI"るものである。 3 0 6は尤度計算部であって、認識すべき未知入力音声のラベル系列に対し、 ΙίίΙΒΗΜΜ記憶部 3 0 5に記憶されているそれぞれのモデルの前記ラベル系列に対する尤度を計算するものである。 3 0 7は判定部であって尤度計算部 3 0 6で得られた unaそれぞれのモデルの尤度の最大値を与えるモデルに対応する単語を認識結果として判定するものである。図 3において、破線は HMM作成時の信号の流れを示すものである。

連 ΗΜΜは、各状態における観測べクトルの発^ S合はそこに定義された確率密度関数によって与えられ、離 tfcMより精度は高いが多量の計算を必要とすると言う問題がある。一方、離 t^HMMは、観測ラベル系列に対するモデルの尤度の計算において、各状態でのラベル m (= 1 , · · · ,Μ) の発生確率 b _{i m}はラベ

差替え用紙 (規則 26) ルに関連して予め記憶されている記置から読み出すことで実行できるから計算量が非常に少ないと言う利点があるが、量子化に伴う誤差のため、認»度が連より悪くなると言う欠点がある。これを避けるためにはラベル数 Mを多くする（コードブックサイズを大きくする）必要があるが、その増加に伴ってモデルを学習するために必要となる学習サンプル数が膨大になる。学習サンプル数が不十分なは、 itriEb _{i m}の推定値が頻繁に 0になることがあり、正しい推定が出来なくなる。

この推定誤差は、例えば、次のようなものである。いま、前記認識語彙の中に、

Γ大阪 J と言う単語音声があつたとして、これに対応するモデルを作る場合を考える。多数話者が発声した単語「大阪 J に対応する音声サンプルが特徴べクトル系列に変換され、各々の特徴べクトルが itiiaのようにしてラベルに変換される。このようにして、前記 r大阪」に対する各々の音声サンプルは、それぞれに対応したラベル系列に変換される。得られたラベル系列から、それらラベル系列に対する尤度が最大になるように HMMのパラメータ { a u , b i m} を推定することにより、単語 Γ大阪 j に対応する離散型 HMMが出来上がる。この推定には周知の Baum-Wel ch法等を用いることが出来る。

この;^、単語「大阪 J に対応する学習サンプルのラベル系列の中には、コ一ドブックに存在する全てのラベルが含まれるとは必ずしも言えない。この学習サンプルのラベル系列に現れないラベルの発生確率は「大阪」に対応するモデルにおいては学習の過程で " 0 " と推定される。従って、認識の時に発声される「大阪 J と言う単語音声に対応するラベル系列の中に、たまたま前記「大阪」のモデルの作成に用いたラベル系列には含まれていないラベルが存在する場合（学習サンプル数が少ないときはこのことは十分有り得る）、この認識時に発声された

差替え用紙（規則 26) Γ大阪 J のラベル系列が難学習された Γ大阪 j のモデルから発生する度合は " 0" になってしまう。ところが、このような場合でも、ラベ Λとしては異なっていても、ラベルに変換される前の特徴べクトルの段階ではモデルの学習に用いた音声サンプルとかなり近く、ベクトルの段階で見れば十分 Γ大阪」と認識されてしかるべき場合がある。もともと同じ単語を発声しているのであるからべクトルの段階では似通っているはずであるが、それらのベクトルが、変換されるべきラベルのクラスタの境界付近にある場合は、べクトルの段階では僅かの差でも、全く異なったラベルに変換されてしまうということは十分起こり得る。このようなことが認度に悪影響を及ぼすことは容易に想像がつく。コードプックサイズ Mが大きくなる程、学習サンプル数が少ない程このような問題は頻繁に生じることになる。

この欠点を除去する方法の 1つとしてフアジィべクトル量子化に基づく HMM (FVQ/HMM) がある。中でも電報通信学会技術報告 S P 9 3— 2 7 · ( 1 9 9 3年 6月）にされている相 ^ F VQ/HMMは優れた性能を示すものとして注目に値する。

図 4は F V QZHMMの一般的な原理を説明するプロック図である。同図において破線は HMMの作成時の信号の流れを示す。 4 0 1は特徴抽出部であって、図 3の 3 0 1と同様なものである。 4 0 2はコードプックであって図 3の 3 0 2 と同様のものである。 4 0 3は帰属度算出部であって、 ΙίΤΐΒ特徴べクトルは帰属度べクトルに変換される。帰属度べクトルは、各時点における特徴べクトルの、各クラスタにる帰属度を要素とするべクトルであって、時点 tにおける特徴ベクトルを y _t、！^クラスタを。 ...，。!^ y _tの Cmにる帰属度を u _{t m}とすれば、 y _tは帰属度ベクトル u _t = (u _{t l} , . . .，u _{t M}) ^Tに変換される。以後本願に

え用紙 (規則 26) おいてはべクトルは縦べクトルとし、右肩の Tは転置を表すこととする。 u の錢としては種々考えられるが、例えば

(数 4)

[d(y_t, m)/d(y_t,/in)] ^{2/ (p}一 " と^ ¾でさ o (J. G. Bezdek: 'Pattern Recognition with Fuzzy Objective Function Algorithm", Plenum Press, New York (1981).) 。この式において、 F 〉 1はファジネスと呼ばれるものであって、 (数 5)

(1) F→l → u tm→ δ。 Lo

[d (y t , /i κ)] )

k

(2) F→∞ → u _tm→

M である。ここに、 δ uはクロネッカーのデルタで、 i =jのとき S u=l、 i≠ 3のとき δ u = 0である。 F→lのとき y_tはそれに最も近いセントロイドに対応するクラスタのラベルを o_tとすると、そのクラスタへの帰属度は 1、他のクラスタへの帰属度は 0となるから、これは通常のベクトル量子化となり、 F→∞となると、何れのクラスタに対しても y_tの帰属度は 1ZMで、曖昧性が最大になるということを（数 5) は意味している。他に帰属度の^ ϋとして、ニューラルネット他の手段を用いて y _tに対する Cmの事後確率が算出できるときは、その事後確率とすることが出来る（以後は、 Γ 確率」および「帰属度 j は共に「帰属度」と呼ぶことにする）。

後に述べる理由のために、実際には、 una帰属度 u は、全てのクラスタにつ

Vヽて計算されるものではなく、 d ( y _t， m)が最小のクラスタ力ら K番目に小さヽクラスタ（K-nearest neighbor) について計算される。即ち、前記帰属度べクト

差替え用紙（規則 26) ル u_tを形成する要素は、帰属度の大きい上位 Kのクラスタに関しては（数 4) で計算された値であり、他は 0とされる。 404はパラメータ推定部である。 40 5は HMM記憶部であって、認識すべき単語や音節等の各認識単位に対応した H MMを記旨るものである。 406は尤度計算部であって、 |ίί|2ベクトル量子化部の出力に得られる帰属度べクトル系列から、 tiffs各 ΗΜΜの入力音声に ¾ "る尤度、即ち、！！^特徵べクトルの系列 …，丁が！！匪 r (r = l,..., R) それぞれから発生する度合を計算するものである。 407は判定部であつて、

(数 6)

r '= argmax [L ^r] を計算し、を認難果とするものである。

尤度計算部 406は、認位 rに対応する尤度 L ^rを r = 1， ...， Rにつヽて (数 1) に従って計算するものであるが、前記 o> i(y _t)の定義の仕方によって種々の HMMが ^される。ここで取り上げている相 ^ FVQZHMMは、 ω i (y _t)を原理的には次のように定義したものである。

(数 7)

10g <O i (y t) = _∑ U tm lOg b im

m

乗算形式で書けば ω,(γ t) = IT b im^{U tm}

m

前記のように実際には（数 7) における mに関する加算または乗算は帰属度の上位 Kクラスタのみで行われるものであり、この場合は、（数 7) は（数 8) のよ

. (規則 26) うになる（以後、加算形式で説明する。 )

(数 8)

K

log ω Υ tj= ∑ u t ,h (k) log b i. h (k)

k-l

ただし、 h(k)は y_tが k番目に帰属度の高いクラスタ名である。帰属度を（数 4) で錢するときは、小さい順に k番目までの d(y_t,/z_m)に関して（数 4) を計算すれヽ。この；^^、 u t ,h in H hut,h (K) = l、 u t , h (κ+1) =· · · = u _h となる。（数 8) のように（数 7) における加算は帰属度の上位 K クラスタのみで行われるのは、計算量の削減も勿論であるが次のような理由にもよる。

FVQ型が離 βに比べて高い認識率を示すのは、バラメータ推定時における学習サンプルの補完効果のためである。この補完効果は例えば次のような形で効いて来る。例えば、クラスタ Αとクラスタ Βが状態 iで発生する確率を学習サンプルから推定する場合を考える。離霞の場合は、量子化されるべきべクトルはいかに Bに近くてもその境界より少しでも A側にあれば Aに類別され、少しでも B側にあれば Bに^^される。従って、団としては A, Bが同じ位の割合で含まれていても、学習サンプルでは偏りがあって、特に A, Bの境界付近のべクトルでたまたま Aに含まれるものが多かったために、 Aの生じる確率が Bの生じる確率よりも大きく推定されてしまうと言うようなことが起こり得る。コードブックサイズにる学習データ数が小さいとこのような学習データの偏りが起こり易くなり、学習サンプルと評価データが独立である場合は、この偏りは評価データの傾向とは必ずしも一致しな、から認識率は悪くなる。

—方、 FVQ型の場合は、ベクトルの帰属度に応じて Aばかりでなく Bも発生

差替え用紙（規則 26) しているとしてそれらの出現確率を計算することになるから、上のような学習サンプルに対しては、 Aの発生確率の方が高く推定されるにしても、 Bの発生確率もその帰属度に応じて推定されることになり、離 βほどには極端な推定誤差は生じない。これは、 FVQ型とすることにより学習サンプルに対して補完が行われる、言い換えれば近似的に学習サンプルを増やしていると言える。このことが、特にコ一ドプックサイズの大きいところで F V Q型の認識率が離 βの認識率を上回る理由である。

ところが、 FVQ型は学習サンプル数の不足を補完すると言っても、これは飽くまで与えられた学習サンプルそのものから見かけ上近似的に学習サンプル数を増やすと言うことであって、実際の学習サンプル数を増やすと言うこととは些か異なる。従って、コードプックサイズが小さくなつて各クラスタにる学習サンプル数が相対的に増加し、 b _{i m}の推定精度が十分に上がって来ると、補完の仕方によっては、下手に補完をするよりも補完をしない離散型の方が F VQ型よりも認識率が高くなる、もしくは同程度になるということは十分有り得る。

この補完の程度は、コードブックサイズゃフアジイネスと共に Kの値如何によつて影響を受ける。 K= lに近づくにつれて、即ち、離画に近づくにつれて補完の影響は小さくなり、 Κが増加するにつれて補完の影響は大きくなる。従って、フアジイネスを固定したとき、 Κによつて補完の程度をコントロールすることが出来る。即ち、 Κは無闇に大きくすることはかえつて良くなく、離匿にる、 F V Q型による認識率の改善量を最大にすると言う意味で、コ一ドプックサイズに応じて Kには値 K。が存在する。実験によれば、不特定話者による 1 0 0都市名の認識にお Vヽて、コ一ドブックサイズ 2 5 6に対しては K = 6が最適値、コ一ドブックサイズ 1 6に対しては K = 3が最適値であった。

差替え ffi紙（規則 26) このように、 FVQ型は、離觀に比べれば、認識時に（数 8) を計算する必要があるから K回の帰属度の計算と K回の積和演算が増加するが、認識率は離散型より向上し、 ¾βの場合と同等以上となり、連 βの場合に比べて計算量はかなり減る。

(数 1) を計算する方法として Forward-Backward法と呼ばれる方法が用いられるが、計算量の肖 U減のため（数 1) の近似解として Xに関する最大値を計算する Viterbi法がよく用いられ、対数化して加算の形で用いられるのが普通である。即ち、

(数 9)

L'= max [log _Χι+∑ log a x_t¾t+1+∑ log a>x_t (y t)]

x t t

を計算し、じを尤度とする。（数 9) は動的計画法によって効率的に計算することができる。即ち、じは

(数 10)

Φ ί)= max i ( t— 1 ) +log au+log ω j (y t-i)] を（l)=log _πίとして、 t = 2 Tについて漸化的に計算し、

(数 11)

L'= max [ （T+l)] として求められる。これを Viterbi法という。認果としては Lを用いても L ' を用いても大差がないということから、モデルの作成においては Bauffl-Welch法

(Forward-Backward法）を用い、認識においては Viterbi法を用いることがよく行われる。相 «FVQZHMMの場合、認識において Viterbi法を用いる場合は、 b imは lOg b imの形でし力用いないから、 b imをそのまま記像するのではなく、

Π'· r ' log b_imを記憶しておけば、（数 7) あるいは（数 8) の計算は、対数演算は不要で積和のみで実行できる。

次に DPマッチングについて説明する。最も基本的には特徴べクトル列同士のパターンマッチングによる方法がある。図 5はその例である。 51は特徴抽出部であって、図 3の 301と同様のものである。 53は標ヽ。ターン記憶部であって、単語に対応した標^、 ^βターンが記憶されている。この標^、 ^βターンは、認識すべき単語に対応して、特徴抽出部 51で特徴べクトル系列に変換されたものとして標ターン記憶部に予め登録されるものである。図 5における,はこの登録のとき用いられる接続を示すものであり、認識時には、この部分の示^続は解除される。 52はパターンマッチング部であって、標^、。ターン記憶部 53に記憶されているそれぞれの標¾ ^ターンと入力パターンとのマツチング計算を行い、入力パターンとそれぞれの標¾^ ^ターンとの距離（または類似度）を計算する。 54は判定部であって、 Ιϋ|2入力パターンとそれぞれの標準パターンとの距離（または類似度）の最小値（最大値）を与える標、°ターンに対応する単語を見出す。

もう少し具体的に説明すれば次のようになる。本例では、パターン間の「距離」を求めるとして説明する。（「類似度」に基づく;^は「距離 j を「類似度 j に、「最小値」を「駄値 j に置き換えれば良い)。いま、特徴抽出部 51において時点 tに出力される特徴ベクトルを y_t、その系列たる入力パターンを Y= (yi, y₂, ·.., y_T) 、単語 rに対応する標準パターンを

(数 12)

Y^(r)=(y ^(r) ₂, ···, y ^(Γ) _; (Γ) )

差替え用紙（規則 26) とし、 Yの Y(^r)に财る距離を D (^r)、 3^ととの距離を(1 ) (1: , ₁))とするとき（ただし、乗算形式で表すときはそれぞれを D ₂ w、 d ₂ ( ( t， j )、加算形式で表すときは ^(r)、 d '^tj)とする）、

(数 13)

X*= argmin [∑ w(x (k)) d！ ^(r (x (k))] (a)

Di ^(r) =∑ w(x*(k)) d ! ^(r) (x*(k))

k

または

X*= argmin [II d₂ ^(r) (x(k))^{w (x (k) }} ] D₂ ^(r) =∑ d₂ ^(r) (x*(k))^w *^(k))

k

ただし、

X=(x(l),x(2) x(K)),

X*=(x*(l),x*(2), ·.·， x*(K))

を計算し、

(数 14)

r*=argmin [Di ^(r> / 2： w(x*(k))]

r k

または r *=argmin [(D₂ ^(r) ) ^{w {w} * ") +· · '^{+w (K)))}] を認果とする。ただし、（数 13) において x(k) = (t (k)， j (k))は格子グラフ（t,j) における Yと Y^(r)とのマッチング上の第 k番の格子点で

差替え用紙（規則 26) あり、 w ( x ( k ) )は格子点 x ( k )における ItrlB距離に重み付けられる重み係数である。

以後、乗算形式でも加算形式でも並行的な議論が成り立ち、必要とあれば乗算形式の表現に変換するのは容易であり（ (') (1;,3)=1(^ d₂(^r) (t,j)、 Di ^(r) =log D₂ ⁽ 等）、加算形式で用いられるのが一般的であるから、ここでは主として加算形式で説明することにし（従って、添え字 1, 2は省略）、必要に応じて乗算形式も表記する。

（1^)から（1^)までの点列（1^)，'''，（1^₂)を (1^，1^₂)とし、 x(K) = (t (K), j (K)) = (T, J)とすれば、（数 13 ) の意味は、点列 X ( 1， K)に沿つて対応付けられる、入力パターン Yと標、°ターン Y ）それぞれの特徴べクトル間の重み付き距離の累積の、 X(l，K)に関する最小値を Yと Y ^(r)の距離 D ^(r) とすると言うことである。（数 13) の計算は、重み係数 w(x(k))をうまく選ベば動的計面法 (Dynamic Programming)を用いて効率的に実行することが出来、 D Pマッチングと呼ばれる。

DPが行えるためには最適性の原理が成り立つ必要がある。即ち、 Γ¾5Ι方策の部分方策はその部分方策でまた: ¾ 方策である」と言うことが言えなければならない。これが言えれば、

(数 15)

k

"x(k))= min [∑ w(x(n)) d ^(r) (x(n))]

x (1) .. . x (k) n-1 に対して、

(数 16)

^(x(k))= min (x (k - 1 )) +w (x (k)) d ^(r) (x(k))]

x (k-1)

差替え ffi ¾ (規則 26) なる漸化式が成り立ち、計算量が大幅に削減されることになる。

点 x(l)から、点 p。=x(k)までの方策は、点列 X(l , k) = (x(l) （1 = 0。）に沿ぅ重み付き累積距離を ₀， (1，1 )とするとき、（ p₀,X(l，k))を最小にする点列 (髓点列)を見出すことである。この髓点列を X*(l , k) = (x*(l)，...，x*(k— l),x*(k) = p₀;^ L、 ^ '(po,X*(l , k))を（Po)とすれば、 lifiaftM性の原理が成り立つと言うことは、点 x(l)から点 x*(k— 1)までの； ¾1点列は、点列 X*(l , k)上の、点 x*(l)から点 X*

(k一 1)までの点列に一¾rrるということである。言い換えれば、 χ(ι)を始端、 x(k— 1)を終端とする点列の中で、 (x(k— l))+w(p。）d ^(r) (po)が最小になる点列を *(1，ー1)= *(1) ,... , * ー1))とするとき、 X (1)から x(k) = p。までの； ¾Μ列における x(k— 1)までの点列は、 Χ*(1 , k一 1)に一 ¾T る。故に、種々の x(l)を始端とし、種々の x(k— 1)を終端とする ¾1点列が、従って種々の X (k— 1 )について（X (k— 1 ))が既知であれば、種々の X ( 1 )から特定の X ( k ) = p 0までの *51点列とそれに沿う重み付き累積距離は（数 1 6) によって計算できる。即ち、点 x(l)から点 x(k)迄の重み付き最小累積距離 4 (x(k))は、重み付き最小累積距離^) (x(k— 1))を用いてその続きとして（数 1 6) に従って求められると言うことであって、 X (l))=w(x(l)) d ^(r (x(l))を初期値として D ^w=4(x(K))が漸ィ匕的に求められるカゝら、全ての許される径路における累積距離を総当たりで計算するよりははるカゝに少な、計算量で重み付き最小累積距離が求められる。

ここで、（数 1 6) を成立させることが出来る重み係数の例として

(数 1 7)

差替え用紙（規則 26) (1) 正 »l≤n<kに対して

∑ w(x(k-p + l))= t (k)- t (k-n)

P- 1

(2) 正 »:l≤n<kに対して

∑ w(x(k-p+ 1))= j (k)一 j (k-n)

(3) 正整数 l≤n<kに対して

∑ w(x(k-p+l))= t (k)-t (k-n)

+ j (k)-j (k-n)

等の何れかを満足する場合が考えられる。即ち、重み係数を（数 17) 等とすれば、； M性の原理が成立し、動的計画法が適用できる。（1) は重み係数の総和が入力パターンの長さ（フレーム数）に等しくなる場合、（2) は重み係数の総和が標準パターンの長さに等しくなる場合、（3) は重み係数の総和が入力パタ —ンと標^、。ターンの長さの和に等しくなる場合である。

(数 17) の式（1) を用いれば、（数 16) の漸化式の具体例の 1つとして (数 18) が考えられる。

(数 18)

( t , 3 + d ^(r) (t , j)

ただし 4(l, l) = d w (l，l)

替え用 ¾ (規則 26) D^(r)=^(x(K)) = ^(I,J

(数 18) を t = l,...，T, j =1,···， Jについて逐次計算することによって (数 13) 即ち D^(r)を計算することが出来る。この^ 1ま x(k)につながり得る «は、図 6のように拘束していることになる。即ち、点（t，j) に至る径路は、点（t— 2,j—l) →点 (t-1, j)→点 ( t , j ) 、点（t— 1， j—1) → 点（t, j) 、点（t— l，j—l) →点 (t, j) の 3通りの何れかのみを通るものであって、上の数値はそれぞれのが選ばれたときの重み係数を示す。この場合は、 w(x(l)) + '"+w(x(K))は入力フレーム数 Tに等しくなる。従つて、この場合は（数 14) の^ は標^、ターンと関係なく一定になるので、入力パターンがどの標^、。ターンに最も近いかを計算する場合は、 w(x(l)) + '"+ 0 )で正規化するはなぃ。この場合、 d (^r)(t，j)としては、ュークリッド距離またはより簡匕されたものとして市街地距離等がよく用いられる。

|ίΠ2マッチング計算において最も計算量が多いのは、特徴べクトル間の距離計算あるいは類似度計算である。特に単語数が多くなって来るとこの計算量がそれに比例して多くなり応答に時間がかかり、実用上問題となって来る。これを減らすために考え出されたものにベタトル量子化を用いるいわゆる "SPL I Τ法" がある (SPL IT: Word Recognition system Using strings oi Phoneme- Like Templates) ₀ (菅村、古井 "擬音韻標準パタンによる大語彙単語音声認識 "，信学論（D) , J65-D, 8, pp.1041-1048 (昭 57-08)。）

図 7はその従来例を示すブロック図である。特徴抽出部 71は図 3のものと同様である。 73はコードブックであって、 M個のラベル付けされた代表ベクトルがラベルによって可能な形で記憶されている。 74はべクトル量子化部であ

差替え用紙（規則 26) つて、特徴抽出部 7 1の出力特徵ぺクトル y _tをコードプック 73を用いて y に最も近いセントロイドを持つクラスタのラベルに変換するものである。 7 7は単語辞書であって、認識すベき単語音声の標準パタ一ンが上記の tlき操作によつてラベル系列に変換されたものとして記憶されている。このラベルは別名擬音韻とも呼ばれる。標¾ ^ターンたる単語 rの第 k番フレームの擬音韻を s とすれば、同図に示すような形で認識すべき単語が擬音韻列の形で登録される。 J ^(r) は単語 rの標準パターンの最終フレーム（従ってフレーム数）である。同図における¾¾は認 ^語の登録動作の時にのみ用いられる接続を示す。 7 2は距離行列算出部であって、特徴抽出部 7 1のそれぞれの出力べクトルの、それぞれのクラスタのセントロイドにる距離を求め、それら距離を要素とするべクトルに変換し、特徴べクトル系列を距離べクトル系列即ち距離行列に変換する。例えば、距離行列は 75に示すようなもので、フレーム tの特徴ベクトル y _tの、クラスタ

Cmのセントロイド Amとの距離 d (y _t，/im) (図 7では d TMと表記されている）を要素とする距離ベクトル（(1( /^)、 d (y _t,/x ₂),... , d (y , , /_iM)) ^τに y _t は変換される。距離は例えば市街: 離を用いる場合は

(数 1 9)

k

とできる。ここに、 y "はベクトル y _tの第 k要素、 /xm> ¾C_mのセントロイドべクトル/ x_mの第 k要素である。 76はマッチング部であって距離行列算出部 6 2の出力たる距離行列と単語辞書のそれぞれの単語とのマッチングをとり、その間の距離を計算するものである。具体的には、 s w i = C_mとするとき、 y _tと s ( との距離(1 ") ，: を

曰え用〈^! 26) (数 20)

d ^(r) (t, j) = d(y_t,/x_m)

として、（数 18) を計算することになる。即ち、図 7は図 5の «例における d ^(r) (t, j )の代わりに、距離行列を参照することによって前以て計算されている d (y _t , _m)を用いる点が異なるのみであって全く同様に D Pを用いて計算できる。 78は判定部であって、（数 14) を計算し、最終的に認識結果を得るものである。この^、（数 14) の:^ は図 1の;^と同じ値を持ち、図 5の実施例で説明したことと同じ理由で w(x(l)) + '*'+w(x(K))=Tであるからこれで正規化する必要はない。

図 5の«例の; ^は、 y _tと y w；の距 »算は認 ^語数が増えるとそれにともなって増加するが、図 7の例の場合は、距離行列 75をー且計算してしまえば、 y_tと擬との距離は距離行列 75を参照するのみでよいので、単語がいくら增えても d ^(r) (t, j )の計算量は不変である。

例えば、 1単語平均 50フレーム、特徴べクトルを 10次元として 100単語を認識する場合を考えてみれば、図 5の場合、 y_tと距算を行うべき標、。タ一ンべクトルの数は 50X 100 = 5000のオーダーであり、距離をユークリッド距離とすればかけ算の回数はこれを 10倍して 50000回となる。図 7の場合は、 y _tと距 ^算を行うのは、コードブックの各セントロイドベクトルのそれぞれとであるから、クラスタ数を M-256とすれば、認語数に関わりなく 256回の距算で済み、力け算の回数は 2560となり、後者は前者の約 1/20で済むと言うことになる。

なお、ここでは、入力特徴べクトル系列は距離マトリクスに変換されるとして説明したが、実際には、距離ベクトル（d_tl, …， d_tM)^Tは標準パターンの擬音

差替え用紙（規則 26) 韻 s ") j (r = l, …， R ; j =l, ···, J )) それぞれとの一通りの照合が終わると不要になるから、入力のフレーム毎に距離べクトルの算出と累積距離の漸化式の計算を全ての標^、。ターンに対して行えば、（1(3^,/^)はマトリクスとして記情する必要はなく、例えば（数 18) を用いる場合は、現フレームと直前のフレームの 2フレーム分についての距離べクトルを記億しておけば良く、記憶量は実際にはもつと少なくなる。

liffSFVQZHMMは、連纖 HMMと同等の認識率を示し、計算量は連続型に比べればはるかに少ないが、ヮードスポッティングを行う場合は、

a>i(y の^を lir|2F V Q/HMMと同じにすると言うわけには行かな V、。また、 IlESPL I T法は、スぺクトルを直接マッチングする方法に比べれば格段に少な V、計算量ですむが、認,度に劣化をきたす問題がある。発明の開示

本願の第 1の発明はこの問題点を解決したものである。第 2の発明は前記 S P L I T法の改良に関するものであり、前記 FVQの考え方を DPマッチングに適用することである。第 3の発明は、 lif!SHMMおよび DPにおける記憶量、計算量の削減に関するものである。第 4の発明は、特に前記 HMMにおいて、認識時における計算量をさらに削減するものである。

(1) 第 1の発明は、解析の対象とするシステムは複数の状態をとるとし、特徴べクトル空間をクラスタリングし、それぞれのクラスタの代 ^クトルがそのラベルで^^可能な形で記億されたコードブックと、各状態における各ラベルの発生確率（従って各クラスタの発生確率）を記像するクラスタ発生確率記憶手段と、前記コードブックを用いて観測ベクトルの各クラスタへの帰属度（前

差替え用 ¾\ v !]26) 記各クラスタの該観測べクトルに¾*1 "る事後確率）を算出する帰属度算出手段と、該算出された各クラスタへの itna観測べクトルの帰属度の対数値と ΐίίΐΒクラスタ発生確率記億手段に記憶されている各クラスタの発生確率との積和またはそれに等価な量を算出し、観測べクトルの前記システムの各状態における発生度合とする観測べクトル発生度合算出手段とを含む。

(2) 第 2の発明は、特徴ベクトル空間をクラスタリングし、それぞれのクラスタの代クトルがそのラベルで ^^可能な形で記憶されたコードブックと、観測べクトルの ΐίη½·クラスタへの帰属度あるいは itna各クラスタの lifia観測べクトルにる確率（両方含めて以後帰属度と呼ぶことにする）を算出し、前記観測べクトルの各クラスタにる帰属度を要素とする帰属度べクトルを算出する帰属度算出手段と、帰属度べクトルで表現した標^、。ターンを記憶する標準パターン記憶手段と、 ΙίίΙΒ帰属度算出手段の出力として得られる前記観測べクトルから変換された帰属度べクトルからなる入力パターンと ttfia標準パターンとのマッチングを行うマツチング手段を含む。

(3) 第 3の発明は、特徴ベクトル空間をクラスタリングし、それぞれのクラスタの代表べクトルがそのラベルで髓可能な形で記億されたコードブックと、 H MMの状態 iにおけるクラスタ mの発生確率または DPマッチングにおける標準パターンべクトルの第 iフレームの特徴べクトルのクラスタ mへの帰属度を b 、クラスタ数を Mとするとき、 b ,·.·, b _iMの中から大きさの順にとつた N個 b i. _{e (i}. i) ,b i. _e (i. 2) ,...,b i. _{e (i}. M) (g(i ,n)は n番目に大きいクラスタのラベル）はそのままの値またはそれぞれの対数値 log b _K <i. i) ,

log b i. g (i. 2) , ... , log b _e (" N)の形で記憶し、残りの bし _e N+i) ，·· ·， b « _(i. M)は一定値を記 m "るクラスタ発生確率記億手段または帰属度標タ

差替え用紙規 26 ーン記憶手段を含む。

(4) 第 4の発明は、特徴ベクトル空間をクラスタリングし、それぞれのクラスタの代表べクトルがそのラベルで ^^可能な形で記憶されたコードブックと、各状態における ile各ラベルの発生確率（従って各クラスタの発生確率）を記憶するクラスタ発生確率記億手段と、 tinsコードプックを用いて観測べクトルの t&IB 各クラスタへの帰属度（line各クラスタの該観測ベクトルに m "る確率）を算出する帰属度算出手段と、該算出された各クラスタへの ΙίΠΒ観測べクトルの帰属度と、 ΙίίΙΒクラスタ発生確率記憶手段に記憶されている各クラスタの発生確率の対数値との積和またはそれに等価な量を算出し、観測べクトルの前記システムの各状態における発生度合を算出する観測べクトル発生度合算出手段とを含み、 tifiB各状態における line各クラスタの発生確率の推定は、 tins観測べクトル発生度合算出手段を用いて計算し、認識時は、 tins観測べクトルの帰属度を、最大の帰属度は 1とし、他の帰属度はすべて 0になるように算出する手段を含む。

本願発明の作用を次ぎに説明する。

( 1) 第 1の発明では、 »の対象とするシステムは複数の状態をとるとし、特徴べクトル空間をクラスタリングし、それぞれのクラスタの代表べクトルがそのラベルで ^^可能な形で記憶されたコ一ドブックを備え、クラスタ発生確率記憶手段によって各状態における ttna各ラベルの発生確率（従って各クラスタの発生確率）を記憶しておき、帰属度算出手段によって、 ttiiaコードプックを用いて観測べクトルの lirfB各クラスタへの帰属度（ttria各クラスタの該観測べクトルに対する確率）を算出し、該算出された各クラスタへの前記観測ベクトルの帰属度の対数値と liflBクラスタ発生確率記憶手段に記憶されている各クラスタの発生確率との積和またはそれに等価な量を観測べクトル発生度合算出手段により算

差替え用抵（規則 2( · 出し、前記観測べクトルの前記システムの各状態における発生度合を算出する。

(2)第 2の発明では、特徴抽出手段により入力信号を特徴ベクトルの系列に変換し、帰属度算出手段により、 ΙίΠΒべクトル系列の^ クトルを、クラスタ記憶手段に記憶されている該べクトルが分類されるべき各クラスタへの帰属度を算出し、標ターン記憶手段により、 Itfiaべクトルの各クラスタに対する帰属度を要素とする帰属度べクトルを算出し、認識すべき各認位をそれぞれ帰属度ベクトル列で表現した標 ^ターン記憶し、マッチング手段により、前記帰属度算出手段の出力として得られる帰属度べクトル列からなる入力パターンと前記標 ¾ ?ターンとのマッチングを行うものである。

(3) 第 3の発明では、 HMMは、クラスタ発生確率記憶手段を備え、クラスタ発生確率記憶手段は、状態 iにおけるクラスタ mの発生確率を b i _m、クラスタ数を Mとするとき、 b

ら大きさの順にとつた R個 b i. _{e (i}, i)， b i. « (i. 2) b i.. (i. R) (g(i， r)は r番目に大きいクラスタのラベル）はそのままの値またはそれぞれの対数値 log b i. _κ (,. i)， log b i. , _{( i}. 2) , · · ·， log b i. _e (i. R)の形で記憶し、残りの b i. s R+i) , b i. , (i. )は—定値を記憶し、特徴抽出手段は、入力信号を特徴ベクトルの系列に変換し、クラスタ記憶手段は、 ΙίΠΒベクトルが分類されるべきクラスタを記憶し、帰属度算出手段は、 una特徴べクトル系列の各べクトルの前記各クラスタへの帰属度を算出し、特徴べクトル発生手段は、 tiflS特徴べクトルの各クラスタにる該帰属度と ΙΙΒΗ

MMの各状態における itiia各クラスタの発生確率とから itnaHMMの各状態における ΙΐίΐΒ特徴べクトルの発生度合を算出し、べクトル系列発生度合算出手段は、 ttflS特徴べクトノレ発生度合算出手段の出力を用 ^、て tiflaHMMから tiilB特徴べクトル系列の発生する度合を算出し、 tifia特徴ベクトル発生度合算出手段は、 t

差替え—用紙（規則 26) 帰属度の上位 K個のクラスタとそれぞれに対応する請求項 1記載のクラスタの発生確率とから |ίί|2ΗΜΜの各状態における ItflB特徴べクトルの発生度合を算出する。

(4) 第 4の発明では、特徴ベクトル空間をクラスタリングし、それぞれのクラスタの代表べクトルがそのラベルで; ^可能な形で記憶されたコードブックを備え、クラスタ発生確率記憶手段は、各状態における ¾|3各ラベルの発生確率 (従って各クラスタの発生確率）を記憶し、帰属度算出手段によって、前記コードブックを用いて観測べクトルの ΙίΠΒ各クラスタへの帰属度（¾ΐΠ2各クラスタの該観測べクトルに対する事後確率）を算出し、観測べクトル発生度合算出手段は、該算出された各クラスタへの ΙίίΐΒ観測べクトルの帰属度と、 ΙίΤΐΒクラスタ発生確率記憶手段に記憶されている各クラスタの発生確率の対数値との積和またはそれに等価な量を算出し、前記観測べクトルの前記システムの各状態における発生度合を算出し、 tiria各状態における iiia各クラスタの発生確率の推定は、前記観測ぺクトル発生度合算出手段を用いて計算し、認識時は、 una観測べクトルの帰属度を、最大の帰属度は 1とし、他の帰属度はすべて 0になるように算出する。図面の簡単な説明

図 1は、 HMMの説明図である。

図 2は、音声認識の際によく用いられる HMMの例示図である。

図 3は、離 βΗΜΜによる音識装置の従来例を示すプロック図である。図 4は、フアジィべクトル量子化に基づく ΗΜΜによる音声認識装置の従来例および本願発明の一実施例を示すプロック図である。

図 5は、パターンマッチングによる音声認識装置の ¾έ¾例のプロック図である。

差替え ¾ 紙（規則 26) 図 6は、入力パターン軸依 «の0 Pマッチングのマツチング径路の拘束条件の一例を示す説明図である。

図 7は、べクトル量子ィ匕を用いた音^:識装置の例を^ Tブロック図である。

図 8は、ワードスポッティングの一つの方法の説明図である。

図 9は、フアジィべクトル量子化に基づく本願発明による D Pマッチングによる音声認識装置の一実施例を示すプロック図である。

図 1 0は、入力パターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 1は、入力パターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 2は、入力パターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 3は、入力パターン軸依^^の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 4は、入力パターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。 .

図 1 5は、標準パターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 6は、標準パターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 7は、標^^ターン軸依存型の D Pマッチングのマッチング径路の拘束条件の一例を示す説明図である。

差替え図 1 8は、標^ ターン軸依存型の DPマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 1 9は、標準パターン軸依存型の DPマッチングのマッチング径路の拘束条件の一例を示す説明図である。

図 20は、よく用いられる標準パターン軸依存型の D Pマッチングのマッチング鶴の拘棘件の一例を示す説明図である。

図 2 1は、本願発明による HMMにおける各状態におけるクラスタの発生確率、または、本願発明による DPマッチングにおける標準パターンにおける特徴べクトルのクラスタに対する帰属度の記憶方法を説明する説明図である。

図 22は、本願発明による HMMにおける各状態におけるクラスタの発生確率、または、本願発明による DPマッチングにおける標準パターンにおける特徴べクトルのクラスタに対する帰属度の記憶方法を説明する説明図である。

図 23は、本願発明による HMM、または、本願発明による DPマッチングにおける入力パターンにおける特徴べクトルのクラスタに卜する帰属度の記憶方法を説明する説明図である。

図 24は、本願発明による HMM、または、本願発明による DPマッチングにおける入力パターンにおける特徴べクトルのクラスタに対する帰属度の記憶方法を説明する説明図である。発明を実施するための最良の形態

以下、本発明の実施例について図面を参照して説明する。

(数 7) は分布 u _t= {u ti,... , u _tM} と分布 b i= {b "，·.·， b _iM} の Kull back-Leibler divergence (以後 KLDと略記）から導かれるものである（文献：

差 ^ え ^ ^ (¾¾26) 電 ^報通信学会技術報告 SP 93— 27 (1 993年 6月））。即ち、 u _tの biからの乖離度を D(u_t II bi)とすれば、 KLDは

(数 21)

M U t

D(u _t II b i)= 2： u tm log一 ~~

m一 1 D im で与えられる。これは団 biから u_tの生じ難さ、言い換えれば、状態 iにおける u_tの生じ難さを表すものである。従って、 log 4

II tn)とおけば、 ^ i(y «)は状態 iにおける u _tの生じ易さを表すことになり ω i (y _t)として用いることが出来る。そこで、（数 1) の o) i(y_t)を（y_t)とすれば、

(数 22)

τ τ

=∑ n a t +l ΣΙ (y_t)

X

=∑ χ, U a t +l ITexp[-D(u t II bx_t)]

=∑ 71 TL a t + l

― u

u

x rr n

t = 1 m=l b

T

=∑ TI a t t + l

T

X II U (b im)^{U tI} (U tm)

T X IT IT (U tm) '

'ΐ替え用紙であって、

(数 23)

II II (U tm)" はモデルとは関係なく入力のみで決まる量であるから、入力パターンがどのモデルから発生する可能性が高いかを（数 22) の値によって比較する場合は省略できる。そこで新しく

(数 24)

L(Y )=∑ TI ax_tx_t+1 IT IT (b とすることが出来る。即ち、（数 24) は（数 1) において

(数 25)

M

と^ ¾したことになる。（数 7) はこのようにして導くことができる。これが相乗型 FVQZHMMの原理である。

ところが、このようなことが言えるのは、各 HMMにおいて任意の状態系列 X に対して、入力パターン Yを形成する全てのベクトルは、 1度だけ、しかも必ず 1度は発生するとしているからである。一方、入力パターンがいくつかのモデルの発生するべクトル系列の連結であると考えたとき、何れの部分区間がある特定のモデルから発生する度合が高いかを探索する場合は事情が異なって来る。この場合は、照合しょうとするモデルの状態系列 Xの最初の状態 1を対応させる入力パターンフレームを S(X)、最終の状態 Jを対応させる入力パターンフレームを

替え用紙（規則 26 E(X)とすれば、原理的には

(数 26)

1

Ε は） E (X) E (X)一 S (X) +1

Lx(Y ) = π：

S (X) II a t +1 (y _t)

t-S は） t-S (X) をあらゆる Xについて計算し

(数 27)

X*= argmax [Lx(Y| λ)]

X

を求め、 S (Χ*)〜Ε(Χ*)を求めるべき入力音声パターンの部分区間とすることが出来る。

これをまともに計算するとなると、 E(X)、 S(X)のあらゆる組^:に対して計算することになり、計算量が膨大になる。しかも、この場合は（数 23) は X によって変わるから、それを省略するわけには行かない。そこで、（数 27) の化問題を動的計画法で解くことを考える。フレーム sを始端フレームと仮定して、士 Vの範囲で終端フレーム tを変化させ、入力部分パターン y_s,...， y_tが ΗΜΜλから発生する度合を動的計画法で計算する。この場合は（数 10) ができ、入力パターン（y_s，...， y - _v)，... ，（y_s，...， y _t'_+v)のそれぞれについて発生度合が最大になる *51の状態系列が動的計画法により得られる。即ち、終端フレーム tを適当な範囲で動かし、それぞれの終端の中からさらに: のものを選べば、 sを始端とする ft¾の終端が求められる。終端の範囲は、例えば始端 sに対して照合すべき HMMが発生するべクトル系列の平均長などから予め設

差替え用紙規則 26 定した値が用いら: ^る。この^は、 tが変わる毎に t一 s + 1で正規化する必要がある。 sを変化させ同様な操作を行えば、結局、親の始端終端、即ち、所望の部分区間が求められることになる。この;^、ある sに対して、 tを変化させる毎に（数 10) を計算する必要はない。即ち、図 2のモデルを用いるときは、ある sに対して、入力特徴ベクトルと HMMの状態との対応は、図 8の斜線の範囲に限定され、同斜線內の状態 iに対応する入力フレーム m( i )の範囲は、 (数 28)

t ~~ s

mm ί s + 1— 1 ,— ― (1ー丄ゾ +s一 v} ≥m(i)

J"ー丄

' t ^S (i -l)+s + v

一 J一 1

であって、 m(i + l)の範囲は

(数 29)

一 s

ηιη {s + + s— v} ≤m(i +1)

― s 1. + S + V であり、（数 10) に従えば、（数 29) の範囲に亘る _i+1(m(i + l))は、 (数 28) の m(i)の範囲に亘る（m(i))の続きとして計算される。従って、

0 i =l J + 1のそれぞれにおいて、《^i(m(i))を（数 28) の範囲で計算して行けば、 i =J + lに対して

差替え用紙（規則 26) (数 30)

, min {s + J, ~^S J + s-v} ≤m(J + l) 一 s

J + s + v

一 J一]

の範囲で得られたそれぞれの ^ _J+1 (m( J + 1 ))は、入力パターンの始端フレームが sのときの、終端フレーム 1； '土 Vに m~るそれぞれの照合結果となる。即ち、このようにすれば、一つの始端フレーム sに対して終端フレーム土 Vに対する結果が一度に求められる。しかしこの方法であっても、フレーム毎に始端を変えて、 ria斜線內の範囲について ΙίΠΒ計算を行わねばならず、計算量は甚だ多い。この計算量をさらに減ずるには、始端フレームも動的計画法により自動的に決まるようにすればよい。それには、漸化式（数 10) を次のように変形する。

いま、 … ：に対応する親状態系列を ^+！，…，とする。動的計面法を適用するためには、 X*において入力フレーム m，に対し、 s< m，<tで x -! i , x*_m- = j (j≠ i) であるとすれば、部分パターン y_s" ..,y_m-が対応する A の状態系列は、 X * s， · · ·， X " に一致すると言うことが言えなければならない。即ち、 Φ;(πι')を、状態系列 x*_s,...，x に対して部分パターン y_s，...，y_m.が発生する度合で、そのときの状態 iの区間長（フレーム数）が Z ( i )であって、（1111^

（2( )を状態 iが zフレーム続く度合であるとすると (数 31)

差替え用紙（規則 26) Φ j (πι^,)=Φ i (m'— z ( i )) +Wdilog dur i ( z ( i ))

+w_a ilog a i j + ^ Wb i ^k) ω i ( m' -_z c -ι+κ)

k-l

Ψ』

(m'— z ( i)')+Wdi'log dur i (z ( i)，)

(i) '

+Wa i 'log a■ j + ∑ Wb i (k) ' ω■ (y_m- -zい） ' - i+k) k-=l ただし、 j≠ i

とすれば、

(数 32)

(m') 、 Ψ_ί Cm')

(i) (Ο

Wi+Wdi+Wai+ ∑. Wbi (k) Wi'+Wdi'+Wai'+ ∑ Wb i (k) k-l k-l

であって、 m，<m< tなる mに対して、

であるとき、 (数 33)

ζ =Φ j (m— z ( j ))+Wdilog durj (z ( j ))

ί (j)

+Wailog a j h+ Wb j (k) ω i (y_m-z w-i+k)

k-l

ζ '=¥i (m— z ( j ))+Wdilog durj (z ( j ))

z (j)

+Wajlog a +ム Wbj (k) o>i (y m-z ( -ι+κ)

k-l

た 7"こし、 h≠ j

とおけば、

差替え ^ （規刖 26; (数 34) ζ 、 C

(i) (i)

Wj+Wdj+Waj+∑ Wb j (k) Wi '+Wd j +w_a i + ∑ Wbi (k)

k-l

ただし、

(i)

k-l

(i)

W_i，=W_i，+w_di，+w_ai ^,+∑ Wbi(k)'

k-l

が成り立たねばならない。ここに、 Wi， Wi，， Wdi, wai, w_bi(k), w_{d i}',

Wai', Wbi(k)' (i=l,.., J) 等は状態系列に伴う重み係数、またはその和、 Ψ ΠΙ)は、状態系列 X_S' ". Xn-z W (≠X*_s,...,xVz (i)) に対応して入力部分バターン y _s ' , · · ·， y _m- , ( i )が発生する度合である。 W iは状態系列 X ， · · · ,x z _(i)に沿う重み係数の麟ロ、 Wi，は状態系列 xs' ,...,x_m -,い）'に沿う.重み係数の総口である。ここで、これらの重み係数をうまく選べば、状態系列の如何に関わらず（数 31) 〜（数 34) が常に成立するようにできる。例えば、明らカこ、 Wi=Wi , Wdi =Wd i, Wai =Wa i, Wb i ( 1 ) Ή H

w_bi(z(i)，），=w_bi(l) + '"+w_bi(z (i))になるようにすれば上の条件は満足される。即ち、入力フレーム mで他の状態から状態 iになる状態系列に関し、 mゃ始端フレーム s、点（m, i) までの状態のとり方に関わりなくそこまでの状態系列に沿う重み係数の和が一定になるようにすればよい。具体的な数値としては、 i = 1 ,···， Jについて、 w_di=w_ai=l， w_bi (k)= lZz ( i)とすることができる。以上の議論から、いま、入力フレーム tにおいて状態が jに変化したとすると、

差替え用紙（規則 26) 点（ t , j ) までの最適の部分区間の発生度合は、状態 iに対応する入力の部分区間のフレーム数を zとすれば、次の漸化式から得られる。

(数 35)

Φ i ( t)= max [Φ i ( t— z)+log dur■ ( z) + iog a u

+― ∑ log _{W i}( t-,-ι+κ)] ただし、 j≠ i

Z k-i このとき、（数 35) を満足する i, _Zを i *， z*とし、

(数 36)

を同時に記憶して行けば、次のステップによりヮ一ドスポッティングが行える。

(1) 初期化

ί) = for t =l ,.,.,Τ (πι=1, m≠0\/ i≠ 1)

(2) t = l，...，T+lについて（3) (4) を実行

(3) j =1，···， J +lについて

(数 26) (数 27) を実行

(4) Φ(ί)= ;₊ι(ΐ), B(t) = B_J+1(t-z*)

(5) 部分パターン検出

終端フレーム：

(数 37)

t *= argmax ί ( t)] ― 1

差替え ¾ ¾ (規則 26) 始端フレーム： B(1;*) このようにすれば、（数 35) における Kt)の計算は、各（t,j) について 1回行うだけで済み、 log a> i(y _t - _1+k)の k=l zにわたる加算も zが変わる毎に計算しなくても、 k = 1から z (m)までの和を s (m)とすれば、 z (m)までの和は s (m+l)=s (m)+log ω i (y _t ω )の計算で済むから、計算量は大幅に少なくなる。

ここで、本発明においては、

(数 38) ω i (y t) =— 2^ b im log

m t m

=- ∑ b _im log b in, + ∑ b _im log u tm

m m

とおくものである。このとき、（数 35) に対応して

(数 39)

Φ: ( t)= max [Φ i、 t一 zソ +log du z)+log au

+― { b im lOg U t-i-l+k,m

Z k-l m

m

= max匸 Φ i ( t—： z) +log dur; (z)+log a u

差替え max [Φ ί(ί— z)+log duri(z)+log a >；

+ , ∑ b im log U t-»- 1+ k ,ι

1

—∑ im lOg b im]

m

なる漸化式がされる。図 2のモデルを用いるときは、

(数 40) j ( t ) =max [Φト i ( t— z)+log dun- i(z)+log a j -i. i 1 ¹

H ∑ ^-, b j-l. mlOg U t-z-l + k ,m

Z k-1 m

一 b j-l. m lOg b j-l, m]

m

=max匸 - 1 ( t一 z)+log durj-i(z)

H ∑ ∑ b j -l. mlOg U t-_Z-l + k , Cm]

Z k-l m

∑ b j-i. m log b j -i, m+log a i - 1. j となる。いま、 «状態系列が求められたとして、そのときの状態 iの長さが z(i)*であるとし、簡単のために次のようにおく。

(数 41)

1 (i) *

F ,=log dur, (z )*)H— T ∑ ∑ b i. mlog u _t__{¾ (i)} *__{1 +k} Cm)]

Z (. 1 k-l m

差替え m ¾ (規則 2(3) ∑ b j-i. _m log b j-i. m -flog a j- 1. i

,このとき、次式が成り立つ。

;(ί-ζ(Ι)*) = Φ;-ι(ΐ-ζ (J)*-Z (J-1)*) + FJ-I+GJ

Φ₂"— z (J)* ζ(2)*) = ι(ΐ-ζ(Ι)* z(l)*) + Fi+Gi

辺々総をとれば、

Φ;+ι(ΐ)=Ρι + Ρ₂+··· + Ρ;+Οι+0₂ + ···+0;

であって、

(数 42)

J M J

=∑ ∑ b im lOg b im+∑ lOg a i. i+l

i = 1 m*⁵1 i一 1

である。従って、（数 31) の漸化式を用いるときは、 Φ, _{+ 1}( は、状態系列に関わりなく、右 ®¾終項および右項から 2番目の項の、状態に関する口を含み、これは入力パターンとは関係なく、照合されるモデルが決まれば決まる量であり、この式の最大化問題には無関係な量であるから、入力パターンの最適区間を見出す際には不要である。従って、 wiCyt)としては、次式のように定義し直したものを採用することが出来る。

(数 43)

coi y t) = b i m log u tm

差替え用紙次に本願第 2の発明である前記 FVQの考え方を DPマッチングに適用する方法について説明する。図 9は本発明の原理を示すブロック図である。 9 1、 93 は図 7の 7 1、 73と同様な動作をする。 92は帰属度行列算出部であって、図 7の 72における距離行列算出部に相当するものであるが、本実施例では帰属度行列を算出する。即ち、特徴ベクトル y _tのクラスタ Cmに财る帰属度 u _tm (m

を算出する。帰属度としては、ファジィ理論などで用いられるメンバ一シップ関数等を用いることが出来、この場合も（数 4) 等 liftaFVQZHMMで用いたものと同様のものが用いられる。 95 は単語辞書であって、認識すべき各単語に対応して予め登録された帰属度行列からなる。即ち、第 rの単語の標 ¾p^^eターンは、その発声に対して帰属度行列算出部 92で得られた帰属度行列として魏される。図 9においては、単語 rの標準パターンにおける第 jフレームのクラスタ mに対する帰属度は b ^(r) _imで表している。 96は単語 1 ,...，Rに ¾ ~る帰属度行列である。

このとき、認識時における入力パターンのフレーム tと標準パターン rのフレーム j との類似度は帰属度べクトル u_t = (u_{t l},u_t2"..，u_tM)^ b (^r) i = (b (^r) ，わ（^r) _{j 2},..., b (^r) )^Tの類似度として与えられる。ここで、 u _tm≥0、 U ti + - -- + u

であるから、前記両ベクトルを確率分布ベクトルと見なすことができ（u_tm、ゎ ^を^確率とするときはまさに確率分布そのものである）、 miSHMMの場合と同様に、前記類似度は確率分布間の距離として知られている Kullback-Letbler divergence で与えることが出来る。即ち、分布 (Q I,... , QM) と（P …， PM) との乖離度は

差替え J¾ 紙（規則 25) (数 44)

0 ^ L^ Q m log

P.

で与えられる。これを用いれば、 d (^r) ( t， j )として次の 3つのが可能である《

(数 45)

u

(1) d ^(r) (t, j) =∑ u_tm log

bb ,

b (r)

(2) d ^(r) (t, j) (r)

=∑ b log

u

(r) u (r)

(3) d ,j) = U tm lOg (r) + b (r) b

log

2 b U

(数 45) ( 1 ) は（数 17) ( 1 ) の重み係数を採用したとき有用な距離定義であり、（数 45) (2) は（数 17) (2) の重み係数を採用したとき有用な距離錢であり、（数 45) (3) は距離の鄉性を問題にするとき有用な距離 ^である。勿論、これらのにおいて、加算形式の場合は定数信、乗算形式の^は定^ ^したものを用いることが出来る。

94はマッチング部であって、単語辞書 95に登録されている各単語に対応した帰属度行列のそれぞれと、入力パターンから得られた帰属度行列との D Pマツチングを行うものである。即ち、（数 45) に示されたフレーム間距離 d w (t, j)に基づいて、漸化式（数 18) を計算し、（数 13) (a) で錢される累積距離 D (^r)を計算する。 97は判定部であって、（数 14) を計算し、認識結果を

差替え用紙（規則 26) 得るものである。

このように、照合すべき単語辞書を構成するために発声した特徴べクトル系列の各特徴べクトルを唯一つの擬音韻に置き換えてしまうのではなく、帰属度付きで各フレームに複数個の擬を対応させたので、従来例のもつ量子化誤差の悪影饗を緩和できる。また、前記説明から明らかなように、本願発明においては、これら帰属度の算出、標^、。ターンの各フレームと入カフレームとの距離の算出は、数学的に明確な ^¾に基づいて決められるという特徴がある。

次に本発明のさらなる改良について説明する。

先ず、（数 45) (1) を距離尺度として用いる場合について説明する。

このときは、フレーム間距離は

(数 46)

= U cmlog U tm—∑ U tmlOg b ) jm

m m

であって、これを重み係数を（数 1 7) (1) として（数 1 3) に代入すれば (数 47)

D^(r = min [∑ w(x(k))d ^(r) (x(k))]

x (1) .. . (K) k

= min [∑ w(x (k))∑ u t (k) , mlog u t o . m x (1) ... (K) k m

— S W(X (k)) ∑ U t (k) , mlog b ^<r) j (k) . m] k m

= W(X (k)) ∑ U t (k) . mlOg U t (k) . m

k m

― max [∑ w(x (k)) ∑ u _t (k) , mlog b ^(r) i ) . m] x (1) . .. < ) k m

差替え m紙 (規則 26) となるが、 t (k)一 t(k一 n)=lとなる l≤n≤k— 1が存在し（マッチング飽络において、入力パターンフレームに対する飛び越しはない）、この nに対し、 x(k— n)から x(k)に至る «に沿う重み係数の和が 1、即ち、 w(k— n+1) +w(k— n + 2) + '"+w(k)=lの;^、例えば、図 10〜14のような場合、 (数 47) は

(数 48)

Ό ^ίΓ) =∑ ∑ U tmlog U tm

t m

― max [∑ w(x (k)) ∑ ut M . mlog b ^r) >■ M , _M] x (1) . .. x (K) k m

となる。図 10〜： 14の例は、 x(k) = (t，j), k一 l≥n≥lに対して、図 1 0は、 x(k—l) = (t— l，j) or (t-1 , j— n)；図 11、 14は、 x(k- l) = (t-l , j ) or (t一 l,j—l)、 m=2，...，nに対しては、 x(k— m) =(t一 1 , j一 m)；図 12、 13は、 (k-l) = (t-l , j ),(t-l , j -1) or (t , j - 1),

( t , j— m), x (k-n) = (t-l, j一 n)の場合である。それぞれの図の径路の側に付した数値は、それぞれの場合についての径路に沿う重み係数の一例である。

このとき、（数 48) 右辺の最初の項は、の選ばれ方、標^、。ターンの何れとも独立であって、入力パターンによってのみ決まる量となる。従って、各標 ip^ターンと入力パターンとの比果の大小関係のみを問題にするときは省略できる。そこで、この項を省略し、符号を変えれば、

(数 49)

S ^lr = max [∑ w(x (k)) ·∑ u t ) . mlog b (^r) . m」

x (1) .. . (K) k m

をパターン間の類似度とすることが出来る。この場合入力フレーム tと、標、。

差替え用紙（規則 26) ターン rのフレーム j とのフレーム間類似度を

(数 50)

S ^(r> (t, j )=∑ U tmlOg ^(Γ) im

m とすることが出来る。

ここで、さらに t (k)—t (k—l)=l (マッチング ^^において、入力パターンフレームに対する飛び越しはないと同時に、重複もない… （図 6) あるいは (図 10の場合が該当）とすれば、

(数 51)

S (^r) = max [ u t (k) , miog b ^lr j (k) . m」

x (1) . . . x (K) k m

= max [∑ ∑ u tm log b ^(r) j (_t) . m

j -j (t) t m となる。ただし、 j = j ( t)は t一 i平面におけるマッチング径路を表す関数であって、 t-t (k)、 j = j (k)から kを消去して得られる。図 6の径路を用いる場合は、マッチング部 94は、（数 50) に示されたフレーム間類似度 s ^(r) (t，j)に基づいて、

例えば

(数 52)

f ( t , j ) + s w (t,j)

差替え ^ ¾ (規則 26) ただし ί (l,l)=s ^(r>(l，l)

S ^(r) = f (x(K))=f (I,J ( )

なる漸化式を計算し、（数 51) でされる累積類似度 S ^(r)を計算することになる。判定部 97は

(数 53)

r =argmax [S ^(r' J を計算し、認離果を得る。

t (k)- t (k-n)=lとなる l^n≤k— 1が存在し（マッチング径路において、入力パターンフレームにする飛び越しはない）、この nに対し、 x(k— n)から x(k)に至る鶴に沿う重み係数の和を 1、即ち、 w(k— n+l)+w (k— n + 2) + '"+w(k) = lとする上記方法は、連続単語音声認識等に有用である。即ち、このようにすることによって、発声された入力単語音声パターンに対し、それに最もよく類似する、個々に登録された認語標ターンの ¾31の連結パターンを見出すという問題を、の 2段 D P等を用いて効率的に計算できるからである。ここで提案したフレーム間類似度は、このような場合に、適用できるものであって、簡単な計算で高い認識性能を与えることができるものである。

次に、（数 45) (2) を距離/^として用いる場合について説明する。

このときは、フレーム間距離は

差替え用紙（規則 26) (数 54)

(r) b ( ,

d ^(r) (t , j )=∑ b log

U

(r)

=∑ b ^lr _jm log b (r) ∑ b ^(r> j m log u であって、これを重み係数を（数 17) (2) として（数 13) に代入すれば (数 55)

D ^(r)= min [2： w(x(k))d ^(r) (x(k))]

x (1) . . . x (K) k

= min C∑ w(x(k))：∑ b (^r)』 · _m log b (^r) j _(k) . _m x (1) . . . x (K) k m

—∑ W(x(k)) ∑ b ^<r> i (k) . m lOg U t (k) . m] k m

=∑ w(x(k))∑ b ^ir) i w. m log b ^(r) j (_k) . _m

k m

― max [∑ w(x(k))∑ b ^(r) i (k) . _m log u t ( ) . m] x (1) . . . x (K) k m

となるが、 j (k)- j (k— n)=lとなる l≤n≤k— 1が存在し（マッチングにおいて、標ターンフレームに対する飛び越しはない）、この nに対し、 x(k— n)から x(k)に至る ^j^に沿う重み係数の和が 1、即ち、 w(k— n+1) + ー11 + 2) + '"+ （1 =1の場合、例えば、図 15〜17のような場合、 (数 55) は

(数 56)

Ό ^Μ = Σ ∑ b ^(r) i m log b ^(r) in,

j m

― max [∑ w(k)∑ b ^ir) i (k) . m log u t ) . _m] x (1) . . . x (K) k m

差替え 5 (規^ 26) となる。図 15〜： I 9の例は、 x(k) = (t, j ), k— l≥n≥lに対して、図 1 5は x(k— l) = (t , j一 1) or (t— n, j—1)；図 16、 19は、 x(k- 1)

=(t , j -1) or (t - 1 , j -1), m=2 nに対しては、 x(k— m)=

(t-m, j一 1)；図 17、 18は、 x(k— l) = (t , j一 l),(t一 1 , j— 1) or (t-1 , j ), m=2 n— 1に対しては、 x(k— m) = ( t— m, j ), x

(k一 n) = (t— n, j— 1)の場合である。それぞれの図の径路の側に付した数値は、それぞれの場合についての径路に沿う重み係数の一例である。

このとき、（数 56) 右辺の最初の項は、の選ばれ方、入力パターンの何れの区間とも独立であって、標^、。ターンによってのみ決まる量となる（標^、ターン rに^るこの量を C ^(f)とする）。従って、ある標、。ターンと、入力連続単語音声パターンの種々の区間、あるいは種々の入力パターンとの比較結果の大小関係のみを問題にするときは省略できる。そこでこの項を省略し、符号を変えれば、 .

(数 57)

S ^lr) = max [∑ w(x (k))∑ b ^kr) i M , mlog u t . mj

x (1) . . . (K) k m

をパターン間の類似度とすることが出来る。この場合は入力フレーム tと、標準パターン rのフレーム j とのフレーム問類似度を

(数 58)

s ( （t , j )=：∑ b (^r) i n, log ut_m

m とすることができる。

このフレーム間類似度のを用いて、入力パターンが何れの標準パターンに近いかを判定するときは、（S ^(r)一 C ^(r ) /J ^Cr)を比較し、その最大のものを

差替え用紙（規則 26) 見出すことになる。

ここで、さらに j (k)一 j (k-l)-l ( ツチング鶴において、標 ^ヽ。ターンフレームに ^ "る飛び越しはないと同時に、重複もない… （図 20) ある V' は（図 15の場佘が該当）とすれば、

(数 59)

S ^(r) = max ί∑ 2： b ^(r) i (_k) . n, log u t ₍k> . _m]

x (1) .. . (K) k m

= max C∑ ∑ b ^(r im log u t。） . m]

t (j) i m

j -1. 2, · · ·· J となる。ただし、 t = t(j)は t一 j平面におけるマッチング径路を表す関数であって、 t==t (k), j = j (k)から kを消去して得られる。図 15〜19の径路を用いるは、マッチング部 94は、（数 58) に示されたフレーム間類似度 s w (t,j)に基づいて、

(数 60) f (t-2,j -l)

(t, j) =max f (t-l, j -l) + s ^(r) (t, j) f (t-1, j -2)+s ^(r) (t, j -1) ただし f (l, l)=s ^(r (l, l)

S ^(r)"f (x(K))=f (I , J ^(r))

なる漸化式を計算し、（数 59) で錢される累積類似度 S wを計算することになる。

差替え ¾紙（規則 25) j (k)一 j (k一 n)=lとなる l≤n≤k— 1が存在し（マッチング径路において、標準パターンフレームに対する飛び越しはない）、この nに対し、 x(k— n)から x(k)に至る鶴に沿う重み係数の和を 1、即ち、 w(k— n+l)+w (k一 n + 2) +— +w(k) = lとする上記方法は、単語を連続して発声した連続単語音声の入力パターンから、ある標、。ターンと最もよく整合する部分区間を同定するいわゆるワードスポッティングを行う際に有用である。この場合は、入力パターンの区間の長さに関係なく、比較すべき標^、。ターンを rとすれば、各区間における S wを比較するのみでよい。即ち、このようにすれば、次のステツプによって、ヮードスポッティングの問題を動的計画法を適用して効率的に計算できる。ここで提案したフレーム間類似度は、このような場合に、適用できるものであって、簡単な計算で高い認識性能を与えることができるものである。例えば、図 20の «制！！^件を用いて、ある単語に財るワードスポッティングを行う場合は次のようになる。

(1) 初期化

f (0, j )= f (- 1 , j )=-∞ for i=-l,0, 1,..., J f (0,0) = 0

(2) t = l,,..，T+lについて（3) 〜（6) を実行

(3) f (t,0) =一 «>

(4) f (t,l)=s(t,l)

(5) B(t, l)=t-l

(6) j =2，···，】について次の漸化式を計算

差替え用紙（'規則 26) (数 61) f (t-2, j -l)+s (t, j) ·'·(1)

(. t , j ) =max f (t-1, j -l)+s(t, j) ·'·(2) f (t-1, j -2)+s(t, j - l)+s(t , j)---(3)

B(t-2, j -1) ί (t, j) = (l)のとき

B(t, j)= B(t-1, j -1) ί (t, j) = (2)のとき

B(t-1, j -2) ί (t, j) = (3)のとき

(7) D(t)=f (t, J)_t B(t) = B( ,J)

(8) 部分パターン検出

終端フレーム：

(数 62)

t "= argmax [D( t)]

始端フレーム： B(t*) + 1 次に、第 3の発明である前記 HMMおよび DPにおける記憶量、計算量の削減法について説明する。

基本的な考え方は、メモリ量を削旨る場合は標準パターンの帰属度は上位 N く Mについて記憶し、計算量を削減する場合は入力パターンの帰属度は上位 K<

Μについてのみ計算することに基づいている。この場合、注: べきは、確率分

差替え ^紙（規則 26) 布（p !，…， PM)と確率分布（q ， aw)の類似度を

(数 63)

∑ p ilog a；でするとき、 Pi = 0ョ ie{l，...，M}は有り得るが、（^>0νίΕ{1，··· ，Μ}であり、は 0にはなり得ないということである。従って、（！；の上位！^のみ計算あるいは記憶する場合は、残りの Qiについては、共通の値を (！， + ··· + Q_M==1になるように決め、その値を用いるようにする。従って、この場合に Qi

(i =1 M) に対して必要とされる記憶量は、 Q _{E (1)}，· · ·， Q _{e (N)}については N, q _(N+1) ,···，（！ _{ί (Μ)}については 1である。ただし、 g(n)は、 {en,..., Q_m} のうち、 n番目に大きい ciの添え字である。 0;も上位1^と1(：+1以下に分けて iiと同様に出来る（Kは Nと同じである必要はない）が、こちらは 0になり得るから、 h(k)を {Ρ^.,.,ΡΜ} のうち、 k番目に大きい Dの添え字とすれば、 p h ci) H l~ph(K) = l、 h (κ+1) ^ hph CM) =0とす οこと¹ b出采る。この場合は Pi (i =1 M) に対して必要とされる記憶量は、 p_h (",···,

Ph (K)に対する Κのみである。

ItflB相 FVQZHMMにおける ω ^(r) i(y _t) (ΙίΠΒω i (y _t)や b _im, 等が特に単語 rに関するものであることを明記するときは、右肩に（r) を付して ^rt 、相 FVQZDPにおける s (^r)(t，j)は、何れも（数 63) の形をしており、 lineメモリ量、計算量の肖 ϋ減に関して同じことが言えるから、以後の説明は相 FVQZHMMの場合、即ち、 ω w i(y_t)に対して実施例を説明することにする。この場合、 HMMにおける状態:！を、 DPにおける標、^βターンの第 jフレーム、 HMMの状態 jにおけるクラスタ mの発生確率 b ^(r) を、 DP

差替え用紙（規則 26) マッチングにおける標準パターン rの第 jフレームのクラスタ mに対する帰属度と読み変えれば、 HMMと全く同じ議論が DPマッチングの場合においても成り立つ。

ω ^(r) i(y)のとして、 u_tm, b ^(r) _imに対し、それぞれの記憶量を削減する方法として次のようなものが考えられる。ただし、添え字 g(r， j ，n)は HMM rの第： i状態のクラスタの発生確率が n番目であるクラスタ名（番号）を意味し、 b ^(r) j. , は、 HMMrの第 j状態におけるクラスタ g(r , j ，n)の発生確率、 h ( t， k)は入力パターンの第 tフレームの特徴べクトルの帰属度が k番目であるクラスタ名を意味し、 u t. h . は、クラスタ h(t，k)に対する y_tの帰属度を意味する。

〔第 1の方法〕

(数 64)

N

ω ^(r> j (y t) = ∑ U t, z (r. j . n) lOg b (^Γ) j, _e (r. j, _n)

M

+ {∑ U t. c (r. i. n)} B ^(Γ) i

N-N+l

とする。ただし、 b (^r) j. , _n)に関して、 l≤n≤Nにおいては η=1 ,···， 1^にする推定値そのまま、 Ν+1≤η≤Μにおいては

(数 65)

Β ^(Γ) b ^M i. . (r. i. _m) }

とする。 u tmに関しては、（1. 1) 1≤m≤Mにおける mの全ての推定値を用いる力、または、（1.2) u _{h (t}. » に関しては、 l ^k≤Kにおいては

替え ffl紙（規則 26) (数 66)

K

であって K+l≤k≤Mにおいては u_t. _{h (t}. _k) =0となるように推定しても良い。 (1.2) の場合は帰属度計算の肖 I賊も同時に行うことになる（後述）。

〔第 2の方法〕

(数 67)

N

ω ^(r i ^y _t)=∑ b ^(r) j. E (r. i. n) log u _t. _E (_r, . _n) において、 b ^(r i. _t (r. j. n)に関しては、 l≤n^Nにおいては (数 68)

N

∑ b ^(Γ) i. ₈ (r. i. „) = 1 であって N+l≤n≤Mにおいては b ^(r) j. _K (r. i. _n) =0となるように推定したものとする。 ut. h . に関しては、（2.1) l≤k≤Mにおける u_t. _{h (t}. _k)の全ての推定値を用いるか、または、（2.2) l≤k≤Kにおいては前記と同様の u t. h (,. _k)を用い、 K+l≤k≤Mにおいては (数 69)

K

ut. _h ct. _k) ={1— 2： u t, _h (t. m)}/(M— N) とする。（2.2) の場合は帰属度計算の削減も同時に行うことになる（後述）。〔第 3の方法〕

(数 70)

差替え用紙（規則 26) (r)

ω (r)

(y _t)=∑ b h (t. k) log U h (t, k)

k-1

M

(r)

+ { ∑ b ^(r) j. _{h (}t..<)} C.

k-K+1

において、 u_tmに関しては、：！^^：^！^にぉぃてひ！^^は！^-：！…り：^の推定値そのまま、 K+l≤k≤Mにおいては、

(数 71)

C u t. _h (_t. m> }

とする。 b w』.，（_r. j. _n)に関しては、（3.1) l≤n≤Mにおいては n=l，.·. ,Mに対する全ての推定値を用いる力 \ または、（3.2) l≤n≤Nにおいては

(数 72)

N

∑ b ^r) i. _{e (}r, _{j> n)} = l であって N+ 1≤n≤Mにおいては b ^(R) J, , (r. i. _n) =0となるように推定しても良い。 (3.2) の場合はメモリ量の肖リ滅も同時に行うことになる。

〔第 4の方法〕

(数 73)

K

ω ^(r) j (y t) =∑ u t. h (_t. k) log b (^r) h (【， k)

差替え闭 (¾Πΐ]26) において、 u t. h (,. _k)に関しては、 1≤ k≤Kにおいては

(数 74)

' K

U h (t， k) = 1 であって、 K+ 1≤ k≤Mにおいては u t. _h (_t. _k) =0となるように推定する。

b (^r) _e ， _n)に関しては、（4.1) l≤n≤Mにおいては nの全ての推定値を用いる力 \ または、（4· 2) l≤n≤Nに関しては、ゎ ^ は推定値そのままで、 N+ 1≤ n≤Mにおいては

(数 75)

N

b ^(Γ) j, _g (r. i,

b ^(Γ) i. _g (r. j. n)}/(M~N) と^しても良い。（4.2) の場合は、メモリ量の削減も同時に行うことになる。第 1の方法、第 2の方法、第 3の方法の (3.2) 、第 4の方法の (4.2) は、 HMMの各状態におけるクラスタの発生確率を（D Pにおける単語標準パターンとしての帰属度を）全てのクラスタについて記 HI "るのではなく、 HMMの各状態（DPの標準パターンの各フレーム）について、確率（帰属度）の高いクラスタの第 N位迄の確率属度）を.もつクラスタについてそれらのラベルと確率

m を記 DSI~るものである。例えば、第 r番の単語に财る HMM (標準パターン）は図 21または図 22のように示される。図 21は（数 67) (数 7 0) によって類似度を定義する場合、図 22は（数 64) (数 73) で類似度をする場合に用いることが出来る。

第 1の方法の（1.2) 、第 2の方法の（2，2) 、第 3の方法、第 4の方法は、

差替え用紙（規則 26) 入力パターンとしての帰属度行列を全てのクラスタについて計算するのではなく、入力パターンの各フレームについて、帰属度の高いクラスタの第 K位迄の帰属度を計算するものである。例えば、入力パターンは図 23または図 24のように示される。図 23は（数 64) (数 73) によって類似度を^する場合、図 24 は（数 67) (数 70) で類似度を錢する場合に用いることが出来る。

(数 64) 、（数 73) の場合、標準パターンの帰属度行列として、図 22において、 b ^(Γ) i. _g (r. i. n)の代わりに lOg ^(Γ) j. _t i. n)を記憶しておけば（図 π^τΤ) 、この計算は積和演算でよい。このとき、図 7の従来例よりも増える計算量は、（数 64) においては Ν=3、（数 73) においては Κ=3とすれば、各格子点でかけ算が 3回^ tt加すると言うことになるから、力ゝけ算の回数は 25 60 + 3X50X 100 = 4060ということになり、図 7の従来例に比べて確力 4こ増加するが、図 5の場合に比べると格段に少ない計算量であり、なおかつ、図 7の例に比べて高い認度が得られる。

(数 67 ) 、（数 70 ) の;^、入力パターンの帰属度行列として、図 24において、 u _t. h (t. _k)の代わりに log u _t. _h (_t. k>を記憶しておけば（図示 >¾r ) 、この計算は積和演算でよい。このとき、図 7の «例よりも増える計算量は、

(数 67) においては N=3、（数 70) においては K=3とすれば、各格子点でかけ算が 3回^ fc|加すると言うことになるから、かけ算の回数は 2560 + 3 X 50X 100 = 4060ということになり、図 7の従来例に比べて確かに増加するが、図 5の場合に比べると格段に少ない計算量であり、なおかつ、図 7の従来例に比べて高い認度が得られる。この場合は前節の log b_imを記憶しておく^に比べると、入力パターンの毎フレームについて log u _h <t. _k>の演算が必である。しかし、 K=3とすれば、これは毎フレーム 3回のみであり、

差替え ffi (規則 26) u _{h k)}は 0〜： lの間の数値しカ取らないから、 0≤χ≤1について log Xをテーブル化しておけば、この計算の代わりにテ一ブルルックアツプで済ませることもできる。

属度を (数 4) で: し、 u h 1) H hu _t. h (t, κ) = 1 u t. h (t. K+i)

==-" = U t. h (t. M) =0とするときは、ひの大きさの順と ^の小ささの順は同じであるから、先ず、全クラスタについて d(y_t，を計算し、上位の u _{t m}の計算は、 d ( y【， _m)の下位 Kのクラスタに関して行えば良いということになり計算量を肖 ij減することが出来る。即ち、 l≤k≤Kにおける帰属度は

(数 76)

D= 2/ (F-l) k-l a (y t , At h (t. k) ) とおくとき

(数 77)

2/ (F— 1)

U t. h (t. k) = D

d (y t , /i h (t. k) ) で与えられる。このときは、（数 76) の^ の分数計算と（数 77) の計算は共に K回である。 M=256、 K=3〜6であるとすれば、この計算量は 1Z4 0〜1ノ80となる。

帰属度を (数 4) で;) ε¾し、 U " h (" κ+υ =··· = 11 " _h (t. M) =U to, ut. _h (t. ₁ +-- - + U t. h (t. M) = lとするときは、 l≤k≤Kにおける帰属度は (M7 S)

え用紙（規則 26) D = 1/ (F-l) d (y t , At h (t. k) ) とおぐとき

(数 79) i) mE{h(l),...，h(K)}については

2/ (F-l)

U t. h (t. k) = D

d (y t , At h (t. k) ) ii) me{h(K+l),...,h(M)}については、共通の値

K

m«= 1

として計算でき、（数 78) は:^ の分数計算は M回必要であるが、 u _tmの大きさの順と d(y_t, m)の小ささの順は同じであるから、先ず、全クラスタについて d(y_t , /i _m)を計算し、（数 79) i) の u_tmの計算は、 d(y _t，Am)の下位 Kのクラスタに関して行えば良い。あるいは、より簡略化するために、次のようにするのも一法である。例えば、

{d (y t, Ai h (K+i) ) + d (y t,^h <Μ)}/2とおき、 d(y t，Aih (κ+υ ) = ··· = d(y_t, /iM) ) = d_t0とし、（数 78) を

差替え用紙（規則 (数 80)

2/ (F-1) 2/ (F-1)

D= ∑ (M-K)

a (y t , /i h (κ) ) + d ti で近似するものである。

あるいはまた、帰属度算出手段は、帰属度を算出すべき観測ベクトルと各クラスタの代 ¾ ^クトルとの距離から算出するものであって、その距離が最も小さいものを第 1位として、小ささの順に並べて K+1位以下のクラスタについては予め定めた 1ZK以下の一定値とし、距離の小さいものから順に Kのクラスタについてはそれら個々の距離と ΙΙίΙΒ—定値から帰属度の総和が 1になるように算出するものである。

相乗型 DPマッチングの場合は、標準パターンは帰属度べクトル列であるから標^、 °ターンにおいても帰属度の上位 Nのクラスタについてその帰属度を登録する際に、 |if|Bu_tmに対して行ったのと全く同様な方法を用いることが出来る。即、 b ^(Γ) j. z (r. j. 1) Λ hb "^T1 i. _E (r, j. N) = 1 > b ^(r) j. g (r. i. N+l) =· · · = b (^r)j._{i (r}. j.

とするときは、 K→N, h(t,k)→g(r, j，n),

ut, _{h (t}. _k)→b ^(r) i. ^ cr, i. „)として（数 76) (数 77) に準じて b ^(r) _jmを求めることが出来る。同様に、 b (^r) " _r. j. _N+1) =' " = b ^(Γ) j. C (r. M) = b ^(r) i o, b (^r) i. _t (r. i. D +- - - + b (^r) i. _{e (r}. i. M) = lとするときは、（数 78) (数 79) (数 80)等に準じて b w _imを求めることが出来る。

次に、本願第 4の発明について説明する。この場合は ΙΙΠΞΗΜΜの；^に有効である。その考え方は、 u_tmは、 b_imを推定するときの前記 Kと、認識を行うときの前記 Kが異なっても理論的には差し支えないと言う点を利用するものである。

差替え用紙（規則 26) 特に、モデルを作成する場合はともかく、認識の場合はできるだけ計算量の少ないことが望まれる;^が多い。計算量の最も少ないのは、離 ti ^の HMMであつて、これは FVQZHMMにおいて、認識の場合に K= 1として計算する場合に相当する。従って、モデルの作成の場合は FVQZHMMの方法で行って、認識の場合は、離 βΗΜΜの方法で認識することが出来る。前述したように、 FV Q型とすることの意味は、べクトル量子化による量子化歪を補完によって減ずると言うよりも、 ΗΜΜのパラメータを学習する際の学習サンプル数の不十分さを緩和し、パラメータの推定精度を上げることの効果の方が大きい。従って、モデルの作成は F VQ型で行って、認識時は離 βで行うことは、認識も FVQ型で行う場合に比べて若干性能は落ちるが、モデルの作成も認識も離散型で行うよりは、特に、コードブックサイズの大きいところでは認識率の向上することが実験的にも確かめられる。

なお、時間軸の線形な伸縮によるマッチングにおいても、前記帰属度べクトル同士の比較に基づいて入力パターンと標^、。ターンの比較を行うことが出来る。この場合も、標準パターンのフレーム数を入力パターンのフレーム数に合わせるベく線形に伸縮する場合は、（数 7) の類似度の定義が使え、入力パターンのフレーム数を標準パターンのフレーム数に合わせるべく線形に伸縮する場合は、 (数 4 3) の類献の錢が使える。産 ¾ιの利用可能性

本第 1の発明によれば、 Kul lbach-Leibler Divergenceという距離尺度を用いて、少ない計算量で精度良くヮードスポッティングが可能な HMM¾置を提供できる。本第 2の発明によれば、 ¾έ¾のべクトル量子ィ匕に基づく D Pマッチングにおい

差替 26ゾては、特徴べクトルを唯一つのクラスタに属するとしていたのを、本発明により特徴べクトルは複数のクラスタにそれぞれのクラスタに対する帰属度に相当する ffl合で属する、或いはそれぞれのクラスタのその特徴べクトルに対する事後確率に相当する割合で属するとし、その帰属度に基づいてフレーム間の類似度を確率的な距離尺度でしたので、種々の要因に基づくスペクトルの変動に強く、計箅量も従来例に比べて僅力の増加で済むパターン比較装置の実現が可能となった。本第 3の発明によれば、各認識単位に対応する HMMの各状態毎に全クラスタの発生確率を記憶するのではなく、確率の高さの順に第 N位までを記憶し、残りは等しい確率であるとして共通の値 1つを記億することにより、必要な記憶量の大幅な削減が可能となったものである。

本第 4の発明によれば、モデルの作成は相 FVQZHMMとして行い、認識は離散型 HMMとして行うようにしたので、モデル作成の際の学習サンプル数の不足による推定誤差を小さくし、認識時は少ない計算量で済む装置が実現できる。

差替え用紙（規則 26)

Claims

請求の範囲

1 . 解析の対象とするシステムは複数の状態をとるとし、特徴ベクトル空間をクラスタリングし、それぞれのクラスタの代 ¾ ^クトルがそのラベルで^^可能な形で記憶されたコードブックと、各状態における難各ラベルの発生確率（即ち各クラスタの発生確率）を記 i るクラスタ発生確率記憶手段と、 tinsコードブックを用いて観測べクトルの liflB各クラスタへの帰属度（即ち ΙίίΙΒ各クラスタの該観測ベクトルに対する事後確率）を算出する帰属度算出手段と、該算出された各クラスタへの tins観測べクトルの帰属度と前記クラスタ発生確率記憶手段に記憶されている各クラスタの発生確率の対数値との積和またはそれに等価な量を算出し、観測べクトルの前記システムの各状態における発生度合を算出する観測べクトノレ発生度合算出手段とを備え、 ΙίίΙΕクラスタ発生確率記憶手段は、クラスタの発生確率が第 N+ 1位以下となるクラスタに対する発生確率は零でない共通の値となし、クラスタの発生確率の総口が 1になるように算出されていることを特徴とする信^ If装

2. 帰属度算出手段は、帰属度が第 K+ 1位以下となるクラスタに対する帰属度は零となし、帰属度の総口が 1になるように算出することを特徴とする請求項 1 纖の信号蕭装齓

3 . の対象とするシステムは複数の状態をとるとし、特徴ベクトル空間をクラスタリングし、それぞれのクラスタの代表べクトルがそのラベルで検索可能な形で記億されたコードブックと、各状態における前記各ラペルの発生確率（即ち各クラスタの発生確率）を記憶するクラスタ発生確率記憶手段と、前記コードブックを用いて観測べクトルの ΙίΠΗ各クラスタへの帰属度（即ち ΙίίΙΒ各クラスタの該観測ベクトルに m~る^ ¾確率）を算出する帰属度算出手段と、該算出された

(規^ 26) 各クラスタへの nils観? ¾べクトルの帰属度の対数値と unaクラスタ発生確率記憶手段に記憶されてヽる各クラスタの発生確率との積和またはそれに等価な量を算出し、観測べクトルの前記システムの各状態における発生度合を算出する観測べクトル発生度合算出手段とを備えたことを特徴とする信^ 析装 ¾o

4. 各状態におけるクラスタ発生確率記憶手段は、予め定めた Nに対してその確率が上位 Nまでのクラスタについてはその総和が 1になるように算出したものを記憶し、他のクラスタの発生確率は 0とすることを特徴とする請求項 3記載の信 •§«f装 @o

5. 帰属度算出手段は、観測ベクトルの各クラスタに対する帰属度を、その帰属度が第 K+ 1位以下であるものは零でない共通の値とし、帰属度の総和が 1になるように算出することを特徴とする請求項 3記載の信号解析装

6 . 各状態は隠れマルコフモデルの各状態であることを特徴とする請求項 1、又は請求項 3記載の信"^析装齓

7. 特徴べクト間をクラスタリングし、それぞれのクラスタの代表ベクトルがそのラベルで; ^可能な形で記憶されたコードブックと、各状態における line 各ラベルの発生確率（即ち各クラスタの発生確率）を記憶するクラスタ発生確率記憶手段と、 ttiiaコードブックを用いて観測べクトルの前記各クラスタへの帰属度（即ち前記各クラスタの該観測ベクトルに対する事後確率）を算出する帰属度算出手段と、該算出された各クラスタへの tiriB観測ベクトルの帰属度と、 ΙίίΙΒクラスタ発生確率記憶手段に記憶されている各クラスタの発生確率の対数値との積和またはそれに等価な量を算出し、観測べクトルの前記システムの各状態における発^^合を算出する観測べクトル発生度合算出手段とを備え、 ΙϋΙΕ各状態における lifiB各クラスタの発生確率の推定は、 una観測べクトル発生度合算出手段を

差替え用紙（規則 26) 用いて計算し、認識時は、観測べクトルの帰属度を、最大の帰属度は 1とし、他の帰属度はすべて 0になるように算出することを特徴とする信号解析装置。

8. 特徴べクトルが分類されるべきクラスタ記憶手段と、比較すべきべクトル x、 yに対し、該名べクトルの各クラスタへの帰属度あるいは ItilB各クラスタの纏^ クトルにる事後確率（両方含めて以後帰属度と呼ぶことにする）を算出し、 ||[|2^ クトルの各クラスタに対する帰属度を要素とする帰属度べクトル、 bを算出する帰属度算出手段と、該帰属度ベクトル同士の距離または類似度を算出する類似度算出手段とを備え、該距離または類似度を以つて前記特徴べクトル yと 1との距離または類似度とすることを特徴とする信号解析装置。

9. 特徵べクトルが分類されるべきクラスタ記憶手段と、 ίΠΒべクトル系列の各べクトルの itfia各クラスタへの帰属度を算出し、 lineべクトルの各クラスタに対する帰属度を要素とする帰属度べクトルを算出する帰属度算出手段と、照合さるべき認 mm位を同様に帰属度べクトル列で表現した標¾^ ^ターン記憶手段と、前記帰属度算出手段の出力として得られる帰属度べクトル列からなる入力パターンと ΙίίΙΗ標^、。ターンとのマッチングを行うマッチング手段とを備え、該マツチングの結果、入力パターンと標^、。ターンとの類似度あるいは距離を計算する請求項 8|2¾の信号簾装釓

1 0. 入力パターンあるいは標準パターンの何れか一方の時間軸、または双方の時間軸を線形または非線形に伸縮して、両パターンの時間軸を合わせ、相対応する帰属度べクトル同士の距離または類似度を計算する類似度算出手段と、該距離または類似度を前記入力パターンあるいは標準パターンの何れカゝ一方の時間軸、または双方の時間軸に沿って前 i¾e離または類似度を累積する累積類似度算出手段とを備え、該累積値を以つて itna入力パターンと標^、。ターンとの距離または

13 え m紙（規則 26) 類似度とするものであることを特徴とする請求項 9|S¾の信"^析装 ¾>

1 1. 帰属度べクトル同士の帰属度または類似度を計算する類似度算出手段と、入力パターンを構成する帰属度べクトルのそれぞれと、 liflB入力パターンとマツチングすべき標、。ターンを構成する帰属度べクトルのそれぞれとを、両パターンの対応せしめた帰属度べクトル同士の類似度の、前記入力パターンあるいは標準パターンの何れか一方の時間軸、または双方の時間軸に沿って累積した累積値が最小または最大になるように A に対応せしめ、その最大値を算出する動的計面手段とを備えたことを特徴とする請求項⁹の信号解析装

1 2. 距離または類似度を計算する類似度算出手段は、距離または類似度を算出すべき 2つの帰属度ベクトルをそれぞれ a = (ai 2LU) 、 b= (b !，···， b_M) とするとき、次の何れかまたはそれらと等価な量として «または類似度を算出することを特徴とする請求項 8記載の信 WW装

(数 1)

Ca

(1) — C ∑ amlog or JLT (b m/ a m)

b,

b, Cb

(2) -C ∑ bmlog or H ( a m b m) b,

(3) -C ∑ amlog + bmlog

b, a：

差替え用紙（規則 26) ただし、 Cは。〉 0なる定 I

13. 入力パターンのフレーム tに対応する帰属度べクトルを a _t= (a «! _{a tM}) 、

(bii bi_M) 、 Itfiaマッチング観上の k番目の（t, j)座標を x(k) = (t (k), j (k))， x(k)における重み係数を w(x(k))とするとき、

(数 2)

S 1 (X (k)) =∑ a t (X) . m log b j (k) . m または s₂(x(k)) = ir(bj o . m) ^{a t (k)} ' ^m

m

を a_t と bj o の類似度とし、べクトノレ系列 a_tひ） "..， a _t αοと b j (υ，··.， b〗（_κ)との ftna に沿う累積類似度を

(数 3.)

S I (K) = max ：∑ w(x(k)) s i(x(k))]

χ χ (K)

または

S₂(K)= max [XI s₂(x(k))^{w (x (k))}]

(1) (K)

とするものであって、 l≤n≤k— 1に対して、 t (k)一 t (k一 n) = lのとき、 w(x(k— 11+1))+ '''+ （1 )=1でぁることを特徴とする請求項1 1記載の信号 «装 So

14. マッチング纖は、 t (k)- t (k一 1)=1, w(x(k)) = lであることを特徴とする請求項 13記載の信号解析装

15. マッチング径路は、 x(k) = (t，j)、 k一 l≥n≥ lに対して、（1) x

¾ ¾ 1 ^ (規則 26) (k一 l) = (t— 1, j— n)または x(k— l) = (t一 1， j)、 (2) x(k-l) = (t-l, j一 1)または x(k— l)==(t一 1， j )、 m=2，...，nに対しては、 x(k— m) = (t— 1 , j一 m)、（3) m= 1 ,..· , n— 1に対して、 x(k— m) = (t, j一 m)、 x(k— n) = (t— 1， j一 n)、 (4) m= 1 ,·.. , n— 1に対して、 x(k—m) = (t , j— m)、 x(k— n) = (t— 1 , j—n)、（5) x(k- 1) = (t-l , j一 1)または x(k— l) = (t— 1, j)、 m=2，...，nに対しては、 x(k— m) = (t— l, j— m)、の何れかを含み、径路（1) に対しては w(x(k)) =1、同（2) に対しては w(x(k))=l、 w(x(k-m+l)) = 0s 同（3) に対しては w(x(k— m+l)) = 0、 w(x(k-n+l))=U 同（4) (5) に対しては w (X (k— m+ 1 )) = 1 /nとすることを特徴とする請求項 13記載の信装 So

16. 距離または類似度を計算する類似度算出手段は、入力パターンのフレーム tに対応する帰属度ベクトルを a _t= (ati a_tM) 、標準パターンのフレーム jに対応する帰属度ベクトルを tn= (b "，···， b ) 、前記マッチング径路上の k番目の（ t， j )座標を x(k) = ( t (k), j (k))、 x(k)における重み係敲を w(x(k))とするとき、

(数 4)

S 1 ( (k ) = -2-. b j (k) , m lOg a t (k) . m

m

または s₂(x(k)) = H (at (_k)._m)^hj (^k)'^m

m

を a _t と b』の類似度とし、べクトノレ系歹¹ J a _t (υ ,···， a _t (ΐ と b i ₍"，···， i (κ)との ΙίίϊΒ に沿う類似度を

差替え用紙（規則 26) (数 5)

S 1 (K) = max [∑ w(x(k)) si(x(k))]

(1) (K)

または

S₂(K)= max [IT s₂(x(k))^{w (x (k))}]

(1) (K)

とするものであって、 l≤n≤k— 1に対して、 j (k)一 j (k一 n) = lのとき、 w(x(k— 11+1))+ '''+ （1 )=1でぁることを特徴とする請求項1 1載の信号解析装 ¾o

17. マッチング鶴は、 j (k)一 j (k一 1)=1、 w(x(k)) = lであることを特徴とする請求項 16記載の信号解析装齓

18. マッチング麵は、 x(k) = (t，j)、 k— l≥n≥lに対して、（1) x (k一 l) = (t一 n， j一 1)または x(k— l) = (t， j一 1)、 (2) x(k-l) = (t-l , j一 1)または x(k-l) = (t, j—1)、 m=2,...,nに対しては、 x(k— m) = (t— m, j— 1)、（3) m= 1，···， n— 1に対して、 x(k— m)=(t—m，j)、 x(k— n) = (t—n, j— 1)、 (4) m= 1 ,.·· , n— 1に対して、 x(k— m) = (t— m， j )、 x(k— n) = (t— n， j一 1)、（5) x(k- 1) =(t一 1 , j一 1)または x(k— l) = (t , j— 1)、 m=2，...，nに対しては、 x(k—m) = (t-m, j— 1)、の何れかを含み、 (1) に対しては w(x(k)) =1、同（2) に対しては w(x(k))=l、 w(x(k— m+l)) = 0、同（3) に対しては w(x(k— m+l)) = 0、 w(x(k— n+l))=l、同（4) (5) に対しては w(x(k— m+l))=lZnとすることを特徴とする請求項 16記載の信析装

19. 標维パターンのフレーム jの特徴べクトルのクラスタ mへの帰属度を b _jm、

差養え ¾紙翻 26) クラスタ数を Mとするとき、 b ^ !，·..， b の中から大きさの順にとつた N個の bi. « 0. 1) ,b i. _κ ο.2) ,...,bi. _e (j, N) (g(j ,n)は標準パターンのフレーム j における n番目に大きいクラスタのラベル、 N≤M) はそのままの値、残りは一定値 b。で bj. ,。. υ + ' + bj. "j, _N) +b₀(M— N) = lとなるように算出した値、またはそれぞれの対数値 log bi. _ε (j. i) , log bi. _β (j.2) , ···， log b i. , (i. N) 、 log b oの形で記る標^^ターン記憶手段を備えたことを特徴とする請求項 8記載の信号解析装

20. 標ターンのフレーム jの特徴べクトルのクラスタ mへの帰属度を b_im、クラスタ数を Mとするとき、 b i !，· .. ， b の中から大きさの順にとつた N個の b i. _e (j. n ,bi, _e (i.2) b j. « (j. N) (g(j ，n)は標ターンのフレーム j における n番目に大きいクラスタのラベル、 N≤M) は、 b _e ( υ +··· + i. c (i. _N) = lとなるように算出した値、残りは b i. , . N_+l) = = b _e M) = 0として記 HI"ることを特徴とする請求項 8記載の信 "^Wf装

2 1. 入力パターンのフレーム tの特徴べクトル y _tのクラスタ mへの帰属度を u_tm、クラスタ数を Mとするとき、 y_tが変換されるべき帰属度ベクトルを、

U _tl,...， U tMの中から大きさの順にとつた K個の U t. h (t, 1) , U t. h (t. 2) ，· ·.， ut. _{h (}t. K) (h(t ,k)は入力パターンのフレーム tにおける k番目に大きいクラスタのラベル、 K≤M) はそのままの値、残りは一定値 u。で ut. _h (【， i) H b u _t. _{h κ)} + u。 (M— K) == 1となるように算出した値とすることを特徴とする請求項 8記載の信^ «f装齓

22. 入力パターンのフレーム tの特徴べクトル y_tのクラスタ mへの帰属度を u_tm、クラスタ数を Mとするとき、 y_tが変換されるべき帰属度ベクトルを、

U "，...， U tMの中から大きさの順にとつた K個の U t, _h (t. i) , U t. h (t. 2)

差替え用紙（規則 26) u t. h (_t. K) (h (t , k)は入力パターンのフレーム tにおける k番目に大きいクラスタのラベル、 K≤M) は、 U t. h D +··· + \ι【. _{h κ)} = 1となるように算出した値、残りは U _t, h (t. K+l) = = U t. h (t. M) =0とすることを特徴とする請求項 8記載の信装齓

23. 入力パターンの第 t番フレームと標^、。ターンの第 j番フレームとの類似度は、 bji,...,b の中から大きさの順にとつた N個の b i. (j. 1) , b j, (j. 2) ,.

..,bj. _B (i. N) , n)は標準パターンのフレーム jにおける n番目に大きいクラスタのラベル、 N≤M) と、 b j. _e D +· · · + 1^· , . _N) +b。（M— N) = 1となるように算出した値 boと、全クラスタに対して算出された u _tm、もしくは

U "，...， U twの中から大きさの順に対応して U _t. h (t. i) +··· + !! t. h (_t> K) = 1 となるように算出した K個の t. h (t. l) , u t. h (t. 2) ,... , u t. h (t. κ) (h ( t , k) は入力パターンのフレーム tにおける k番目に大きいクラスタのラベル、 K≤M) に対し、

(数 6)

N M

S 1= ∑ U t. _C (j, lOg b i, z (i. n) + {∑ U ( lo bo

n*l N-N+l

または

N M

S

b i, _g a. n) ^{u 1} °- ⁿ⁾ II b。^{U t}' ' ^(j- ⁿ⁾

n-1 n-N+1 とすることを特徴とする請求項⁸記載の信号解析装 o

24. 入力パターンの第 t番フレームと標 * ターンの第 j番フレームとの類似度は、 b』！，...，の中から大きさの順に対応して tn. _e ti. i) +· · · + b j. , (j. N) =1となるように算出した N個の b _e o. i) , b j. « o. 2) ,·.. ,

差替え K羝 (¾H1!26^ bi. «o. N) (g(j ,n)は標準パターンのフレーム jにおける n番目に大きいクラスタのラベル、 N≤M) と、全クラスタに対して算出された u_tm、もしくは

U ",··.， U tMの中から大きさの順にとつた K個の U t. h (t. 1) , U t. h (t. 2) ，· · . ， u t. _h (t. K) (h (t , k)は入力パターンのフレーム tにおける k番目に大きいクラスタのラベル、 K≤M) と、 u _t. _h 1) -1 hu t. _h (t. K) + uo(M— K) =1となるように算出した値 u 0に対し、

(数 7)

N

S 1= ム t) j, e (j. n) lOg U t, g (j, n)

n— 1 または i . E (i. n)

S 2= ΤΪ U t. g (j. n) とすることを特徴とする請求項 8記載の信号解析装 m»

25 · 入力パターンの第 t番フレームと標、^βターンの第 j番フレームとの類似度は、全クラスタに対して算出された b_jm、もしくは！^ ，^， ^の中から大きさの順に対応して b i, _E o. i) +- " + b i. _e (i. Ν) = 1となるように算出した Ν個の bi. « (j. υ ,bi. _e ο, 2) ,...,bi. _β (i. N) (g(j ,n)は標ターンのフレーム j における n番目に大きいクラスタのラベル、 N≤M) と、 u ,·..， u_tMの中から大きさの順にとつた K個の u t, _{h (}t. i) , u t. _h (t. 2) ,... , u t. _h (_t. K) (h (t , k)は入力パターンのフレーム tにおける k番目に大きいクラスタのラベル、 K≤M) と、 u_t. _h ( υ +··· + ιι _{h K)} +u。 (M—K) =1となるように算出した値 Uoに対し、

差替え用紙（規則 26) (数 8) s 1 = b h (t, k) log u h (t. _k) + { ∑ b h (t, k) } log Uo

k-l k-K+1

または

M

， h (t. k) ^b j, h (t, k)

s 2= I丄 u t. h (t, k) n U o

k-l t-K+l

とすることを特徴とする請求項 8記載の信号解析装置。

26. 入力パターンの第 t番フレームと標^、。ターンの第 j番フレームとの類似度は、全クラスタに対して算出された b _{i m}、もしくは！^ ，，，， ^の中から大きさの順にとつた N個の b _E . D ,b j, _β 0. 2) ,...,b j. _e (j. N) (g(j ,n)は標準パターンのフレーム jにおける n番目に大きいクラスタのラベル、 N≤M) と、 b i. « 0. i) +- - -+ b i. _eo. N) + b o (M-N) =1となるように算出した b。と、 u ",.··，の中から大きさの順に対応して u _t. _h (,. i) Η h U t. h (t. Κ) = 1 となるように算出した K個の u _t. h ct. i) ,u t. h (t. ₂) ,u t. h (t. K) (h(t ,k) は入力パターンのフレーム tにおける k番目に大きいクラスタのラベル、 K≤M) に対し、

(数 9)

(t. k) log b i. h (t. k)

k«=l

または

(t， k)

s 2= H b j, (t. k) とすることを特徴とする請求項 1記載の信号脈装置。

27. 帰属度は、それら帰属度を算出すべきベクトルと各クラスタの代表べクト

差替え用紙（規則 26) ルとの i¾離から算出するものであって、その距離が小さいものから順に前者の場合は前記 K、後者の場合は前記 Νまでのものについてはそれらの距離をそのまま用い、その順位が Κ+ 1または Ν+ 1以下ののクラスタについては共通の値を用いて帰属度を算出することを特徴とする請求項 5、又は 1 9記載のの信号解析装

2 8. 共通の値は、前記 K+ 1または前記 N+ 1以下の順位のクラスタについては、各クラスタに対する距離の平均とすることを特徴とする請求項 2 7記載の信号解析装置。

2 9 . 共通の値は、前記 K+ 1または前記 N+ 1以下の順位のクラスタについては、最小の距離と最大の距離との平均とすることを特徴とする請求項 2 7記載の信号解析装齓

3 0. 帰属度は、帰属度を算出すべき観測べクトルと各クラスタの代表べクトルとの距離が小さいものから K+ 1位または N+ 1位以下のクラスタについては予め定めた 1 ΖΚまたは 1 Ν以下の一定値とし、距離の小さいものから順に Κまたは Νのクラスタについてはそれら個々のの距離と前記一定値から帰属度の総口が 1になるように算出することを特徴とする請求項 5、又は 1 9記載の信号解析装氬

差替え用紙（規則 26)