WO2002045002A1 - Method and system for reducing the error rate in pattern recognitions - Google Patents

Method and system for reducing the error rate in pattern recognitions Download PDF

Info

Publication number
WO2002045002A1
WO2002045002A1 PCT/EP2001/012454 EP0112454W WO0245002A1 WO 2002045002 A1 WO2002045002 A1 WO 2002045002A1 EP 0112454 W EP0112454 W EP 0112454W WO 0245002 A1 WO0245002 A1 WO 0245002A1
Authority
WO
WIPO (PCT)
Prior art keywords
input
devices
error
recognition
error rate
Prior art date
Application number
PCT/EP2001/012454
Other languages
German (de)
French (fr)
Inventor
Alfred Hauenstein
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2002045002A1 publication Critical patent/WO2002045002A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/10Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems

Definitions

  • the invention relates to a method and a system for reducing the error rate in pattern recognition, such as, for example, voice recognition, font recognition, gesture recognition and biometric recognition, according to the preamble of patent claim 1 and the preamble of patent claim 8.
  • pattern recognition such as, for example, voice recognition, font recognition, gesture recognition and biometric recognition
  • Pattern recognition is possible in a variety of ways when communicating with data processing devices and / or communication devices. For example, communication with a computer by voice recognition in the form of voice input or character recognition by means of input using a keyboard or a mouse is possible.
  • voice recognition in the form of voice input or character recognition by means of input using a keyboard or a mouse is possible.
  • a type recognition method is also known, in which handwriting is entered, for example by means of a pen, over a correspondingly pressure-sensitive area and recognized as characters.
  • Voice input makes it easier for the user to use computers when communicating with the computer and often increases the speed at which data or commands can be input.
  • the method of voice input as a pattern recognition-based input method has a certain error rate, which is the case, for example, with a dictation system , as used in communication with PCs, is approx. 1 - 5%.
  • Such dictation systems therefore often use a list of word alternatives in the event of an incorrectly recognized word.
  • the incorrectly recognized word is first selected by the user using the mouse or a voice input, whereupon the PC then displays a list of alternative words from which the user uses mouse or voice input to select the correct word, ie the result.
  • Such speech recognition methods also have the disadvantage that, in particular in the case of mobile end devices, such as mobile telephones, electronic organizers, PDAs and webpads or also mobile data acquisition terminals, often the display device in the form of a screen for the often complex representation of word results from speech recognition and its alternatives is not sufficient due to their size.
  • An essential point of the invention is that the patterns to be recognized are input simultaneously by means of at least two different mutually independent input devices, such as, for example, a voice input device and a font input device, which are patterns with the same content or at least with the same key characters.
  • the formula then calculates the minimum error rate
  • n error _ * ⁇ ⁇ p error, ⁇ ⁇ r total, ' ⁇ yyy,' ⁇ l,
  • Such a combination of several different input methods makes it possible to use the above-mentioned formula (2) to form a sum of the error probabilities for the calculation result i from the error probabilities of the individual input devices with a different weighting Cj and from this the key character with the minimum accumulated error rate to be calculated using the formula (1).
  • summing up the error probabilities of the individual methods assigned to the input devices and a minimum cumulative error rate calculated therefrom it is possible to reduce the error rate of the overall system consisting of the various input devices and thus to achieve an increased accuracy of the system. This is particularly useful if, for temporary high accuracy requirements (e.g. numerical a) fast, inaccurate procedure would be supplemented by a more precise but slow one.
  • compact terminals with small display devices often do not have the option of subsequently correcting pattern recognition by means of voice input using a keyboard or a mouse, since such terminals do not have such input devices.
  • the input of patterns is possible quickly and easily by combining, for example, a biometric input method and a voice input to reduce the error rate.
  • the weight factors of the individual input methods can advantageously be predetermined, so that the user does not have to make any further settings before using the pattern recognition method.
  • the user can use the weighting factors of the individual input methods in a preferred embodiment.
  • the results of the calculated error rates for each individual input device can advantageously be displayed separately on a display device or by means of an output device.
  • device such as a voice output device, are output to the user for control.
  • a voice input with a microphone la and a font input with a stylus 2a and a pressure-sensitive surface can thus be combined with one another.
  • the pattern can also be entered using a keyboard 3a.
  • An electronic telephone book is stored in a mobile, compact terminal, such as a cell phone 5, from which the selected telephone number can be automatically selected by selecting a telephone number.
  • the terminal is also used to enter appointments in the electronic telephone book.
  • a terminal can also be, for example, a conventional telephone, a cordless telephone, an electronic organizer, a PDA, a webpad or a mobile data acquisition terminal.
  • a selection of a telephone number from this telephone book via a name assigned to the telephone number takes place by means of a voice input and a written input.
  • the user speaks the words "Please choose Möller” or "New appointment tomorrow 5:00 p.m. with Müller”.
  • These sentences contain certain key characters in the form of keywords, namely the word "dial”, which stands for an action to be carried out by the terminal and the word "Möller”, which stands for the destination, ie the person to be called. If such a selection from the telephone book were to take place exclusively by means of a voice input via a microphone 1 a, then, in particular in the case of very extensive electronic telephone books, a confusion of similar terms such as “Möller” and “Müller” could take place due to the expected error rate.
  • the keywords "select” and “Möller” are written down with the pen 2a at the same time as the voice is input and recognized by a subsequent automatic font recognition.
  • Different patterns with the same key words, namely the interchangeable words, are thus input via two different input devices.
  • the entire sentence can be entered using language and writing.
  • a weighting 1b, 2b, 3b of the results of the different pattern recognition methods that are assigned to the input devices j takes place, the different results i being assigned to the different keywords, that is to say the actions and / or goals.
  • the cumulative error rate is calculated using n input devices j from the following formula:
  • the result with the minimum cumulative error rate according to (1) is not chosen, but the result with the minimum error rate for a given method j. This results in
  • arg opt arg (min (P TM)) with fixed j (lb , Method (lb) is expediently used if, as described above, an exact method j, which is slower than the standard method, is only used temporarily for keywords.
  • Possible input devices can be voice input devices, keyboard input devices, mouse input devices, handwriting input devices, gesture input devices and biometric input devices, such as for example for inputting brain waves, fingerprints, etc.

Abstract

The invention relates to a method and system for reducing the error rate in pattern recognitions, in particular, voice recognitions, handwriting recognitions, gesture recognitions and biometric recognitions. According to the invention, patterns with code characters are input by using a combination of different input devices, which are independent of one another, into data processing devices and/or communications devices.

Description

Beschreibungdescription
Verfahren und System zur Reduzierung der Fehlerrate bei MustererkennungenMethod and system for reducing the error rate in pattern recognition
Die E-rfindung betrifft ein Verfahren und ein System zur Reduzierung der Fehlerrate bei Mustererkennungen, wie beispielsweise Spracherkennungen, Schrifterkennungen, Gestikerkennungen und Biometrikerkennungen, gemäß dem Oberbegriff des Pa- tentanspruchs 1 und dem Oberbegriff des Patentanspruchs 8.The invention relates to a method and a system for reducing the error rate in pattern recognition, such as, for example, voice recognition, font recognition, gesture recognition and biometric recognition, according to the preamble of patent claim 1 and the preamble of patent claim 8.
Mustererkennung ist bei der Kommunikation mit Datenverarbeitungseinrichtungen und/oder Kommunikationseinrichtungen in vielfältiger Weise möglich. So ist beispielsweise die Kommu- nikation mit einem Computer per Spracherkennung in Form einer Spracheingabe oder Zeichenerkennung mittels Eingabe über eine Tastatur oder eine Maus möglich. Auch ein Schrifterkennungs- verfahren, bei dem Handschriften beispielsweise mittels eines Stiftes über eine entsprechend drucksensitive Fläche eingege- ben und als Schriftzeichen erkannt werden, ist bekannt.Pattern recognition is possible in a variety of ways when communicating with data processing devices and / or communication devices. For example, communication with a computer by voice recognition in the form of voice input or character recognition by means of input using a keyboard or a mouse is possible. A type recognition method is also known, in which handwriting is entered, for example by means of a pen, over a correspondingly pressure-sensitive area and recognized as characters.
Die Spracheingabe erleichtert dem Benutzer bei der Kommunikation mit dem Computer zwar den Umgang mit Computern und erhöht oft die Schnelligkeit der Eingabe von Daten oder Komman- dos. Jedoch weist das Verfahren der Spracheingabe als ein mustererkennungsbasierendes Eingabeverfahren eine gewisse Fehlerrate auf, die beispielsweise bei einem Diktiersystem, wie es bei der Kommunikation mit PCs verwendet wird, ca. 1 - 5 % beträgt. Derartige Diktiersysteme verwenden deshalb oft eine Liste von Wortalternativen im Falle eines fehlerhaft erkannten Wortes. Hierbei wird das fehlerhaft erkannte Wort zunächst per Maus oder einer Spracheingabe vom Benutzer ausgewählt, woraufhin dann der PC eine Liste mit Alternativwörtern aufzeigt, aus der der Benutzer mittels Maus oder Spracheinga- be das richtige Wort, also das Ergebnis, auswählt. Ein derartiges nachträgliches Korrigieren der unter die Fehlerrate fallenden Wörter hat den Nachteil, daß das gesamte Sprachein- gabeverfahren durch diese nachträgliche Korrektur langsam ist und es zum Auffinden des fehlerhaften Wortes und zur Korrektur des fehlerhaften Wortes einer erhöhten Aufmerksamkeit durch den Benutzer bedarf. Weiterhin ist der Umfang der zur Verfügung gestellten Alternativwörter nur begrenzt, weshalb nicht immer sichergestellt ist, daß das richtige Wortergebnis in der Liste der Alternativwörter vorhanden ist . Dann besteht zwar die Möglichkeit, daß der Benutzer das fehlende Wort selbst eingibt, jedoch bewirkt dies eine weitere Verlangsa- mung des gesamten Spracheingabeverfahrens.Voice input makes it easier for the user to use computers when communicating with the computer and often increases the speed at which data or commands can be input. However, the method of voice input as a pattern recognition-based input method has a certain error rate, which is the case, for example, with a dictation system , as used in communication with PCs, is approx. 1 - 5%. Such dictation systems therefore often use a list of word alternatives in the event of an incorrectly recognized word. The incorrectly recognized word is first selected by the user using the mouse or a voice input, whereupon the PC then displays a list of alternative words from which the user uses mouse or voice input to select the correct word, ie the result. Such a subsequent correction of the words falling under the error rate has the disadvantage that the entire speech input Gabeverfahren is slow by this subsequent correction and it requires increased attention by the user to find the incorrect word and correct the incorrect word. Furthermore, the scope of the alternative words provided is only limited, which is why it is not always ensured that the correct word result is available in the list of alternative words. Then there is the possibility that the user enters the missing word himself, but this causes a further slowdown of the entire speech input process.
Derartige Spracherkennungsverfahren weisen zudem den Nachteil auf, daß insbesondere bei mobilen Endgeräten, wie Mobiltelefonen, elektronischen Organizern, PDA's und Webpads oder auch mobilen Datenerfassungsterminals, oftmals die Anzeigeeinrichtung in Form eines Bildschirms für die oft komplexe Darstellung von Wort-ergebnissen aus der Spracherkennung und ihrer Alternativen aufgrund ihrer Größe nicht ausreichend ist.Such speech recognition methods also have the disadvantage that, in particular in the case of mobile end devices, such as mobile telephones, electronic organizers, PDAs and webpads or also mobile data acquisition terminals, often the display device in the form of a screen for the often complex representation of word results from speech recognition and its alternatives is not sufficient due to their size.
Ein weiterer wesentlicher Nachteil solcher Spracherkennungs- oder Schrifterkennungsverfahren liegt darin, daß trotz ständiger Weiterentwicklungen und Optimierungen dieser Verfahren die Genauigkeit dieser mustererkennungsbasierenden Eingabeverfahren Grenzen aufgrund der oben genannten Fehlerraten aufweisen.Another major disadvantage of such speech recognition or writing recognition methods is that despite constant further developments and optimizations of these methods, the accuracy of these pattern recognition-based input methods has limits due to the error rates mentioned above.
Somit liegt der vorliegenden Erfindung die Aufgabe zugrunde, ein Verfahren und ein System zur Reduzierung der Fehlerrate bei Mustererkennungen zur Verfügung zu stellen, daß nicht nur eine erhöhte Genauigkeit bei der Erkennung der Muster, sondern auch eine schnellere und vereinfachtere Erkennung der Muster ermöglicht.It is therefore the object of the present invention to provide a method and a system for reducing the error rate in pattern recognition, which not only enables increased accuracy in the recognition of the patterns, but also faster and simpler recognition of the patterns.
Diese Aufgabe wird verfahrensmäßig durch die Merkmale des An- spruchs 1 und für ein System nach den Merkmalen des Anspruchs 7 gelöst. Ein wesentlicher Punkt der Erfindung liegt darin, daß die zu erkennenden Muster mittels mindestens zwei verschiedener voneinander unabhängiger Eingabeeinrichtungen gleichzeitig eingegeben werden, wie beispielsweise einer Spracheingabeein- richtung und einer Schrifteingabeeinrichtung, wobei es sich um Muster mit gleichem Inhalt oder zumindest mit gleichen Schlüsselzeichen handelt. Eine Berechnung der minimalen Fehlerrate findet dann mittels der FormelThis object is achieved in terms of method by the features of claim 1 and for a system according to the features of claim 7. An essential point of the invention is that the patterns to be recognized are input simultaneously by means of at least two different mutually independent input devices, such as, for example, a voice input device and a font input device, which are patterns with the same content or at least with the same key characters. The formula then calculates the minimum error rate
arg opt = arg(min( P gZ , „• )) (1)arg opt = arg (min (P g Z, "•)) (1)
statt, wobei giltinstead of where
n error _ "* ~ι p error , ~ \ r gesamt ,' ~ j j j ,' \ l ,n error _ " * ~ ι p error, ~ \ r total, '~ yyy,' \ l,
mit P X°r = Fehlerwahrscheinlichkeit für ein einem Schlüssel- zeichen zugeordnetes Berechnungsergebnis i bei Eingabe mittels der Eingabeeinrichtung j , Cj = Gewichtsfaktor (lb, 2b, 3b) der Eingabe mittels der Eingabeeinrichtung j .with PX ° r = error probability for a calculation result i assigned to a key character when input by means of input device j, Cj = weight factor (lb, 2b, 3b) of input by means of input device j.
Durch eine derartige Kombination mehrerer verschiedener Eingabeverfahren ist es möglich, mittels der oben genannten Formel (2) eine Summe der Fehlerwahrscheinlichkeiten für das Berechnungsergebnis i aus den Fehlerwahrscheinlichkeiten der einzelnen Eingabeeinrichtungen mit unterschiedlicher Gewich- tung Cj zu bilden und daraus das Schlüsselzeichen mit der minimalen kumulierten Fehlerrate mittels der Formel (1) zu berechnen. Durch die Aufsummierung der Fehlerwahrscheinlichkeiten der einzelnen den Eingabeeinrichtungen zugeordneten Ver- fahren und einer daraus berechneten minimalen kumulierten Fehlerrate ist es möglich, die Fehlerrate des Gesamtsystems bestehend aus den verschiedenen Eingabeeinrichtungen, zu reduzieren und somit eine erhöhte Genauigkeit des Systems zu erreichen. Dies ist besonders dann sinnvoll, wenn man bei temporären hohen Genauigkeitsanforderungen (z. B. Zahlenein- gäbe) ein schnelles, ungenaures Verfahren durch ein genaueres, aber langsames ergänzt .Such a combination of several different input methods makes it possible to use the above-mentioned formula (2) to form a sum of the error probabilities for the calculation result i from the error probabilities of the individual input devices with a different weighting Cj and from this the key character with the minimum accumulated error rate to be calculated using the formula (1). By summing up the error probabilities of the individual methods assigned to the input devices and a minimum cumulative error rate calculated therefrom, it is possible to reduce the error rate of the overall system consisting of the various input devices and thus to achieve an increased accuracy of the system. This is particularly useful if, for temporary high accuracy requirements (e.g. numerical a) fast, inaccurate procedure would be supplemented by a more precise but slow one.
Insbesondere kompakte Endgeräte mit kleinen Anzeigeeinrich- tungen (Displays) weisen oft nicht die Möglichkeit auf, eine nachträgliche Korrektur einer Mustererkennung mittels Spracheingabe durch eine Tastatur oder eine Maus durchzuführen, da derartige Endgeräte solche Eingabevorrichtungen nicht aufweisen. In diesem Fall ist die Eingabe von Mustern durch die Kombination von beispielsweise einem biometrischen Eingabeverfahren und einer Spracheingabe zur Reduzierung der Fehlerrate schnell und unkompliziert möglich.In particular, compact terminals with small display devices (displays) often do not have the option of subsequently correcting pattern recognition by means of voice input using a keyboard or a mouse, since such terminals do not have such input devices. In this case, the input of patterns is possible quickly and easily by combining, for example, a biometric input method and a voice input to reduce the error rate.
Vorteilhaft können die Gewichtsfaktoren der einzelnen Einga- beverfahren vorbestimmt werden, wodurch der Benutzer keine weiteren Einstellungen vor der Verwendung der Mustererken- nungsverfahren vornehmen muß.The weight factors of the individual input methods can advantageously be predetermined, so that the user does not have to make any further settings before using the pattern recognition method.
Alternativ kann in einer bevorzugten Ausführungsform der Be- nutzer die Gewichtsfaktoren der einzelnen Eingabeverfahren inAlternatively, in a preferred embodiment, the user can use the weighting factors of the individual input methods in
Abhängigkeit von der gewünschten Genauigkeit des Verfahrens bzw. der zugeordneten Eingabeeinrichtung vorab individuell einstellen („Enrollment") bzw. in Abhängigkeit der bei ihm auftretenden Genauigkeit trainieren.Depending on the desired accuracy of the method or the assigned input device, set individually beforehand (“enrollment”) or train depending on the accuracy that occurs with it.
Durch die gleichzeitige und parallele Verwendung mehrerer, voneinander unabhängiger Eingabeeinrichtungen zur Eingabe von Mustern kann ein Vergleich der Fehlerraten der verschiedenen Eingabeeinrichtungen für das Muster mit den gleichen Schlüs- seizeichen stattfinden und somit daraus eine minimale kumulierte Fehlerrate berechnet werden. Dies hat eine Erhöhung der Genauigkeit des gesamten Systems bestehend aus allen Eingabeeinrichtungen zur Folge .Through the simultaneous and parallel use of a plurality of input devices which are independent of one another for inputting patterns, a comparison of the error rates of the different input devices for the pattern with the same key characters can take place and a minimum cumulative error rate can thus be calculated therefrom. This results in an increase in the accuracy of the entire system consisting of all input devices.
Vorteilhaft können die Ergebnisse der berechneten Fehlerraten für jede einzelne Eingabeeinrichtung getrennt auf einer Anzeigeeinrichtung angezeigt oder mittels einer Ausgabeeinrich- tung, wie beispielsweise einer Sprachausgabeeinrichtung, dem Benutzer zur Kontrolle ausgegeben werden.The results of the calculated error rates for each individual input device can advantageously be displayed separately on a display device or by means of an output device. device, such as a voice output device, are output to the user for control.
Weitere Ausführungsformen ergeben sich aus den Unteransprü- chen. Ein Ausführungsbeispiel der Erfindung wird im folgenden anhand der Figur näher erläutert, die eine schematische Darstellung einer Ausführungsform des erfindungsgemäßen Verfahrens zeigt .Further embodiments result from the subclaims. An embodiment of the invention is explained in more detail below with reference to the figure, which shows a schematic representation of an embodiment of the method according to the invention.
Wie in der Figur zu erkennen ist, werden mehrere Eingabeverfahren und damit verbundene Eingabeeinrichtungen la, 2a, 3a verwendet, um eine Mustererkennung mit reduzierter Fehlerrate durchzuführen. So kann eine Spracheingabe mit einem Mikrofon la und eine Schrifteingabe mit einem Stift 2a und einer drucksensitiven Fläche miteinander kombiniert werden. Zusätzlich ist auch die Eingabe der Muster mittels einer Tastatur 3a möglich.As can be seen in the figure, several input methods and associated input devices 1a, 2a, 3a are used to carry out a pattern recognition with a reduced error rate. A voice input with a microphone la and a font input with a stylus 2a and a pressure-sensitive surface can thus be combined with one another. In addition, the pattern can also be entered using a keyboard 3a.
In einem mobilen, kompakten Endgerät, wie beispielsweise ei- nem Mobiltelefon 5, ist ein elektronisches Telefonbuch gespeichert, aus dem durch Auswahl einer Telefonnummer automatisch die gewählte Telefonnummer gewählt werden kann. Zusätzlich dient das Endgerät zum Eintragen von Terminen in das e- lektronische Telefonbuch. Ein derartiges Endgerät kann bei- spielsweise auch ein herkömmliches Telefon, ein Schnurlostelefon, ein elektronischer Organizer, ein PDA, ein Webpad oder ein mobiler Datenerfassungsterminal sein.An electronic telephone book is stored in a mobile, compact terminal, such as a cell phone 5, from which the selected telephone number can be automatically selected by selecting a telephone number. The terminal is also used to enter appointments in the electronic telephone book. Such a terminal can also be, for example, a conventional telephone, a cordless telephone, an electronic organizer, a PDA, a webpad or a mobile data acquisition terminal.
Eine Auswahl einer Telefonnummer aus diesem Telefonbuch über einen der Telefonnummer zugeordneten Namen findet durch eine Spracheingabe und eine Schrifteingabe statt. Dazu spricht der Benutzer beispielsweise die Wörter „Bitte Möller wählen" oder „Neuer Termin morgen 17.00 Uhr mit Müller". Diese Sätze enthalten gewisse Schlüsselzeichen in Form von Schlüsselwörtern, nämlich das Wort „wählen", das für eine durch das Endgerät durchzuführende Aktion steht und das Wort „Möller", das für das Ziel, also den Anzurufenden, steht. Würde nun eine derartige Auswahl aus dem Telefonbuch ausschließlich mittels einer Spracheingabe über ein Mikrofon la stattfinden, so kann insbesondere bei sehr umfangreichen e- lektronischen Telefonbüchern eine Verwechslung ähnlicher Begriffe, wie „Möller" und „Müller" aufgrund der zu erwartenden Fehlerrate stattfinden. Deshalb werden zeitgleich mit der Spracheingabe die Schlüsselwörter „wählen" und „Möller" mit dem Stift 2a niedergeschrieben und durch eine sich anschlie- ßende automatische Schrifterkennung erkannt. Somit werden ü- ber zwei verschiedene Eingabeeinrichtungen verschiedene Muster mit gleichen Schlüsselwörtern, nämlich den verwechselbaren Wörtern, eingegeben. Alternativ dazu ist auch die Eingabe des gesamten Wortsatzes durch Sprache und Schrift möglich. Nach erfolgter Eingabe findet eine Gewichtung lb, 2b, 3b der Ergebnisse der verschiedenen Mustererkennungsverfahren, die den Eingabeeinrichtungen j zugeordnet sind, statt, wobei die verschiedenen Ergebnisse i den verschiedenen Schlüsselwörtern, also den Aktionen und/oder Zielen zuzuordnen sind.A selection of a telephone number from this telephone book via a name assigned to the telephone number takes place by means of a voice input and a written input. For example, the user speaks the words "Please choose Möller" or "New appointment tomorrow 5:00 p.m. with Müller". These sentences contain certain key characters in the form of keywords, namely the word "dial", which stands for an action to be carried out by the terminal and the word "Möller", which stands for the destination, ie the person to be called. If such a selection from the telephone book were to take place exclusively by means of a voice input via a microphone 1 a, then, in particular in the case of very extensive electronic telephone books, a confusion of similar terms such as “Möller” and “Müller” could take place due to the expected error rate. For this reason, the keywords "select" and "Möller" are written down with the pen 2a at the same time as the voice is input and recognized by a subsequent automatic font recognition. Different patterns with the same key words, namely the interchangeable words, are thus input via two different input devices. Alternatively, the entire sentence can be entered using language and writing. After the input has taken place, a weighting 1b, 2b, 3b of the results of the different pattern recognition methods that are assigned to the input devices j takes place, the different results i being assigned to the different keywords, that is to say the actions and / or goals.
Die kumulierte Fehlerrate errechnet sich bei der Verwendung von n Eingabeeinrichtungen j aus der folgenden Formel :The cumulative error rate is calculated using n input devices j from the following formula:
p - error X 1 s~ι error gesamt , i ~ 2-ι 1 JJ (2)p - error X 1 s ~ ι total error, i ~ 2-ι 1 JJ (2)
/=1/ = 1
Wenn lediglich zwei Eingabeeinrichtungen j=l und j=2 zur Mustererkennung verwendet werden, so ergibt sich aus der Formel (2) folgende Formel:If only two input devices j = 1 and j = 2 are used for pattern recognition, the following formula results from the formula (2):
p - error s~ι r>error , *~t rfβrror gesamt, i " Ll X X,i + 2 X *2ji ( 3 ) .p - error s ~ ι r> error, * ~ t rfβrror total, i "L l X X, i + 2 X * 2ji (3).
Hierbei ist p *r °r ^ _e Fehlerwahrscheinlichkeit für das Ergebnis i bei einer Eingabe über die Eingabeeinrichtung j , und Cj der Gewichtsfaktor für eine Eingabe mit der Eingabeeinrich- tung j . Es gilt zudem:
Figure imgf000009_0001
(4)
Here p * r ° r ^ _ e is the probability of error for the result i in the case of an input via the input device j, and C j is the weight factor for an input with the input device j. The following also applies:
Figure imgf000009_0001
(4)
Es findet also eine Berechnung der Fehlerwahrscheinlichkeit für das Ergebnis i für die Eingabe über jede Eingabeeinrichtung j statt. Diese Fehlerwahrscheinlichkeit für eine bestimmte Eingabeeinrichtung wird dann mit einem Gewichtsfaktor Ci oder C2 kombiniert, um anschließend eine Summe der Fehlerwahrscheinlichkeiten, auch Klassifikator 4 genannt, zu be- rechnen. Zu berücksichtigen ist, daß die Summe aller Gewichtsfaktoren Cj exakt 1 ergibt. Abhängig von dem zu der jeweiligen Eingabeeinrichtung j zugehörigen Verfahren kann eine unterschiedliche Gewichtung durch individuelle Einstellung der Gewichtsfaktoren Cx und C2 im Voraus oder durch den Be- nutzer für jede durchzuführende Mustererkennung durchgeführt werde .There is therefore a calculation of the probability of error for the result i for the input via each input device j. This probability of error for a specific input device is then combined with a weighting factor Ci or C 2 in order to subsequently calculate a sum of the error probabilities, also called classifier 4. It should be taken into account that the sum of all weight factors C j results in exactly 1. Depending on the method associated with the respective input device j, a different weighting can be carried out by individually setting the weighting factors C x and C 2 in advance or by the user for each pattern recognition to be carried out.
Mit der FormelWith the formula
arg opt = arg(min( P mt t )) ( 1) arg opt = arg (min (P mt t )) (1)
wird nun das Ergebnis mit der minimalen kumulierten Fehlerrate berechnet und ausgewählt. Hieraus ergibt sich eine Erhöhung der Genauigkeit der Mustererkennung durch Kombination verschiedener Eingabeeinrichtungen.the result is now calculated and selected with the minimum cumulative error rate. This results in an increase in the accuracy of the pattern recognition by combining different input devices.
Bei einer alternativen Ausführungsform wird nicht das Ergebnis mit der minimalen kumulierten Fehlerrate gemäß (1) gewählt, sondern das Ergebnis mit der minimalen Fehlerrate für ein vorgegebenes Verfahren j . Damit ergibt sichIn an alternative embodiment, the result with the minimum cumulative error rate according to (1) is not chosen, but the result with the minimum error rate for a given method j. This results in
arg opt = arg(min( P™ )) mit festem j (lb, Verfahren (lb) wird sinnvollerweise dann eingesetzt, wenn, wie oben dargestellt, nur temporär für Schlüsselwörter ein genaues, Verfahren j, das langsamer als das Standardverfahren ist, verwendet wird.arg opt = arg (min (P ™)) with fixed j (lb , Method (lb) is expediently used if, as described above, an exact method j, which is slower than the standard method, is only used temporarily for keywords.
Mögliche Eingabeeinrichtungen können Spracheingabeeinrichtung, Tastatureingabeeinrichtungen, Mauseingabeeinrichtungen, Handschrifteingabeeinrichtungen, Gestikeingabeeinrichtungen und Biometrikeingabeeinrichtungen, wie beispielsweise zur Eingabe von Hirnströmen, Fingerabdrücken usw., sein. Possible input devices can be voice input devices, keyboard input devices, mouse input devices, handwriting input devices, gesture input devices and biometric input devices, such as for example for inputting brain waves, fingerprints, etc.

Claims

Patentansprüche claims
1. Verfahren zur Reduzierung der Fehlerrate bei Mustererkennungen, insbesondere Spracherkennungen, Sprachschrifterken- nungen, Gestikerkennungen und Biometrikerkennungen, in dem Muster mit Schlüsselzeichen mittels Eingabeeinrichtungen (la, 2a, 3a) in Datenverarbeitungseinrichtungen und/oder Kommunikationseinrichtungen (5) eingegeben werden, d a d u r c h g e k e n n z e i c h n e t, daß verschiedene Muster mit gleichen Schlüsselzeichen mittels mindestens zwei unterschiedlichen, voneinander unabhängigen Eingabeeinrichtungen (la, 2a, 3a) gleichzeitig eingegeben werden und das Schlüsselzeichen mit der minimalen Fehlerrate mittels der Formel arg opt = arg(min( P g,, )) berechnet wird, wobei gilt: n n error _ V"1 -< v p error r gesamt , _ J J J ,<1. A method for reducing the error rate in pattern recognition, in particular voice recognition, speech script recognition, gesture recognition and biometric recognition, in which patterns with key characters are entered into data processing devices and / or communication devices (5) by means of input devices (la, 2a, 3a), characterized in that different patterns having the same key character by means of at least two different, mutually independent input means (la, 2a, 3a) are entered simultaneously and the key character with the minimum error rate by means of the formula arg opt = arg (min (P g ™,)) is calculated, where: nn error _ V " 1 - < v p error r total, _ YYY, <
mit Pj β°r = Fehlerwahrscheinlichkeit für ein einem Schlüssel- zeichen zugeordneten Berechnungsergebnis i bei Eingabe mittels der Eingabeeinrichtung j ,with P j β ° r = error probability for a calculation result i assigned to a key character when input by means of the input device j,
Cj = Gewichtsfaktor (lb, 2b, 3b) der Eingabe mittels der Eingabeeinrichtung j .Cj = weight factor (lb, 2b, 3b) of the input using the input device j.
2. Verfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, daß alternativ nicht das Ergebnis mit der minimalen kumulierten Fehlerrate gewählt wird, sondern das Ergebnis mit der minimalen Fehlerrate für ein vorgegebenes Verfahren j einzusetzen ist, wobei gilt:2. The method according to claim 1, which also means that, alternatively, the result with the minimum cumulative error rate is not chosen, but the result with the minimum error rate is to be used for a predetermined method j, where:
arg opt = arg(min( Pjyr )) mit festem j .arg opt = arg (min (Pjy r )) with fixed j.
3. Verfahren nach Anspruch 1 , d a d u r c h g e k e n n z e i c h n e t, daß gilt: c j = l • 3. The method according to claim 1, characterized in that: cj = l •
4. Verfahren nach Anspruch 1 oder 3 , d a d u r c h g e k e n n z e i c h n e t, daß die Gewichtsfaktoren (lb, 2b, 3b) vorbestimmt werden.4. The method of claim 1 or 3, d a d u r c h g e k e n n z e i c h n e t that the weight factors (lb, 2b, 3b) are predetermined.
5. Verfahren nach einem der vorangegangenen Ansprüche, insbesondere nach Anspruch 1 oder 3, d a d u r c h g e k e n n z e i c h n e t, daß die Gewichtsfaktoren (lb, 2b, 3b) durch einen Benutzer, der die Muster eingibt, bestimmt werden, wobei dies im Vorhinein erfolgen kann oder aber ein Lernschritt durchgeführt wird, bei dem die Genauigkeit der Verfahren für den spezifischen Benutzer zu bestimmen ist.5. The method according to any one of the preceding claims, in particular according to claim 1 or 3, characterized in that the weight factors (lb, 2b, 3b) are determined by a user who enters the pattern, which can be done in advance or a learning step is carried out in which the accuracy of the procedures for the specific user is to be determined.
6. Verfahren nach einem der vorangegangenen Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß die Berechnungsergebnisse der Fehlerraten in Abhängigkeit von einem der jeweiligen Eingabeeinrichtung (la, 2a, 3a) zugeordneten Eingabeverfahren auf einer Anzeigeeinrichtung der Da- tenverarbeitungseinrichtung und/oder Kommunikationseinrichtung (5) zeitgleich oder zeitverschoben angezeigt werden.6. The method according to any one of the preceding claims, characterized in that the calculation results of the error rates as a function of an input method assigned to the respective input device (1a, 2a, 3a) are displayed on a display device of the data processing device and / or communication device (5) at the same time or with a time shift become.
7. Verfahren nach einem der vorangegangenen Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß die Berechnungsergebnisse der Fehlerraten in Abhängigkeit von einem der jeweiligen Eingabeeinrichtung (la, 2a, 3a) zugeordnetem Eingabeverfahren mit einer Sprachausgabeeinrichtung ausgegeben werden.7. The method according to any one of the preceding claims, that the calculation results of the error rates are output as a function of an input method assigned to the respective input device (la, 2a, 3a) with a speech output device.
8. System zur Reduzierung der Fehlerrate bei Mustererkennungen, insbesondere Spracherkennungen, Sprachschrifterkennungen, Gestikerkennungen und Biometrikerkennungen, mit Eingabeeinrichtungen (la, 2a, 3a) in Datenverarbeitungseinrichtungen und/oder Kommunikationseinrichtungen (5) zum Eingeben von Mustern mit Schlüsselzeichen, g e k e n n z e i c h n e t d u r c h8. System for reducing the error rate in pattern recognition, in particular voice recognition, voice script recognition, gesture recognition and biometric recognition, with input devices (la, 2a, 3a) in data processing devices and / or communication devices (5) for entering patterns with key characters, g e k e n n z e i c h n e t d u r c h
- mindestens zwei unterschiedliche, voneinander unabhängige Eingabeeinrichtungen (la, 2a, 3a) zum gleichzeitigen Eingeben von verschiedenen Mustern mit gleichen Schlüsselzeichen, und - eine Recheneinrichtung zum Berechnen der Schlüsselzeichen mit minimalen Fehlerraten mittels der Formel arg opt = arg(min( P °™t ,,)) < wobei gilt p enor _ r p error mit P T?* = Fehlerwahrscheinlichkeit r gesoml ,1 - ° j X r J.l J''
Figure imgf000013_0001
für ein einem Schlüsselzeichen zugeordnetes Berechnungsergebnis i bei Eingabe mittels der Eingabeeinrichtung j , Cj = Gewichtsfaktor (lb, 2b, 3b) der Eingabe mittels der Ein- gabeeinrichtung j .
- at least two different, independent from each other Input devices (la, 2a, 3a) for the simultaneous input of different patterns with the same key characters, and - a computing device for calculating the key characters with minimal error rates using the formula arg opt = arg (min (P ° ™ t ,,)) <where p enor _ rp error with PT? * = Error probability r total, 1 - ° j X r Jl J ''
Figure imgf000013_0001
for a calculation result i assigned to a key character when input is made using input device j, Cj = weight factor (lb, 2b, 3b) is input using input device j.
9. System nach Anspruch 8 , d a d u r c h g e k e n n z e i c h n e t, daß die Eingabeeinrichtungen (la, 2a, 3a) Einrichtungen zur Spracheingabe und/oder Einrichtungen zur Eingabe von gedruckten Zeichen und/oder Einrichtungen zur Eingabe von Handschriftzeichen und/oder Einrichtungen zur Eingabe von Gestiken und/oder Einrichtungen zur Eingabe von biometrischen Daten umfaßt. 9. System according to claim 8, characterized in that the input devices (la, 2a, 3a) devices for voice input and / or devices for entering printed characters and / or devices for entering handwriting characters and / or devices for entering gestures and / or Includes facilities for entering biometric data.
PCT/EP2001/012454 2000-11-28 2001-10-26 Method and system for reducing the error rate in pattern recognitions WO2002045002A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00125997 2000-11-28
EP00125997.7 2000-11-28

Publications (1)

Publication Number Publication Date
WO2002045002A1 true WO2002045002A1 (en) 2002-06-06

Family

ID=8170511

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2001/012454 WO2002045002A1 (en) 2000-11-28 2001-10-26 Method and system for reducing the error rate in pattern recognitions

Country Status (1)

Country Link
WO (1) WO2002045002A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992005517A1 (en) * 1990-09-26 1992-04-02 Roth Richard G Audio-augmented handwriting recognition
EP0516316A2 (en) * 1991-05-29 1992-12-02 Canon Kabushiki Kaisha Selection agent for a symbol determination system with multiple character recognition processors
US5621809A (en) * 1992-06-09 1997-04-15 International Business Machines Corporation Computer program product for automatic recognition of a consistent message using multiple complimentary sources of information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992005517A1 (en) * 1990-09-26 1992-04-02 Roth Richard G Audio-augmented handwriting recognition
EP0516316A2 (en) * 1991-05-29 1992-12-02 Canon Kabushiki Kaisha Selection agent for a symbol determination system with multiple character recognition processors
US5621809A (en) * 1992-06-09 1997-04-15 International Business Machines Corporation Computer program product for automatic recognition of a consistent message using multiple complimentary sources of information

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"DECODING OF A CONSISTENT MESSAGE USING BOTH SPEECH AND HANDWRITING RECOGNITION", IBM TECHNICAL DISCLOSURE BULLETIN,US,IBM CORP. NEW YORK, vol. 36, no. 1, 1993, pages 415 - 418, XP000333898, ISSN: 0018-8689 *

Similar Documents

Publication Publication Date Title
DE60219943T2 (en) METHOD FOR COMPRESSING DICTIONARY DATA
DE60212976T2 (en) Method and user interface for character input
DE202012005717U1 (en) Character recognition for overlapping user text input
EP1303805A1 (en) Method for a high-speed writing system and high-speed writing device
DE60302875T2 (en) Data processing apparatus and method
DE102015211101A1 (en) Speech recognition system and method for operating a speech recognition system with a mobile unit and an external server
EP2169522A1 (en) Method and device for inputting text
DE4109785C2 (en) Process for preparing dictionary files and for creating application programs, and system for carrying out this process
WO2003058420A2 (en) Method for input of text by selection of letters using a cursor and device for carrying out said method
DE60214850T2 (en) FOR A USER GROUP, SPECIFIC PATTERN PROCESSING SYSTEM
EP1899898A1 (en) Method for selecting a designation
DE112008001763T5 (en) Speech recognition device and navigation system
WO1999048268A1 (en) Mobile communication device
DE102013007914A1 (en) Hand held device and unlocking method of this
DE19851287A1 (en) Data processing system or communication terminal with a device for recognizing spoken language and method for recognizing certain acoustic objects
WO2002045002A1 (en) Method and system for reducing the error rate in pattern recognitions
EP2006835B1 (en) Method for determining a list of hypotheses from a vocabulary of a speech recognition system
DE102004002010B4 (en) Arrangement for voice control of an electronic device, in particular in a motor vehicle
WO2006003087A2 (en) Method for entering characters into a mobile communications device and mobile communications device that is equipped therefor
DE112006001079T5 (en) A method of generating text that satisfies specified characteristics in a portable electronic device and a portable electronic device including the same
DE3928049A1 (en) VOICE-CONTROLLED ARCHIVE SYSTEM
DE102017103533A1 (en) Method and device for text-based preview of the content of audio files
DE10156579C2 (en) Electronic crossword puzzle method and apparatus
EP2407859A1 (en) Dynamic adjustment of a user interface on a sensor monitor
DE102005021526A1 (en) Method and device for entering characters in a data processing system

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase