-
GEBIET DER
ERFINDUNG
-
Diese
Erfindung bezieht sich auf die Bildanalyse beim Lesen von Informationen,
wie zum Beispiel Reagenscodes, insbesondere im Zusammenhang mit
bei der Antibiotikum-Suszeptibilitätsprüfung von Mikroorganismen verwendeten
Vorrichtungen.
-
VORGESCHICHTE DER ERFINDUNG
-
Während vieler
Jahre wurde die Antibiotikum-Suszeptibilitätsprüfung („AST") als ein Mittel zum Identifizieren
bestimmter Gruppen oder Spezies von Mikroorganismen oder zum Identifizieren
eines zum Behandeln einer klinischen Infektion am meisten geeigneten
antibiotischen Typs oder einer am besten geeigneten Dosis verwendet.
Ein Trägervorrichtungen
verwendendes Standardverfahren wurde entwickelt und wird heute international
anerkannt. Im allgemeinen liegt es in der Form von mit bekannten
Mengen bestimmter Antibiotika getränkten Membranscheiben vor.
Diese Scheiben werden in Verbindung mit Petrischalenplatten verwendet, die
eine Schicht eines Wachstumsmediums, zum Beispiel Agargel, enthalten,
dem ein die Mikroorganismen enthaltender Stoff zugeführt wird.
Eine Anordnung aus verschiedene Mengen oder Arten Antibiotika enthaltenden
einzelnen Scheiben werden mit gegenseitigen Abständen auf die Geloberfläche aufgesetzt.
Im allgemeinen werden sechs oder acht Scheiben in einer kreisförmigen Anordnung
auf die Petrischale aufgesetzt. Die Scheiben bestehen normalerweise
aus Papier oder einem anderen porösen blattförmigen Werkstoff. Aus jeder Scheibe
diffundiert das Antibiotikum in das umgebende Wachstumsmedium und
bildet um die Scheibe herum einen radialen Konzentrationsgradienten
aus. Die relative Empfindlichkeit der Mikroorganismen gegenüber dem
Antibiotikum ergibt sich aus dem Durchmesser des die Scheibe umgebenden
Gebiets, in dem das Wachstum der Mikroorganismen inhibiert wird.
Die detaillierte Morphologie des Gebietes kann die Spezies oder
den Genus des vorhandenen Mikroorganismus anzeigen. Eine visuelle
Interpretation der Ergebnisse verlangt damit eine beträchtliche
Erfahrung und Geschick, insbesondere falls die angrenzenden Inhibierungsgebiete
groß genug
sind, um sich zu überlappen.
-
Weltweit
wird AST in sehr großem
Maßstab,
insbesondere in klinischen Labors, eingesetzt. Zum Beschleunigen
und Vereinfachen des Auswertens dieser Untersuchungen wurden verschiedene
Vorschläge
einschließlich
der Bewertung der Ergebnisse mit Verwendung von Bildanalysegeräten gemacht,
wie zum Beispiel einer an ein elektronisches Informationsbearbeitungsmittel,
wie einen Mikroprozessor, angeschlossenen Videokamera. Untersuchungsgeräte dieser
Art sind im Handel erhältlich.
Jedoch selbst mit der heute erhältlichen Ausrüstung besteht
immer noch ein Bedarf an einer beträchtlichen menschlichen Mitwirkung.
-
Da
jede Kulturplatte normalerweise eine recht große Anzahl von Scheiben trägt, von
denen jede mit einer anderen Menge Antibiotikum getränkt sein
kann oder möglicherweise
ein von dem Antibiotikum auf anderen Scheiben der Platte verschiedenes
Antibiotikum trägt,
muß die
Identität
jeder Scheibe unbedingt genau bestimmt werden. Gemäß einem
von der WHO empfohlenen Standard weist jede Scheibe einen gedruckten Code
auf, der das auf der Scheibe befindliche spezifische Antibiotikum
und auch dessen Konzentration identifiziert. Dieser Code enthält eine
mit dem menschlichen Auge leicht lesbare Kombination aus Buchstaben
und Zahlen. Die zurzeit verfügbaren „automatisierten" Abbildungssysteme
verlangen, daß der
Anwender den auf jeder Scheibe befindlichen Code mit seinem Auge
erkennt und diese Information mit der Hand, zum Beispiel mit Hilfe
einer Tastatur, in den elektronischen Prozessor eingibt. Obwohl
es optische Zeichenlesegeräte
gibt, die die gedruckten Buchstaben und Zahlen in eine elektronische
Information umwandeln, müssen
die gedruckten Zeichen mit der Leseeinrichtung genau ausgerichtet
werden, falls das optische Zeichenlesegerät die einzelnen Zeichen genau
wiedererkennen soll. Die bei AST verwendeten Scheiben werden im
allgemeinen mit mechanischen Applikatoren, die die einzelnen Scheiben
aus einer Magazinanordnung herausnehmen, von denen jede einen Stapel
identischer Scheiben hält,
auf die Platten aufgebracht. Zum Steuern der Ausrichtung der Codes
auf den Scheiben, die von dem Applikator auf die Plattenoberfläche fallen,
wurden keine Versuche unternommen. Normalerweise werden die Scheiben
auf der Platte mit einer äußerst willkürlichen
Ausrichtung ihrer gedruckten Codes aufgefunden.
-
Die
US-A-5 618 729 beschreibt ein System zum Bestimmen des Halbmessers
des jede der zahlreichen antibiotischen Scheiben auf einer Platte
umgebenden Inhibierungsgebiets. Das System enthält eine Videokamera und einen
Bildanalysator, der den Ort jeder Scheibe auf der Platte bestimmen
und den Halbmesser des Inhibierungsgebiets ermitteln kann. Jede
Scheibe wird im Zusammenwirken mit ihrem jeweiligen Antibiotikum
durch ihre Relativlage auf der Platte identifiziert.
-
ALLGEMEINE BESCHREIBUNG
DER ERFINDUNG
-
Mit
der Erfindung sehen wir ein verbessertes Bildanalysesystem zur Verwendung
bei AST vor, bei dem jede Scheibe zusätzlich zu dem Reagenscode ein
Mittel trägt,
mit dem der Bildanalysator die Ausrichtung des Codes gegenüber einer
optimalen Leserichtung für
diesen Code bestimmen kann. In Wirklichkeit wird der Code oder sein
Bild gegenüber
dem für
das Lesen des Codes vorgesehenen Mittel in eine kanonische Ausrichtung
gebracht. Zum Beispiel kann jede Scheibe mit einer einfachen kontinuierlichen,
zum Beispiel parallel zu der optimalen Leserichtung des Codes angeordneten
Linie bedruckt werden. Die einfache Linie kann von dem Bildanalysator
erkannt und der elektronische Prozessor so programmiert werden,
daß er
die tatsächliche Leserichtung
nach Maßgabe
einer gegenüber
der beobachteten Linie vorbestimmten Richtung einstellt, zum Beispiel
parallel zu der beobachteten Linie, und damit in die zum genauen
Zeichenlesen des Codes optimalen Richtung. Einzelne Scheiben in
der Anordnung können
mit einer zweckmäßigen Einstellung
der Leserichtung nacheinander gelesen werden. Die Tatsache, daß die Codes
auf den einzelnen Scheiben willkürlich
sowohl in Bezug auf die anfängliche
Leserichtung als auch in Bezug zueinander angeordnet werden können, wird
aufgrund der Fähigkeit
der Leseeinrichtung zum Anpassen der Leserichtung an die für jede einzelne
Scheibe zweckmäßige Richtung
belanglos.
-
Die
Erfindung sieht eine Trägervorrichtung
zur Verwendung bei einer Antibiotikum-Suszeptibilitätsprüfung („AST") vor, die ein die
Prüfung
betreffendes Antibiotikum lösbar
und Informationen bezüglich
des Antibiotikums trägt,
wobei es sich bei der Vorrichtung um eine AST-Scheibe handelt, dadurch
gekennzeichnet, daß die
Informationen einen maschinenlesbaren Code aus einem oder mehreren
Buchstaben und einer oder mehreren Ziffern umfaßt und daß die Vorrichtung außerdem Orientierungsmittel
enthält,
um es einem Bildanalysator zu ermöglichen, eine optimale Leserichtung
der lesbaren Informationen zu bestimmen, wobei die Orientierungsmittel
von dem Code verschiedene Mittel umfassen.
-
Das
Orientierungsmittel kann zum Beispiel eine linear angeordnete Information
aufweisen. Zweckmäßig liegt
diese parallel zu der optimalen Leserichtung des Reagenscodes. Ein
Beispiel für
eine sehr geeignete Form einer linear angeordneten Information ist
eine gedruckte Linie. Diskontinuierliche Linien oder Vielfach-Linien
können
auf Wunsch angewendet werden. Alternativ kann das Orientierungsmittel
ein oder mehrere erkennbare Merkmale, zum Beispiel zwei diametral
entgegengesetzte Einschnitte im Umfang der Scheibe, die zwischen
sich eine Achse ausbildet, von der aus das Lesemittel die richtige
Leseorientierung für
den Scheibencode bestimmen kann, aufweisen. Damit das Lesemittel
richtig unterscheiden kann, ob der Code auch bei richtiger Ausrichtung
mit der Unterseite nach oben angeordnet ist, kann das Orientierungsmittel
zum Beispiel gegenüber
der Leserichtung auf eine Weise versetzt sein, die dem Lesemittel
festzustellen erlaubt, wo die Oberseite des Codes liegen sollte.
Zum Beispiel kann das Orientierungsmittel eine unter dem Code gedruckte Linie,
das heißt
ein „Unterstrich" sein. Damit ist
das Linien- oder ein anderes Orientierungsmittel wünschenswerterweise
gegenüber
dem Mittelpunkt der Scheibe versetzt, so daß diese nicht unabsichtlich
mit der Unterseite nach oben „gelesen" werden kann.
-
Ein
wichtiges Merkmal der Erfindung liegt in einer einen gedruckten
Mehrzeichencode tragenden AST-Scheibe mit einem Orientierungsmittel,
mit dem das den Code lesende Mittel die Ausrichtung des Vielzeichencodes
bestimmen und bei Notwendigkeit die Ausrichtung entweder des gedruckten
Codes oder eines Bildes von diesem derart einstellen kann, daß die erkannte
Ausrichtung mit der für
das richtige Lesen des Mehrzeichencodes notwendi gen Ausrichtung
ausgerichtet werden kann. Das Lesemittel weist vorzugsweise Kamera- und Bildanalysemittel
auf.
-
Vorzugsweise
weist das Orientierungsmittel einen unter dem Mehrzeichencode gedruckten
Unterstrich auf.
-
Eine
weitere Ausführungsform
der Erfindung ist ein Bildanalysesystem zum Interpretieren von AST-Platten,
von denen jede eine Vielzahl von Trägervorrichtungen jeweils in Übereinstimmung
mit irgendeinem der vorhergehenden Ansprüche enthält, wobei das System umfaßt:
Haltemittel
(100) zum Halten einer AST-Platte,
Kameramittel (104, 105)
zum Abbilden einer auf dem Haltemittel (100) gehaltenen
Platte (101) und
elektronische Informationsverarbeitungsmittel
(106), vorzugsweise ein an das Kameramittel angeschlossenes neurales
Netz, dadurch gekennzeichnet, daß das Verarbeitungsmittel programmiert
oder trainiert ist zum
Auffinden einer AST-Scheibe auf der
Platte aus einer Vielzahl von AST-Scheiben,
Identifizieren
der Orientierungsmittel auf der aufgefundenen Scheibe und Drehen
des erkannten Bildes der Scheibe nach Erfordernis, so daß das erkannte
Bild einer auf die Scheibe aufgedruckten, viele Zeichen enthaltenden
Codierung mit der richtigen Leserichtung des Codes in Ausrichtung
gebracht wird, und Lesen der Codierung.
-
Das
Bildanalysesystem bestimmt zusätzlich
wünschenswerterweise
ein sichtbares Charakteristikum, wie zum Beispiel den Durchmesser
des, falls vorhanden, die Scheibe umschließenden Inhibitionsgebietes
und bringt dieses Charakteristikum mit dem Code zusammen. Diese
Bestimmung kann vor, während
oder nach dem Lesen des Codes erfolgen.
-
Das
elektronische Informationsverarbeitungsmittel enthält vorzugsweise
oder ist angeschlossen an ein „Expertensystem" mit einer Datenbasis
aus AST-Charakteristika bekannter Mikroorganismen. Es kann eine Anzahl
von „Expertenregeln" zum Interpretieren
des erkannten Bildes des Inhibitionsgebietes enthalten.
-
Die
Erfindung sieht damit ein AST-Lesesystem oder dergleichen mit der
Fähigkeit
vor, den Reagenscode automatisch zu lesen, diesen Code zu einer
besonderen Reagens-Konzentration in Beziehung zu setzen und diese
Information mit einem Satz von „Expertenregeln" und einer Datenbasis
zu verknüpfen.
Kein im Handel erhältliches
Lesesystem weist diese Fähigkeit
auf.
-
Das
Lesen des Codes auf jeder Scheibe auf der Platte mag für das Lesesystem
nicht notwendig sein. Da die meisten Prüfvorgänge sehr wiederholend und standardisiert
sind, kann das System zum Erwarten bestimmter Kombinationen von
Scheibencodes auf einer Platte, zum Beispiel einer Routinesequenz
von um den Plattenumfang herum angeordneten Scheiben, vorprogrammiert
werden. Bei Identifizierung der Codes auf zum Beispiel zwei der
Scheiben durch das System kann dies für das System ausreichen, die
Anordnung mit einer erwarteten Scheibenanordnung zu vergleichen
und deshalb aus seinem Speicher die Identität des Reagens auf den verbleibenden „ungelesenen" Scheiben auf der
Platte abzuleiten. Bei Notwendigkeit kann der Operator bei Auflegen
der Scheiben auf eine Plattengruppe oder bei Beladen einer Scheibenausgabe
mit zur Anwendung vorbereiteten Scheiben diese Information in das
Lesesystem eingeben.
-
Ein
Beispiel einer wichtigen Zonenmorphologie ist eine Beta-Lactamase-Aktivität, die sich
selbst durch das Wachstum von Flecken oder Minikolonien aus Mikroorganismen
in der Zone sichtbar darstellt.
-
Zweckmäßig weist
das Analysesystem Displaymittel zum Darstellen des Scheibenbildes
auf.
-
Die
Leserichtung läßt sich
einfach zum Beispiel dadurch verstellen, daß die Platte auf einer drehbaren Stütze oder
einem drehbaren Halter dem Lesemittel gegenübergestellt wird, so daß die Drehachse
des Halters senkrecht zur Leseebene verläuft. Nach der Identifikation
des Orientierungsmittels kann das Lesemittel eine Drehung der Stütze oder
des Halters um diese Achse bewirken, soweit es notwendig ist, bis
das Orientierungsmittel in eine vorbestimmte Ausrichtung gebracht
wird und der Scheibencode dann gelesen werden kann. Alternativ kann
die Platte in einer konstanten Lage verbleiben, und die Kamera oder
ein anderes Lesemittel kann, soweit dies zum Verbringen des Codebildes
in die korrekte Leseausrichtung notwendig ist, gedreht werden. Als
eine weitere Alternativ kann sowohl die Platte als auch das Lesemittel
in konstanter Lage verbleiben, und der elektronische Informationsprozessor
kann zum Drehen des von dem Lesemittel gesehenen Bildes bis zum Erreichen
der angemessenen Ausrichtung programmiert oder „trainiert" werden. Das Drehen entweder der Kamera
oder der Platte zum Verbringen der getrennten Glieder aus einer
Vielzahl von Scheiben auf der Platte in eine Blickrichtung zum aufeinanderfolgenden
Lesen kann auch zweckmäßig sein.
Zum Arbeiten mit anderen Informationsanordnungen, wie zum Beispiel
einer linearen Anordnung von ein Reagens tragenden Trägervorrichtungen,
obgleich solche Anordnungen in der sich mit der Mikrobiologie befassenden
Industrie im Augenblick nicht als Standard verwendet werden, können alternative
Geometrien verwendet werden.
-
Die
Erfindung sieht auch einen Bildanalysator zur Verwendung beim Bestimmen
des Ergebnisses einer antibiotischen Suszeptibilitätsprüfung von
Mikroorganismen auf einem Kulturmedium vor mit:
- a)
einem Kameramittel (104, 105) zum Betrachten des
Kulturmediums,
- b) einem an das Kameramittel (104, 105) angeschlossenen
elektronischen Informationsbearbeitungsmittel (106) programmiert
oder trainiert zum Interpretieren jedes Gebiets eines sichtbar veränderten
Mikroorganismus-Wachstums in der Nachbarschaft einer Suszeptibilitätsprüfvorrichtung
mit einer auf dem Kulturmedium vorhandenen Vorrichtung gemäß irgendeinem
der Ansprüche
1 bis 6, dadurch gekennzeichnet, daß das Verarbeitungsmittel auch
dafür programmiert
oder trainiert ist, den Zeichencode auf der Vorrichtung zu lesen,
der das Suszeptibilitätsreagens
in der Vorrichtung angibt, und zum Interpretieren des in oder auf
der Vorrichtung eingeschlossenen Orien tierungsmittels, durch welche
Vorrichtung die optimale Leserichtung des Zeichencodes erkannt werden
kann, und um, nach Notwendigkeit, die tatsächliche Leserichtung einzustellen,
um diese damit mit der tatsächlichen
Orientierung des Zeichencodes auf der Vorrichtung in Übereinstimmung
zu bringen.
-
Das
Lesen des Zeichencodes beruht auf der Erkennung der Struktur. Verwickelt
aufgebaute elektronische Verarbeitungsausrüstung, die neurale Netze verwenden
kann, ist heute erhältlich
und kann so programmiert oder trainiert werden, daß sie mit
den durch das einstellbare Lesesystem der Erfindung auferlegten
Anforderungen zurechtkommt.
-
Bei
Notwendigkeit kann der auf der Scheibe befindliche Zeichencode unter
Verwendung einer Schriftart, die unter Anpassung an die Lesefähigkeit
des Lesemittels ausgewählt
wird, gedruckt werden. Da jedoch die Technologie der Erkennung optischer
Zeichen (OCR) fortschreitet, mag die Notwendigkeit für die Verwendung
einer besonderen Schriftart abnehmen.
-
Es
leuchtet ein, daß,
obwohl der heute Industriestandard die Verwendung von kreisförmigen Scheiben als
Träger
für die
Antibiotika vorsieht, diese Trägerform
für die
Erfindung lediglich zufällig
ist. Andere Trägerformen
können
auf Wunsch verwendet werden.
-
SPEZIFISCHE
BESCHREIBUNG EINER BEVORZUGTEN AUSFÜHRUNGSFORM
-
Nur
als Beispiel wird in den beiliegenden Zeichnungen ein System zum
Bestimmen der Ergebnisse einer Antibiotikum-Suszeptibilitätsprüfung gezeigt
und nachstehend in Einzelheiten beschrieben.
-
1. Kurze Beschreibung
der Zeichnungen
-
1 zeigt
ein allgemeines Layout eines erfindungsgemäßen AST-Scheiben-Lesesystems.
-
2a bis 2c zeigen
die Aufeinanderfolge beim optischen Lesen eines Zeichens in dem
auf einer AST-Scheibe abgelegten Code.
-
2a zeigt
ein typisches Bild eines Zeichens bei Betrachtung durch die Kamera.
-
2b zeigt
einen segmentierten Bit – Plan
des Zeichens.
-
2c zeigt
einen das Zeichen darstellenden binarisierten Vektor. Das Zeichen
wird als ein „A" erkannt.
-
3a bis 3c zeigen
die Stufen beim korrekten Orientieren des Zeichencodes mit Hilfe
eines Unterstrichs.
-
3a zeigt
ein „graues" Abbild der Scheibe.
-
3b zeigt
ein binäres
Abbild des Scheibencodes.
-
3c zeigt
das gedrehte Abbild des Codes.
-
Die 4a bis 4c zeigen
die Aufeinanderfolge beim Auffinden der Lage der Scheiben auf einer AST-Platte.
-
4a zeigt
ein „graues" Abbild der AST-Platte.
-
4b zeigt
das detektierte binäre
Scheiben-Abbild.
-
4c zeigt
das binäre
Abbild der Inhibitionszone.
-
Die 5a und 5b zeigen
ein typisches Ergebnis des erfindungsgemäßen Ermittelns der Halbmesser
der Inhibitionszone.
-
5a zeigt
ein typisches Abbild einer Scheibe mit großen sich überlappenden Inhibitionszonen.
-
5b zeigt
die von einem Rechner erfaßten
Umfänge
der Zonen nach dem Anpassen der Halbmesser an die Abbildungen der
Zonen.
-
6a/b
und 7a/b zeigen die Ergebnisse weiterer Experimente,
die mit den in den 5a/b gezeigten vergleichbar
sind.
-
Gemäß 1 enthält die Vorrichtung
eine von einem Rechner gesteuerte Stufe oder einen von einem Rechner
gesteuerten Halter 100 für eine Petrischale 101.
Die Petrischale wird mit zwei Lichtquellen 102 und 103 ausgeleuchtet
und kann mit zwei Kameras beobachtet werden, von denen die eine
(104) eine hohe Vergrößerung und
die andere (105) eine niedrigere Vergrößerung aufweist. Jede Kamera
ist an ein Bildanalysiersystem (106) angeschlossen. Gemäß der Darstellung
weist dies eine Rechnerkonsole (107), eine Tastatur (108)
und eine visuelle Displayeinheit (109) auf. Der Halter,
die Lichtquellen und die Kameraausrüstung sind normalerweise in
einem Gehäuse
oder einer (nicht gezeigten) Ummantelung angeordnet.
-
In
der folgenden Einzelbeschreibung des erfindungsgemäßen Lesesystems
wird an geeigneten Stellen auf die 2 bis 5 Bezug genommen.
-
2. Bildanalyse
-
2.1 Bilderfassung
-
Die
Kamera bildet ein analoges Signal, das die von der Kamera betrachtete
Szene darstellt. Dieses Signal wird digitalisiert und in einem Rechnerspeicher
als eine Anordnung von Ziffern gespeichert, wobei jedes Element
der Anordnung ein Bildelement (Pixel) darstellt und dessen Wert
die Bildhelligkeit an diesem Punkt in der ursprünglichen Szene be deutet. Im
typischen Fall hat Schwarz einen Wert von Null und reines Weiß einen Wert
von 255. Nach dem Erfassen des Bildes kann dieses wie die Daten
eines Computers behandelt und mit Computerprogrammen bearbeitet
werden. Das Bild läßt sich
dann auf einem Computerschirm unter Verwendung der Pixelwerte zum
Steuern der Helligkeit des Schirms darstellen, und das Ergebnis ähnelt dem
ursprünglichen
analogen Bild.
-
2.2 Schwellwertbildung
zum Segmentieren eines Bildes
-
Schwellwertbildung
ist das Verfahren, bei dem sämtliche
Pixel mit zwischen zwei Grenzwerten liegenden Werten auf maximales
Weiß und
sämtliche
anderen auf Null gesetzt werden. Wir verwenden die Schwellwertbildung
zum Trennen der Objekte (Weiß)
vom Hintergrund (Schwarz), so daß wir die Parameter, wie zum Beispiel
die Große
jedes Objekts, messen können.
Es ist ein zum Implementieren sehr rasch ablaufendes Verfahren.
Die Schwierigkeit liegt in einer Bestimmung der Grenzen, so daß nur die
Interesse aufweisenden Merkmale extrahiert werden. Bei dieser Anwendung
wird die Schwellwertbildung zum Extrahieren der imprägnierten Scheiben,
der Inhibitionszonen und der Zeichencodes verwendet. Eine richtige
Schwellwertbildung ist für
das hier beschriebene Verfahren kritisch und verlangt für das selbsttätige Bestimmen
des Schwellwerts einen Algorithmus, der beträchtliche Schwankungen in der
Bildhelligkeit tolerieren kann.
-
2.3 Selbsttätiges Bestimmen
der Größe des Schwellwerts
-
Die
für die
erfolgreiche Schwellwertbildung bei den verschiedenen Teilen der
Bilder der AST-Platte erforderlichen Helligkeitsstärken werden
zum Beispiel durch die Art des Wuchsmediums und der Bakterien, wie zum
Beispiel auch durch die Beleuchtungsstärke, nachteilig berührt. Ein
Verfahren zum Berechnen der Schwellwertgröße aus dem Bild ist wesentlich,
damit die Gesamtmessung selbsttätig
ablaufen kann. Das implementierte Verfahren ist einigermaßen robust
und führt
in einem weiten Bereich von Bedingungen und ohne Eingriff der Bedienung
zu einer erfolgreichen Segmentierung.
-
Es
gibt viele Verfahren zum automatischen Bestimmen des Schwellwerts,
die für
die Zwecke der Erfindung eingesetzt werden können. Wir haben ein anwendetes
Verfahren gewählt,
das auf dem Verfahren beruht, das von Kittler und anderen in Computer-Vision,
Band 30, 125–147
(1985), erläutert
wird. Dieses Verfahren nimmt an, daß sämtliche in einem Bild vorhandenen
Pixel auf der Grundlage der Stärke
einer von zwei Objektgruppen zugeordnet werden können. Die Objektkanten in dem
Bild sollten immer die Grenze zwischen den beiden Gebieten spreizen.
Durch Verwendung des Kantenbildes als eine Abtastmaske läßt sich
der beste mittlere Pixelwert, der die beiden Gebiete trennt, schätzen. Kittler
und andere zeigten, daß dies
mathematisch wie folgt vorgenommen werden könnte:
Bilde das Kantenbild
aus dem Eingangsbild (E)
Multipliziere das Eingangsbild mit
dem Kantenbild (M)
Dividiere die Summe der Pixelwerte aus (M)
durch die aus (E) zum Erzielen des Schwellwertbetrags
-
3. Das Verfahren
-
Das
physikalische Layout der eingesetzten Ausrüstung bestand aus zwei feststoffladungsgekuppelten (CCD)
Kameras [Hitachi KPM1] mit Linsen von 50 mm bzw. 12,5 mm fester
Brennweite und Betrachtung der Platte vertikal von oben, wie es
in 1 ersichtlich ist.
-
Jede
Platte war über
einem drehbaren Halter angeordnet mit einer darunter befindlichen
schwarzen Lichtfalle. Dies unterstützte das Maximieren des Unterschieds
zwischen dem mikrobischen Wachstum und den Inhibitionszonen.
-
3.1. Auffinden der Scheiben
-
Ein
eine niedrige Vergrößerung aufweisendes
Bild der AST-Platte wird eingefangen. Die Platte kann in jeder Ausrichtung
dargestellt werden, so daß die
Stellen der antibiotischen Scheiben unbekannt sind und die erste
Aufgabe in ihrem Auffinden liegt.
-
Die
Scheiben sind heller als die meisten Teile des Bildes, und der zu
ihrem Selektieren benötigte Schwellwert
wird unter Verwendung des automatischen Algorithmus ermittelt. Das
sich einstellende Bild enthält
Scheiben, kann aber auch einige Artefakte enthalten. Da die Größe der Scheiben
(6 mm Durchmesser) gut bekannt ist, können sämtliche Objekte, die wesentlich
größer oder
kleiner als die Scheiben sind, zurückgewiesen werden.
-
Die
Schwerkraftmittelpunkte der Scheiben werden gemessen und überprüft, um sicherzustellen,
daß sie
innerhalb einer vorgegebenen Toleranz einem erwarteten Schema entsprechen,
zum Beispiel achteckig für acht
Scheiben. Falls die Lage der Scheiben bei diesem Versuch falsch
ist, ist es möglich,
daß eine
Scheibe an einen falschen Ort verbracht wurde und nicht länger im
Mittelpunkt ihrer Inhibitionszone liegt oder daß eins der detektierten Objekte
keine Scheibe ist.
-
3.2 Auffinden und Messen
der Inhibitionszonen
-
Es
wird angenommen, daß die
Inhibitionszonen der dunkelste Teil des Bildes sind. Selbststätige Schwellwertbildung
wird wiederverwendet, aber mit einer neuen Schwellwertgröße zum Ausbilden
eines aus den Inhibitionszonen bestehenden Bildes. Das sich ergebende
Bild kann sehr komplex sein, da zusätzlich zu den Inhibitionszonen
zusätzliche
Objekte durch die Lücken
in dem spiralförmigen Überzug oder
der physikalischen Beschädigung
am Wuchsmedium gebildet werden können.
Ungleich der Aufgabe des Auffindens der Scheiben gibt es keinen
einfachen Weg zum Zurückweisen
der Teile, die keine Inhibitionszonen sind. Das folgende Verfahren
zum Verarbeiten des Bildes arbeitet jedoch innerhalb eines weiten
Bereichs von typischen und nachteiligen Bedingungen sehr gut. Im
wesentlichen überwacht
es, wie gut ein Kreis in die jede Scheibe umschließendes Inhibitionszone
eingepaßt
werden kann als Funktion des Kreishalbmessers unter Annahme des
Halbmessers, an dem das Einpaßkriterium
sehr schnell von Gut zu Schlecht wechselt.
-
Es
wird ein auf eine der Scheiben zentrierter Kreis mit dem Halbmesser
R betrachtet, wobei sämtliche Pixel
in dem „Zonen"bild, die unmittelbar
unter dem Kreis liegen, gezählt werden.
Dies gibt den Wert C. Der Kreis besteht aus Cmax Pixeln.
Falls der Kreis vollständig
innerhalb der Zone liegt, könnte
der Wert von C fast der gleiche wie Cmax sein,
und das Verhältnis
C/Cmax müßte dicht
bei 1 liegen. Falls der Kreis außerhalb der Hauptzonenfläche liegt,
ist C verhältnismäßig klein,
und C/Cmax wird viel weniger als 1 sein.
Ein Ungleich-Null-Wert außerhalb
der Zone kann aufgrund des Schneidens mit benachbarten Zonen, Lücken in
dem spiralförmigen Überzug oder
einem anderen Artefakt im Bild der Zonen auftreten. Falls der Halbmesser
derart ist, daß der
Kreis dicht an der Kante der Zone liegt, wird C/Cmax bei
irgendeinem Zwischenwert liegen und ändert sich bei kleinen Änderungen
im Halbmesser rasch.
-
Der
Algorithmus besteht aus dem Messen des C/Cmax-Verhältnisses
als eine Funktion des Halbmessers und erlaubt für sämtliche Teile des Kreises,
die außerhalb
der Grenzen der Musterplatte fallen, und es wird damit der Punkt
gefunden, an dem das C/Cmax-Verhältnis am
schnellsten abfällt.
Dies entspricht sehr gut dem visuellen Plazieren des besten Paßkreises.
-
Über einem
weiten Bereich von Mustern und über
einem weiten Bereich von Beleuchtungsbedingungen durchgeführte Prüfungen zeigen,
daß dieses
Verfahren durchgängig
annehmbare Ergebnisse liefert. Fehler waren selten und erfolgten
unweigerlich aufgrund einer schlechten Segmentierung der Zonen.
Die 5a und 5b zeigen
das Verhalten auf einem Muster mit einer hohen Überlappung. Ein weiteres Beispiel
ist in den 6a/b zu sehen.
-
Tabelle
1 zeigt die Ergebnisse des Testens der Reproduzierbarkeit der eingepaßten Halbmesser
unter Verwendung einer willkürlichen
Auswahl von Musterplattenausrichtungen. Die Standardabweichung ist
die Ungewißheit
in einem einzigen Halbmesserwert. Dies ist hier der übliche Fall.
Die Präzision
des Verfahrens liegt damit bei etwa ±0,2 mm.
-
Tabelle
1: Tests mit der Reproduzierbarkeit von Zonengrößenmessungen
-
3.3 Finden und Lesen der
Scheibencodes
-
Zum
Vereinfachen der Aufgabe der Code-Erkennung wurden Scheiben mit
den folgenden Code-Charakteristika hergestellt:
Groteskschrift
mit gleichem Abstand „mono-spaced 'sans serif' font": Konsistenter Abstand
zwischen den Zeichen ermöglicht
Prüfungen,
die durch unterbrochene und unvollständige Zeichen entstandene Schwierigkeiten lösen können. Das
Fehlen von Serifen „serifs" vermindert eine
mögliche
Verknüpfung
benachbarter Zeichen.
Unterstrichbalken „underline bar": Dies ist eine kleine
gerade Linie unter den Codezeichen. Es bildet sich ein Objekt, das
die Orientierung des gedruckten Codes bestimmt, so daß das Bild
in eine konsistente Orientierung gedreht werden kann. Dies vereinfacht
die Erkennung des Codes beträchtlich.
-
Ein
Bild jeder Scheibe wird von der eine hohe Verstärkung aufweisenden Kamera eingefangen,
da das eine niedrige Verstärkung
aufweisende Bild keine zum Detektieren der Zeichen ausreichende
Auflösung
bietet. Eine selbsttätige
Schwellwertbildung wird zum Extrahieren gerade der gedruckten Zeichen
aus dem Eingangsbild verwendet. Sämtliche Objekte werden gemessen,
und das Unterstrich-Zeichen wird als das Objekt mit dem größten Längen/Breiten-Verhältnis ermittelt.
Unter Verwendung der Orientierung des Unterstrichs wird der Drehwinkel
zum Darstellen der Zeichen in der normalen aufrechten Form errechnet.
Die Drehung der Zeichencodes wird weiter unten erörtert. Nachprüfungen werden
an den einzelnen Objekten vorgenommen, so daß die Teile eines fragmentierten
Zeichens genau zusammengesetzt werden können. Ein 32 × 32-Pixel-Gebiet um
jedes potentielle Zeichen wird auf 16 × 16 Pixel herabgesetzt und
dem neuralen Netzmodul zugeleitet.
-
Das
neurale Netzmodul führt
eine aus drei Zeichen bestehende Liste zurück und übergibt die drei engsten Zeichen
an das zugeführte
Muster. Die zurückgeführten Zeichenanpassungen
für jedes
detektierte Objekt werden zum Aufbau des gesamten Codes für die unter
Prüfung
stehende Scheibe verwendet. Mit Verwendung der Vertrauensdaten und
der drei Möglichkeiten
für jedes
Zeichen wird eine Liste möglicher
Codes generiert und mit einer Datenbasis gülter Codes abgeglichen. Dies
ermöglicht
die Erholung des automatisierten Vorgangs von kleineren Fehlern,
die vielleicht durch eine schlechte Zeichendefinition, aber für eine Anzeige wichtige
Fehler, verursacht wurden.
-
3.4 Sich drehende Zeichencodebilder
-
Der
Unterstrich wird zum Berechnen der Orientierung der Zeichencodes
und damit des Drehwinkels zum Erreichen einer normalen aufrechten
Orientierung verwendet. Die Orientierung des Unterstrichs führt zu zwei
180° auseinanderliegenden
Lösungen,
wobei die richtige dadurch erreicht wird, daß berechnet wird, wo sich die
Zeichenobjekte gegenüber
dem Unterstrich befinden. Der Unterstrich kann aufgebrochen werden,
falls die Druckqualität
schlecht aller die Schwellwertgöße unrichtig
eingestellt wurde. Falls dies geschieht, kann das größte Fragment
immer noch ausreichend groß zur
Registrierung als Unterstrich sein. Falls dies nicht zutrifft, wird
stattdessen eins der Zeichenobjekte ausgewählt, und der Drehwinkel wird
fehlerhaft sein. Nachprüfungen an
den Positionen des Zeichenobjekts ergeben den Fehler, und eine weitere
Bearbeitung wird vermieden.
-
Das
Unterstrichzeichen und seine Bestandteile, falls sie gebrochen sein
sollten, müssen
nicht wie Zeichenobjekte behandelt werden. Dies wird durch Entfernen
sämtlicher
mit dem Unterstrichzeichen (innerhalb einer gegebenen Toleranz)
kolinearer Objekte erreicht. Zum Deuten der Codes, wie sie gedruckt
sind, ist das Bestimmen der Reihe, aus der jedes Zeichen kommt,
wesentlich. Sie werden durch Vergleich der einzelnen Schwerpunktzentren
mit dem Mittelwert sämtlicher
Zeichen entweder der oberen oder der unteren Reihe zugeordnet.
-
Wie
bei dem Unterstrichzeichen ist es möglich, fragmentierte oder gebrochene
Zeichenobjekte zu erhalten. Das Zurückweisen irgendeines Objekts
auf der Grundlage der Größe ist nicht
klug. Sämtliche
potentiellen Zeichenobjekte werden zum Bestimmen, ob sich irgendwelche
horizontal überlappen
oder ob sie schmaler als die erwartete Breite (etwa 32 Pixel) sind,
miteinander verglichen. Falls eine Fragmentierung festgestellt wird,
werden die Fragmente im allgemeinen eindeutig gruppiert und als
ein einziges Zeichenobjekt behandelt. Dies bildet die bestmögliche Eingabe
für das
neurale Netz und verbessert die Aussichten für eine richtige Auslegung.
-
Die 3a, 3b und 3c zeichen
Beispiele des einen grauen Pegel aufweisenden Ausgangsbildes, den
Schwellwertcode mit Unterstrich und das endgültige gedrehte Code-Bild.
-
4. Neurale
Netzwerke für
die optische Zeichenerkennung
-
Ein
künstliches
neurales Netz wird zum Erkennen der Zeichen auf der Suszeptibilitäts-Scheibe verwendet.
Von entscheidender Bedeutung ist der Grad des Vertrauens in die
Zeichenerkennung.
-
4.1 Künstliche neurale Netze und
Strukturerkennung
-
Die
Aufgabe des Erkennens eines Zeichens ist im wesentlichen eine Strukturerkennungsaufgabe (2a–2c).
Jeder Buchstabe in dem Bild einer Suszeptibilitäts-Scheibe wird isoliert, zentriert
und in eine annähernd
aufrechte Stellung gedreht. Dieses Bild wird in eine Aufeinanderfolge
von Nullen und Einsen gespeichert, und aufgrund des Rauschens weist
jeder bestimmte Buchstabe eine große Zahl von verschiedenen Aufeinanderfolgen
auf. Die Aufgabe der Strukturerkennung liegt in dem Auffinden eines
Algorithmus, der mit einer neuen Struktur oder einer Aufeinanderfolge
von Nullen und Einsen bestimmt, welchem Buchstaben er am nächsten kommt.
-
Ein
künstliches
neurales Netz ist ein Rechenalgorithmus, der auf der Funktion und
Architektur des Gehirns beruht, mit vielen hochgrade miteinander
verbundenen, aber kleinen Verarbeitungseinheiten. Er eignet sich
sehr zur Strukturerkennung.
-
Über erlernte
Vektorquantisation oder LVQ wird in T. Kohonen, Self-Organisation
and Associative Memory, Springer-Verlag, 1984, berichtet. Jede beispielsweise
Struktur kann als ein Punkt in einem eine hohe Dimension aufweisenden
Vektorraum angesehen werden. LVQ arbeitet durch Ausbilden eines
(oder mehrerer) Stellvertreter für
jedes Zeichen. Während
des Trainings wird jeder Stellvertreter in eine Stellung verschoben, so
daß jedes
Zeichen seinem Stellvertreter näher
als dem Stellvertreter eines anderen Zeichens ist. Während der
Laufzeit des Betriebs wird jede neue Struktur, die dem LVQ vorgestellt
wird, danach klassifiziert, welchem Stellvertreter sie am nächsten ist.
-
Das
neurale Netz wurde dadurch „trainiert", daß man ihm
beispielsweise Strukturen gab und die Gewichte iterativ adaptierte.
Hundert beispielweise Strukturen für jeden Buchstaben und jede
Zahl wurden von einem Ausdruck auf einer trockenen Probenkarte generiert.
Diese 3.600 Muster (36 Buchstaben + Zahlen × 100 Beispiele) wurden in
zwei Hälften
aufgeteilt mit 50 beispielsweisen Strukturen jedes Zeichens. Das
neurale Netz wurde mit den ersten 1.800 trainiert, das heißt, es „lernte", wie die Buchstaben
und Ziffern in diesen Beispielen erkannt werden konnten. Als ein
Test wurde das neurale Netz dann mit den anderen 1.800 Beispielen präsentiert.
-
4.2. Neurales Netzverhalten
auf realen Plattenbildern
-
Die
Bilder der zum Trainieren und Testen des neuralen Netzes verwendeten
Zeichen wurden von mit antimikrobischen Agenscodes bedruckten Musterkarten
eingefangen. Zum Vergleich sei gesagt, daß die auf typischen Scheiben
bei wirklicher Verwendung erwartete Druckqualität verschlechtert wird durch:
- (a) Imprägnieren
mit einem antimikrobischen Agens und anschließendes Trocknen.
- (b) Zusammenbringen mit dem Kulturmedium während des Suszeptibilitäts-Tests.
-
Es
war wesentlich, die Auswirkungen dieser Verschlechterung beim neuralen
Netzverhalten durch die Bearbeitung der Bilder von Scheiben, die
bei „realen" Suszeptibilitätstests
verwendet wurden, einzuschätzen. Die
bei diesen Tests verwendeten Proben waren in Bezug auf Zahl und
im Bereich der Zeichen, bestehend aus sieben Beispielen der fünf Codes
FR100, RD2, CAZ30, MEZ30 und N10, einem Total von 147 Zeichen, begrenzt.
-
Das
neurale Netz erkannte 146 richtig. Es versagte bei einem Beispiel
mit MEZ30, wo das erst-, das zweit- und drittbeste Erraten für das Zeichen „0" (Null) 8,0 bzw.
6 war. Sämtliche
waren als „möglich" klassifiziert mit
Anzeige eines Rauschbildes. Bei Verwendung dieses dreimaligen Ratens
könnte
der vollständige Code
MEZ38, MEZ30 oder MEZ36 gewesen sein. Ein Vergleich mit der gültigen Codeliste
schaltet jedoch den ersten und den dritten aus, und es verbleibt
MEZ30 als die richtige Antwort.