DACH - Jahrestagung 2004 Salzburg

ZfP in Forschung, Entwicklung und Anwendung

Start > Beiträge > Vorträge > Simulation 2: Print

Eine neue Methode der Musterklassierung in der digitalen Bildverarbeitung

Dr. rer. nat. Günther Coen
Betriebsforschungsinstitut, VDEh-Institut für angewandte Forschung GmbH
Sohnstraße 65, D-40237 Düsseldorf, Deutschland
Kontakt: Dr. rer.nat. Günther Coen

Kurzfassung:

Die Bedeutung invarianter Bildbeschreibungs-Merkmale für die Mustererkennung und Musteranalyse in der digitalen Bildverarbeitung (DBV) wird dargelegt.

Vorgestellt wird ein neues, systematisches Verfahren zur Mustererkennung und Musterklassierung in der DBV. Es arbeitet universell und ist somit bei der Merkmalsgewinnung nicht an fallspezifische Heuristiken gebunden.

Das Verfahren eignet sich daher zur Analyse aller Arten von Bildern und kann daher im Bereich der optischen Oberflächeninspektion ebenso eingesetzt werden, wie etwa bei der Qualitätssicherung, der Textur-, Form- und Konturanalyse, der Photogrammetrie, der Zeichen- und Schrifterkennung, der Personenerkennung, der Robot-Vision oder der Auswertung von radiographischen oder radioskopischen Bildern, Ultraschall-Bildern und Kernspin-Tomographien.

Das Verfahren basiert auf der Berechnung einer Folge von beliebig vielen, funktional unabhängigen Merkmalen der separierten, beschränkten, ebenen Objekte im jeweils vorliegenden Bild, die gegenüber allen Kongruenz- und Ähnlichkeitstransformationen invariant sind.

Alle relevanten invarianten Merkmale eines separierten, beschränkten, ebenen Objekts im Bild generieren dann einen Merkmalsvektor in einem beschränkten, n-dimensionalen Teilbereich ("Einheits-Hyperwürfel") des n-dimensionalen, euklidischen Merkmalsraums n.

Die Musterklassierung geschieht schließlich durch problemspezifische Clusterung dieses ndimensionalen Einheits-Hyperwürfels.

Die Vorteile des Verfahrens im Vergleich zu bekannten Verfahren der Mustererkennung und Musterklassierung werden erörtert und an Beispielen von radioskopischen Bildern aus der Gussteil- und Schweißnahtprüfung demonstriert.

Hinweis auf besondere Bedeutung: Universelles Verfahren der Mustererkennung und Musterklassierung, das nicht an fallspezifische Heuristiken gebunden ist

Stichworte: Selektive Merkmale als Invarianten von Mustern, Bildanalyse, Objekterkennung, Berechnung einer Folge von dimensionslosen, skalaren Formmerkmalen, Klassierung

1. Einleitung: Grundbegriffe der Digitalen Bildverarbeitung

Ein zentrales Ziel der Digitalen Bildverarbeitung (DBV) ist es, dem Computer das Sehen beizubringen ("Computer Vision"). Zum Erreichen dieses Zieles müssen zahlreiche Probleme aus den Bereichen Digitale Signalverarbeitung, Mustererkennung, Künstliche Intelligenz und Sensorik gelöst werden. Dazu sind fundierte Kenntnisse in den Wissenschaften Mathematik, Physik, Informatik und Technik erforderlich.

Die DBV gliedert sich in fünf Teilgebiete: Bildvorverarbeitung, Bildanalyse, Analyse von Bildfolgen, Bildarchivierung und Imaging.

Unter Bildvorverarbeitung versteht man die computergestützte Verbesserung der Qualität ("Aufbereitung": Entrauschung, Glättung) des jeweiligen digitalen Bildes zur leichteren visuellen Wahrnehmung des Informationsgehaltes dieses Bildes für den menschlichen Betrachter.

Unter Bildanalyse versteht man die computergestützte Auswertung des Informationsgehaltes des jeweiligen digitalen Bildes durch automatisches und reproduzierbares Strukturieren, Erkennen und Verstehen dieses Bildes.

Unter der Analyse von Bildfolgen versteht man die computergestützte Auswertung des Informationsgehaltes der jeweiligen Folge von digitalen Bildern durch automatisches und reproduzierbares Strukturieren, Erkennen und Verstehen aller Einzelbilder dieser Folge und durch automatisches und reproduzierbares Verstehen des Kontextes der Abfolge der Einzelbilder dieser Bildfolge.

Unter Bildarchivierung versteht man die computergestützte Kompression und Speicherung von digitalen Bildern zusammen mit indizierenden Suchdeskriptoren aus einem kontrollierten Vokabular.

Unter Imaging versteht man die computergestützte Erzeugung synthetischer Graphiken und digitaler Bilder zur Visualisierung und Erläuterung des Informationsgehaltes komplexer Prozesse auf Bild- und Symbolebene für den menschlichen Betrachter.

In diesem Vortrag befasse ich mich nur mit der Bildanalyse.

Die Bildanalyse zerfällt in drei Teilbereiche: Segmentierung, Objekterkennung und Bildverstehen.

Unter Segmentierung versteht man das automatische und reproduzierbare Strukturieren des jeweiligen digitalen Bildes durch Separieren der für die Analyse des Bildes relevanten Objekte voneinander und vom Bildhintergrund.

Unter Objekterkennung versteht man das automatische und reproduzierbare Erkennen der separierten Objekte durch Klassifikation.

Das Bildverstehen kann aufgefasst werden als das automatische und reproduzierbare Verstehen des jeweiligen digitalen Bildes durch Kontextbewertung der erkannten, separierten Objekte.

In diesem Vortrag befasse ich mich nur mit der Objekterkennung.

Die Objekterkennung kann aufgefasst werden als ein Teilgebiet der Mustererkennung und zwar als das Teilgebiet der Mustererkennung, das als Muster nur ebene Objekte in Bildern zulässt.

Bilder lassen sich anhand des Definitionsbereichs der Bildfunktion unterteilen in kontinuierliche Bilder und diskrete Bilder.

Der Definitionsbereich der Bildfunktion eines kontinuierlichen Bildes ist eine offene Teilmenge der euklidischen Ebene .

In diesem Vortrag befasse ich mich nur mit kontinuierlichen Bildern. Nur für sie gelten die Aussagen zur Mustererkennung des noch vorzustellenden neuen, systematischen Verfahrens in mathematischer Strenge. Für diskrete Bilder gelten die entsprechenden Aussagen wegen des Diskretisierungsrauschens dagegen nur näherungsweise.

Bilder lassen sich anhand des Wertebereichs der Bildfunktion unterteilen in Farbbilder, Grauwertbilder und Binärbilder.

Der Wertebereich der Bildfunktion eines Binärbildes ist ohne Beschränkung der Allgemeinheit gegeben durch = {0, 1}.

In diesem Vortrag befasse ich mich nur mit Binärbildern. Die Ergebnisse des noch vorzustellenden neuen, systematischen Verfahrens lassen sich aber in mathematischer Strenge auf Grauwert- und Farbbilder verallgemeinern.

Unter einem ebenen Objekt in einem kontinuierlichen Bild versteht man eine offene Teilmenge des Definitionsbereiches " der Bildfunktion , das heißt: . Unter einem beschränkten, ebenen Objekt in einem kontinuierlichen Bild versteht man eine beschränkte, offene Teilmenge des Definitionsbereiches " der Bildfunktion , das heißt: . In diesem Vortrag befasse ich mich nur mit der Erkennung separierter, beschränkter, ebener Objekte.

2. Grundlagen der Mustererkennung

Ein Muster ist im Allgemeinen eine vektorwertige Funktion einer vektorwertigen Variablen: g:

Beispiele für Muster sind: ein gesprochener Satz, ein von Hand geschriebener Satz und das zweidimensionale Projektionsbild einer Fernsehkamera.

Ein gesprochener Satz resultiert in einer skalaren Funktion f(t) der skalaren Variablen Zeit t. Als Sensor zur Aufnahme der skalaren Funktion f(t) kann ein Mikrophon dienen.

Ein von Hand geschriebener Satz, der mittels eines Scanners als Sensor in ein zweidimensionales Grauwertbild transformiert worden ist, resultiert in einer skalaren Funktion f(x, y) einer vektoriellen Ortsvariaben mit den zweidimensionalen Bildkoordinaten (x, y).

Eine Fernsehkamera liefert ein zweidimensionales Projektionsbild einer dreidimensionalen bewegten Szene in Form eines Musters (fr(x, y, t ), fg(x, y, t ), fb(x, y, t)) in den drei Farbkanälen rot, grün und blau. Durch die Projektion werden die dreidimensionalen Weltkoordinaten (xw, yw, zw) dabei in die zweidimensionalen Bildkoordinaten (x, y) transformiert.


Abb 1: Beziehung zwischen der realen Welt und der Bildwelt

Wie am letzten Beispiel anschaulich klar wird, muss man immer, wenn man etwas bildlich darstellt, unterscheiden zwischen der realen Welt und der Bildwelt (siehe Abbildung 1): Die reale Welt enthält die realen, physikalischen Körper (etwa Häuser und Bäume in einer Landschaft) im realen physikalischen Raum. Die Bildwelt ist die Projektion der realen Welt, zum Beispiel auf die Bildpunkte eines Monitors: Sie enthält nur ebene Objekte.

Wie anhand der obigen drei Beispiele deutlich wird, umfasst der Begriff Muster also eine Vielfalt von Erscheinungen, deren Gemeinsamkeit die Aufnahme eines in einer Anwendung interessanten Sachverhalts durch einen geeigneten Sensor ist.

Die Mustererkennung ist definiert als die Theorie der bestmöglichen Zuordnung eines unbekannten Musters zu einer Bedeutungsklasse ("Äquivalenzklasse"). Den Vorgang der Zuordnung nennt man Klassifikation. Die Mustererkennung beschäftigt sich ganz allgemein mit den mathematischen Methoden zur Verarbeitung und Auswertung von Mustern sowie deren technischer Umsetzung in automatische Systeme.

Zentrale Aufgabe der Mustererkennung ist die Ermittlung eindeutig definierter Eigenschaften dieser Muster. Jede eindeutig definierte Eigenschaft eines Musters heißt Merkmal. Der konkrete Wert, den ein Merkmal hat, beziehungsweise die konkrete Kategorie, die ein Merkmal aufweist, heißt Merkmalsausprägung. Die Ermittlung der relevanten Merkmale eines beliebigen Musters heißt Merkmalsextraktion.

3. Objekterkennung

Für die Objekterkennung, das heißt, für das automatische und reproduzierbare Erkennen von separierten, beschränkten, ebenen Objekten in Bildern sind Verfahren erforderlich, die von diesen separierten, beschränkten, ebenen Objekten Merkmale extrahieren.

Die extrahierten Merkmale sind komprimierte Informationen, die das jeweilige separierte, beschränkte, ebene Objekt beschreiben und somit seine semantische Information repräsentieren. Anhand der extrahierten Merkmale können dann qualitative und quantitative Aussagen über das jeweilige separierte, beschränkte, ebene Objekt gemacht werden: Es kann in Kategorien eingeordnet und somit klassiert werden.

Der Vorgang der Merkmalsextraktion und Klassierung, der im Rahmen der Objekterkennung beim Menschen scheinbar einfach abläuft, führt bei der technischen Realisierung oft zu Problemen. Im Gegensatz zu Erkennungsleistung und Erkennungsgeschwindigkeit des Menschen sind die von technischen Systemen derzeit noch gering.

Demgegenüber steht aber die präzise objektive Messung in Bezug auf die quantitativen Bereiche, wie zum Beispiel die Größenbestimmung oder das Zählen von Objekten. Hier kann das visuelle Erkennungssystem des Menschen nur ungenaue und relative Angaben treffen.

Merkmale lassen sich mit Hilfe der mathematischen Statistik unterteilen in nominale, ordinale und metrische Merkmale.

Ein Merkmal heißt nominales Merkmal dann und nur dann, wenn die möglichen Merkmalsausprägungen nur nach dem Kriterium "gleich oder verschieden" klassifiziert werden können.

Ein Merkmal heißt ordinales Merkmal dann und nur dann, wenn die möglichen Merkmalsausprägungen nach dem Kriterium "gleich oder verschieden" klassifiziert werden können und darüber hinaus nur noch in eine natürliche auf- oder absteigende Rangfolge gebracht werden können. Häufig wird diese Rangfolge der Ausprägungen durch natürliche Zahlen ("Ordinalzahlen") ausgedrückt, die dann als Rangzahlen bezeichnet werden. Ordinale Merkmale sind invariant in Bezug auf streng monoton steigende (= "isotone") Transformationen.

Ein Merkmal heißt metrisches Merkmal dann und nur dann, wenn die möglichen Merkmalsausprägungen nach dem Kriterium "gleich oder verschieden" klassifiziert und in eine natürliche auf- oder absteigende Rangfolge gebracht werden können und wenn darüber hinaus ein sinnvoller Abstand zwischen je zwei verschiedenen Merkmalsausprägungen definiert werden kann. Metrische Merkmale sind invariant in Bezug auf positive Lineartransformationen.

Ein Beispiel für nominale Merkmale bei der Objekterkennung ist die Kategorie Körperbezeichnung, das heißt, die Bezeichnung der realen, physikalischen Körper in der realen Welt, deren Projektionen die zu erkennenden, ebenen Objekte sind. Die zugehörige nominale Merkmalsausprägung ist dann der konkrete Name des jeweiligen Körpers.


Abb 2:
Röntgenbilder von Schweißnähten

Bezogen auf Röntgenbilder von Schweißnähten sind (siehe Abbildung 2) also die Fehlertypen "Riss", "ungenügende Durchschweißung", "Bindefehler", "Schlacke", "Schlackenzeile", "Pore", "Schlauchpore", "Wurzelkerbe", "Wurzelfehler", "Schwermetalleinschluss" und "Kantenversatz" nominale Merkmalsausprägungen.

Ein Beispiel für ordinale Merkmale bei der Objekterkennung ist die Kategorie Produktgüteklasse, das heißt, die Klasse, in welche die realen, physikalischen Körper in der realen Welt einsortiert werden, deren Projektionen die zu erkennenden, ebenen Objekte sind.
Die zugehörige ordinale Merkmalsausprägung ist dann die konkrete Ordinalzahl, mit der die Güte des jeweiligen Körpers qualifiziert wird.

Bezogen auf Röntgenbilder von Schweißnähten ist somit die Güteklasse 1 für eine fehlerfreie Schweißnaht eine ordinale Merkmalsausprägung.

Beispiele für metrische Merkmale bei der Objekterkennung sind die geometrischen Merkmale, die densitometrischen Merkmale und die Texturmerkmale.

Geometrische Merkmale sind alle Charakteristika (Winkel, Längen, Krümmungsradien, Flächen) der geometrischen Gestalt oder Form des jeweiligen realen, physikalischen Körpers in der realen Welt, dessen Projektion das zu erkennende, separierte, beschränkte, ebene Objekt im jeweiligen Bild ist.

Viele reale, physikalische Körper in der realen Welt reflektieren auffallende und emittieren eigene elektromagnetische Strahlung. Densitometrische Merkmale sind metrische Merkmale der zugehörigen separierten, beschränkten, ebenen Objekte im jeweiligen Projektionsbild. Sie liefern daher indirekt Informationen über das Reflexions- und Absorptionsvermögen des jeweiligen realen, physikalischen Körpers in der realen Welt in Abhängigkeit von der Wellenlänge.

Viele reale, physikalische Körper in der realen Welt haben eine Oberflächentextur. Texturmerkmale sind metrische Merkmale der jeweils zugehörigen, separierten, beschränkten, ebenen Objekte im jeweiligen Projektionsbild. Sie liefern daher indirekt Informationen über die Oberflächenbeschaffenheit des jeweiligen realen, physikalischen Körpers in der realen Welt.

Nominale, ordinale und metrische Merkmale bilden in dieser Reihenfolge eine aufsteigende Hierarchie in dem Sinne, dass der Informationsgehalt der Merkmale zunimmt. Von jetzt an befasse ich mich in diesem Vortrag nur noch mit metrischen Merkmalen.

4. Metrische Merkmale als Instrumente der Objekterkennung in der DBV

Ein metrisches Merkmal ist eine Invariante einer tensoriellen oder pseudotensoriellen physikalischen Größe. Es lässt sich darstellen als Produkt aus einer reellwertigen Maßzahl und einer im Regelfall dimensionsbehafteten Maßeinheit. Metrische Merkmale sind invariant in Bezug auf den Wechsel der Maßeinheit. Die Ermittlung der Merkmalsausprägung eines metrischen Merkmals für ein beliebiges Muster heißt Messung.

Unter den metrischen Merkmalen sind zwei Teilmengen von besonderem Interesse: skalare und pseudoskalare metrische Merkmale.

Ein metrisches Merkmal heißt skalares metrisches Merkmal dann und nur dann, wenn seine Merkmalsausprägung für ein beliebiges Muster invariant bezüglich Koordinateninversion ist.

Ein metrisches Merkmal heißt pseudoskalares metrisches Merkmal dann und nur dann, wenn seine Merkmalsausprägung für ein beliebiges Muster bei Koordinateninversion sein Vorzeichen umkehrt.

Die metrischen Merkmale, die bei der Mustererkennung im Rahmen der Objekterkennung in der DBV vorkommen, lassen sich mit Hilfe der Mathematik weiter unterteilen in: Lagemerkmale, Ausrichtungsmerkmale, Größenmerkmale und Formmerkmale.

Ein metrisches Merkmal heißt Lagemerkmal dann und nur dann, wenn seine Merkmalsausprägung für ein beliebiges Muster nicht translationsinvariant, nicht rotationsinvariant und nicht skaleninvariant ist.

Ein metrisches Merkmal heißt Ausrichtungsmerkmal dann und nur dann, wenn seine Merkmalsausprägung für ein beliebiges Muster zwar translationsinvariant und skaleninvariant, nicht aber rotationsinvariant ist.

Ein metrisches Merkmal heißt Größenmerkmal dann und nur dann, wenn seine Merkmalsausprägung für ein beliebiges Muster zwar translationsinvariant und rotationsinvariant, nicht aber skaleninvariant ist.

Ein metrisches Merkmal heißt Formmerkmal dann und nur dann, wenn seine Merkmalsausprägung für ein beliebiges Muster translationsinvariant, rotationsinvariant und skaleninvariant ist.

Lagemerkmale, Ausrichtungsmerkmale, Größenmerkmale und Formmerkmale bilden in dieser Reihenfolge eine aufsteigende Hierarchie in dem Sinne, dass der Selektionsgehalt der Merkmale zunimmt.

Als Fazit der bisherigen Ausführungen lässt sich feststellen:

  • Merkmale sind selektiv, wenn sie Invarianten eines Musters sind.
  • Zentrale Aufgabe der Mustererkennung im Rahmen der Objekterkennung in der DBV ist die Extraktion von metrischen Merkmalen, insbesondere von skalaren und pseudoskalaren Formmerkmalen, aus jedem der zuvor separierten, beschränkten, ebenen Objekte eines Bildes.

In der Theorie der Mustererkennung lassen sich zentrale mathematische Sätze von großer Allgemeinheit über Muster herleiten. Einer dieser Sätze lautet:

Nur nichtlineare Operatoren können von beschränkten Äquivalenzklassen Invarianten bilden.

Für die Mustererkennung im Rahmen der Objekterkennung in der DBV folgt aus obigem Satz speziell:

Nur nichtlineare Operatoren können von beschränkten, ebenen Objekten Formmerkmale erzeugen.

Außerdem gelten für die Objekterkennung in der DBV nachstehende vier mathematischen Sätze:

  • Jedes beschränkte, ebene Objekt hat genau zwei Freiheitsgrade der Lage. Als Lagemerkmale können die kartesischen Schwerpunktskoordinaten (xs, ys) dienen.
  • Jedes beschränkte, ebene Objekt hat genau einen Freiheitsgrad der Ausrichtung. Als Ausrichtungsmerkmal kann der Neigungswinkel Θ der Hauptträgheitsachse gegen die x-Achse dienen.
  • Jedes beschränkte, ebene Objekt hat genau einen Freiheitsgrad der Größe. Als skalares Größenmerkmal kann die Fläche A dienen.
  • Bezeichnet man die Anzahl der Freiheitsgrade der Form mit f, dann gilt für jedes beschränkte, ebene Objekt die Ungleichungskette: 0 ≤ f le +∞. .

Der letzte dieser vier Sätze impliziert unter anderem die Aussage, dass es beschränkte, ebene Objekte von beliebig hoher Komplexität gibt, zu deren Klassierung man abzählbar unendlich viele Formmerkmale benötigt.

Als Beispiel für ein solches beschränktes, ebenes Objekt von beliebig hoher Komplexität kann jede beliebige Teilmenge der Mandelbrotmenge (siehe Abbildung 3) dienen.


Bild 3: Mandelbrotmenge ("Apfelmännchen")

An dieser Stelle sei angemerkt, dass der letzte der zuvor zitierten Sätze jedoch nur für beschränkte, ebene Objekte in kontinuierlichen Bildern gilt.

Für beschränkte, ebene Objekte in diskreten Bildern hängt die Zahl der zur Klassierung notwendigen Formmerkmale dagegen von der Anzahl der Pixel ab, aus denen das jeweilige beschränkte, ebene Objekt besteht:

Bezeichnet man diese Pixelzahl mit N und die Zahl der Formmerkmale wieder mit f, dann gilt stattdessen die Ungleichungskette: 0 ≤ f ≤ N-4 .

Als Beispiel für ein solches beschränktes, ebenes, diskretisiertes Objekt mit f = N - 4 kann dann jede beliebige Teilmenge der diskretisierten Mandelbrotmenge dienen.

An dieser Stelle sei außerdem angemerkt, dass es offensichtlich keinen Sinn macht, ein beschränktes, ebenes, diskretisiertes Objekt mit einer Pixelzahl von N einer Musterklassierung zu unterwerfen, die

  • mehr als ein Ausrichtungsmerkmal und / oder
  • mehr als ein Größenmerkmal und / oder
  • mehr als zwei Lagemerkmale und / oder
  • mehr als N - 4 Formmerkmale
verwendet.

Es gibt kaum einen Satz aus der Theorie der Mustererkennung, der in der täglichen Praxis der heuristischen Musterklassierung häufiger missachtet wird als dieser.

Ein Grund für die Missachtung der Erkenntnisse der Theorie der Mustererkennung resultiert vermutlich aus der Tatsache, dass in der Praxis der heuristischen Musterklassierung eine Unterscheidung der verwendeten heuristischen Merkmale in Lage-, Größen-, Ausrichtungsund Formmerkmale meist nicht vorgenommen wird, ja oft sogar überhaupt nicht möglich ist.

Ein weiterer Grund resultiert höchstwahrscheinlich aus dem Umstand, dass heuristische Merkmale sich oft nur schlecht und manchmal sogar überhaupt nicht nach Relevanz sortieren lassen.

Daher soll nachstehend ein neues, systematisches Verfahren zur Mustererkennung und Musterklassierung in der DBV vorgestellt werden, das all diese Nachteile vermeidet. Es arbeitet universell und ist somit bei der Merkmalsgewinnung nicht an fallspezifische Heuristiken gebunden.

5. Neues Verfahren zur Mustererkennung und Musterklassierung in der DBV

Vorgegeben sei ein allgemeines, separiertes, beschränktes, ebenes Objekt in einem Binärbild. Für die Bildfunktion gilt somit:

(1)

Für das vorgegebene, separierte, beschränkte, allgemeine ebene Objekt im Binärbild lassen sich für alle gemäß

(2)

die axialen Momente definieren. Speziell für p = q = 0 lässt sich das einzig relevante, reelle, skalare Größenmerkmal Fläche A berechnen.

A= m0,0 (3)

Die Berechnung der kartesischen Koordinaten (xs, ys) des Schwerpunkts S erfolgt dann vermittels:

(4)

Die kartesischen Koordinaten (xs, ys) des Schwerpunkts S sind - wie zuvor bereits ausgeführt - die einzig relevanten, reellen Lagemerkmale.

Gemäß

(5)

kann man eine Koordinatentransformation durchführen, die den Koordinatenursprung des neuen kartesischen Koordinatensystems in den Schwerpunkt S legt.

Für das vorgegebene, separierte, beschränkte, allgemeine ebene Objekt im Binärbild lassen sich dann in diesem Schwerpunktsystem (X, Y) für alle gemäß

(6)

die zentralisierten, axialen Momente definieren. Sie sind translationsinvariant. Aus dreien dieser zentralisierten, axialen Momente lässt sich dann gemäß

(7)

als einzig relevantes Ausrichtungsmerkmal der Neigungswinkel Θ der Hauptträgheitsachse gegen die x-Achse berechnen.

Führt man nun gemäß

(8)

die radiale Koordinate R im Schwerpunktssystem (X, Y) ein, dann kann man für alle n

(9)

die zentralisierten, polaren Momente definieren. Sie sind translationsinvariant und rotationsinvariant. Aus den Gleichungen (2), (6) und (9) folgt dann sofort:

(10)

Aus den Gleichungen (8) und (9) ergibt sich für die konkrete Berechnung der zentralisierten, polaren Momente außerdem sofort die Darstellung:

(11)

Gemäß

(12)

lassen sich nun für alle p, q die normierten zentralisierten axialen Momente definieren. Sie sind translationsinvariant.

Auf der Basis der normierten, zentralisierten axialen Momente lässt sich - wie der chinesischamerikanische Mathematiker M.K.Hu 1962 in einer wissenschaftlichen Arbeit für die DARPA zeigte - durch Skalierung für 0 ≤ p + q ≤ 3 für jedes beliebige, separierte, beschränkte, ebene Objekt in einem Binärbild eine endliche Folge {fl} von 7 dimensionslosen Formmerkmalen erzeugen. Betrachtet man die 7 Folgenglieder fl (0 ≤ l ≤ l0 = 7) als die Koordinaten eines Merkmalsvektors F = (f1, f2, f3, f4, f5, f6, f7) in einem 7-dimensionalen, euklidischen Merkmalsraum 7, dann induziert dieses Verfahren eine Objekterkennung in diesem 7-dimensionalen, euklidischen Merkmalsraum 7.

Diese Objekterkennung wurden jahrzehntelang erfolgreich zur Unterscheidung militärischer Flugzeuge ("Freund-Feind-Erkennung") eingesetzt.

Sie hat, gemessen an der Objekterkennung mittels heuristischer Merkmale, immerhin bereits zwei wichtige Vorteile:

  • Die Klassierung geschieht ausschließlich mit Merkmalsvektoren F = (f1, f2, f3,f4, f5, f6, f7), deren Koordinaten dimensionslose Formmerkmale sind.
  • Innerhalb der Menge der dimensionslosen Formmerkmale ft(0 ≤ l ≤ l0 = 7) ist durch den Koordinatenbezug zum Merkmalsvektors F eine eindeutige Reihenfolge bezüglich der Relevanz der Merkmale für die Objekterkennung in der DBV vorgegeben.

Dennoch führt dieses Verfahren bezüglich der Erkennung beschränkter, ebener Objekte von hoher Komplexität letztlich in die Sackgasse, denn es hat zwei systemimmanente Nachteile:

  • Die Zahl der verfügbaren dimensionslosen Formmerkmale ist auf 7 begrenzt.
  • Die verfügbaren dimensionslosen Formmerkmale ft(0 ≤ l ≤ l0 = 7) sind für beschränkte, ebene Objekte im allgemeinen unbeschränkt.

Der erste dieser Nachteile scheint auf den ersten Blick eher praktischer als prinzipieller Natur zu sein. Doch dieser erste Eindruck täuscht, denn dieser Nachteil lässt sich zwar abmildern, indem man die Restriktion 0 ≤ p + q ≤ 3 aufgibt, aber nicht wirklich beseitigen: Wie man leicht zeigen kann, erhält man dann etwa für 0 ≤ p + q ≤ 4 zwar eine endliche Folge {fm} von 15 dimensionslosen Formmerkmalen, die selbstverständlich die ursprüngliche Folge von 7 dimensionslosen Formmerkmalen als Teilfolge enthält. Betrachtet man die 15 Folgenglieder fm (0 ≤ m ≤ m0 = 15) wieder als die Koordinaten eines Merkmalsvektors F* = (f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11, f12, f13, f14, f15 ) in einem 15-dimensionalen, euklidischen Merkmalsraum 15, dann induziert dieses modifizierte Verfahren eine Objekterkennung in diesem 15- dimensionalen, euklidischen Merkmalsraum .

Aber selbst für den Fall 0 ≤ p + q ≤ + ∞ , das heißt, selbst für den Fall, dass die Folge {fn} der dimensionslosen Formmerkmale zu einer unendlichen Folge ausgedehnt wird und man die Folgenglieder fn (0 ≤ n < + ∞) dieser unendlichen Folge {fn} wieder als die Koordinaten eines Merkmalsvektors F** = (f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11, f12, f13, f14, f15, ... ) in einem unendlichdimensionalen, euklidischen Merkmalsraum betrachtet, lässt sich sehr leicht beweisen, dass dieses modifizierte Verfahren zwar eine Objekterkennung in diesem unendlichdimensionalen, euklidischen Merkmalsraum induziert, dass dieser Merkmalsraum aber keine vollständige Basis besitzt!

Die Unvollständigkeit der Basis impliziert, dass es relevante, dimensionslose Formmerkmale gibt, die dieses modifizierte Verfahren nicht generiert!

Der zweite der oben zitierten Nachteile ist offenkundig prinzipieller Natur: Es lässt sich sehr leicht beweisen, dass alle dimensionslosen Formmerkmale der endlichen Folgen wie auch der unendlichen Folge für beschränkte, ebene Objekte dann divergieren und somit unbeschränkt sind, wenn es sich dabei speziell um beschränkte, ebene Kurven, das heißt, um beschränkte, ebene, eindimensionale Objekte handelt. Damit divergiert dann aber auch sowohl im 7- dimensionalen, als auch im 15-dimensionalen und im unendlichdimensionalen, euklidischen Merkmalsraum der Betrag des jeweiligen Merkmalsvektors für alle ebenen, eindimensionalen Objekte und eine Klassierung dieser Objekte ist mit diesen Verfahren somit nicht möglich!

Hier soll daher ein anderes systematisches Verfahren vorgestellt werden, dem diese beiden systemimmanenten Nachteile nicht anhaften.

Von zentraler Bedeutung für dieses Verfahren sind nicht die in Gleichung (12) definierten normierten zentralisierten axialen Momente sondern die für alle n gemäß

(13)

definierten normierten zentralisierten polaren Momente. Sie sind translations- und rotationsinvariant und für sie gilt dann für alle n nachstehende Ungleichungskette:

(14)

Diese Ungleichungskette legt nahe, für alle n gemäß

(15)

einen Skalierungsfaktors k(n, A) zu definieren. Mit Hilfe dieses Skalierungsfaktors lassen sich dann für alle n gemäß

(16)

die dimensionslosen, skalierten, normierten, zentralisierten, polaren Momente einführen. Bei Beachtung von (13) und (15) transformiert sich (16) für alle n zu:

(17)

Aus der Ungleichungskette (14) folgt mittels (15) und (16) für die dimensionslosen, skalierten, normierten, zentralisierten, polaren Momente für alle n die nachstehende Ungleichung:

(18)

Für das allgemeine, separierte, beschränkte, ebene Objekt in einem Binärbild gilt:

Die dimensionslosen, skalierten, normierten, zentralisierten polaren Momente generieren eine unendliche Folge {xn} von dimensionslosen, skalaren Formmerkmale mit dem unbeschränkten Wertebereich = [1, + ∞[.

Betrachtet man die Folgenglieder xn der unendlichen Folge {xn} als die Koordinaten eines Merkmalsvektors Ξ = (x1, x2, x3, x4,x5, ....) in einem unendlichdimensionalen, euklidischen Merkmalsraum , dann induziert das vorgestellte Verfahren eine Objekterkennung in diesem unendlichdimensionalen, euklidischen Merkmalsraum .

Für alle separierten, beschränkten, ebenen Objekte mit abzählbar unendlich vielen Freiheitsgraden der Form in einem Binärbild gilt dann:

Der unendlichdimensionale, euklidische Merkmalsraum hat eine vollständige Basis.

Diese Objekterkennung hat, gemessen an der Objekterkennung mittels heuristischer Merkmale, immerhin bereits vier wichtige Vorteile:

  • Die Klassierung geschieht ausschließlich mit Merkmalsvektoren Ξ = (x1, x2, x3, x4,x5, ....), deren Koordinaten dimensionslose, skalare Formmerkmale sind.
  • Innerhalb der Menge der dimensionslosen, skalaren Formmerkmale xn ist durch den Koordinatenbezug zum Merkmalsvektor Ξ eine eindeutige Reihenfolge bezüglich der Relevanz der Merkmale für die Objekterkennung in der DBV vorgegeben.
  • Für die Menge aller separierten, beschränkten, ebenen Objekte mit abzählbar unendlich vielen Freiheitsgraden der Form in einem Binärbild generieren die Merkmalsvektoren Ξ einen unendlichdimensionalen, euklidischen Merkmalsraum mit vollständiger Basis.
  • Die Vollständigkeit der Basis impliziert, dass es keine relevanten, dimensionslosen Formmerkmale geben kann, die dieses Verfahren nicht generiert!

Es verbleibt ein Nachteil:

  • Die dimensionslosen, skalaren Formmerkmale xn sind für beschränkte, ebene Objekte im allgemeinen unbeschränkt.

Alle xn divergieren dann für beschränkte, ebene Objekte und sind somit unbeschränkt, wenn es sich dabei speziell um beschränkte, ebene Kurven, das heißt, um beschränkte, ebene, eindimensionale Objekte handelt.

Damit divergiert dann aber im unendlichdimensionalen, euklidischen Merkmalsraum der Betrag des jeweiligen Merkmalsvektors für alle ebenen, eindimensionalen Objekte und eine Klassierung dieser Objekte ist mit diesen Verfahren somit nicht möglich!.

Da die dimensionslosen, skalierten, normierten, zentralisierten polaren Momente wegen (18) aber alle positiv definit sind, lässt sich dieser verbliebene Nachteil durch eine einfache Transformation beseitigen. Definiert man dazu für alle n

(19)

eine Folge {Ψn}, dann folgt für jedes Folgenglied Ψn dieser Folge {Ψn} aus (18) und (19) für alle n sofort: = [0, 1].

Außerdem erhält man bei Beachtung von (17) aus (19) unmittelbar die Berechnungsformel für alle Glieder der Folge {Ψn}:

(20)

Für das allgemeine, separierte, beschränkte, ebene Objekt in einem Binärbild gilt somit:

Die Folgenglieder Ψn der unendlichen Folge {Ψn} sind dimensionslose, skalare Formmerkmale mit dem beschränkten Wertebereich = [0, +1].

Betrachtet man die Folgenglieder Ψn der unendlichen Folge {Ψn} als die Koordinaten eines Merkmalsvektors Ψ = (Ψ1, Ψ2, Ψ3, Ψ4, Ψ5, ....) in einem unendlichdimensionalen, euklidischen Merkmalsraum , dann induziert dieses, auf der Transformationsgleichung (19) basierende Verfahren eine Objekterkennung in diesem unendlichdimensionalen, euklidischen Merkmalsraum .

Für jedes separierte, beschränkte, ebene Objekt mit abzählbar unendlich vielen Freiheitsgraden der Form in einem Binärbild gilt dann:

Die Folgenglieder Ψn der Folge {Ψn} generieren den jeweiligen Merkmalsvektor Ψ = (Ψ1, Ψ2, Ψ3, Ψ4, Ψ5, ....) als ein Element eines unendlichdimensionalen, euklidischen Merkmalsraums mit vollständiger Basis.

Diese Objekterkennung hat, gemessen an der Objekterkennung mittels heuristischer Merkmale, fünf wichtige, systemimmanente Vorteile:

  • Die Klassierung geschieht ausschließlich mit Merkmalsvektoren Ψ = (Ψ1, Ψ2, Ψ3, Ψ4, Ψ5, ....), deren Koordinaten Ψn dimensionslose, skalare Formmerkmale sind.
  • Innerhalb der Menge der dimensionslosen, skalaren Formmerkmale (n ist durch den Koordinatenbezug zum Merkmalsvektor ) eine eindeutige Reihenfolge bezüglich der Relevanz der Merkmale für die Objekterkennung in der DBV vorgegeben.
  • Für jedes separierte, beschränkte, ebene Objekt mit abzählbar unendlich vielen Freiheitsgraden der Form in einem Binärbild generieren die Folgenglieder Ψn der Folge {Ψn} den jeweiligen MerkmalsvektorΨ als ein Element eines unendlichdimensionalen, euklidischen Merkmalsraums mit vollständiger Basis.
  • Die Vollständigkeit der Basis impliziert, dass es keine relevanten, dimensionslosen Formmerkmale geben kann, die dieses Verfahren nicht generiert!
  • Die dimensionslosen, skalaren Formmerkmale Ψn sind für alle beschränkten, ebenen Objekte beschränkt und haben für alle n Ψ den Wertebereich = [0, 1].

6. Praktische Vorteile des neuen Verfahrens

Die Stärke des vorgestellten neuen Verfahrens der Objekterkennung in der DBV ist seine Universalität.

Da es bei der Merkmalsgewinnung nicht an fallspezifische Heuristiken gebunden ist, eignet es sich zur Analyse aller Arten von Bildern. Dabei spielt es keine Rolle, ob es sich bei den Bildern, bezügliche derer die Objekterkennung durchgeführt wird, um "optische" Bilder aus dem Spektralbereich des sichtbaren Lichts oder um radiographische bzw. radioskopische Bilder oder gar um synthetische Bilder aus dem Bereich Imaging handelt.

Das Verfahren kann daher im Bereich der optischen Oberflächeninspektion ebenso eingesetzt werden, wie etwa bei der Qualitätssicherung, der Textur-, Form- und Konturanalyse, der Photogrammetrie, der Zeichen- und Schrifterkennung, der Personenerkennung, der Robot- Vision oder der Auswertung von radiographischen bzw. radioskopischen Bildern, Ultraschall- Bildern und Kernspin-Tomographien.

Wenn man im Rahmen dieses breiten Spektrums möglicher Anwendungen ein konkretes Problem der Objekterkennung angeht, dann steht von Beginn an der Komplexitätsgrad des Problems fest:

  • Es ist bekannt, in wie viele verschiedene separierte, beschränkte, ebene Objektklassen die zu erkennenden Objekte einsortiert werden sollen: Bezeichnet man die bekannte Anzahl der Objektklassen mit K und den Laufindex der Objektklassen mit k, dann gilt zunächst: 1 ≤ k ≤ K.
  • Im Gegensatz zur Klassierung auf der Basis heuristischer Merkmale kann bei dem neuen Verfahren von jeder Objektklasse die Anzahl der Freiheitsgrade der Form anhand einer repräsentativen Stichprobe von Testobjekten experimentell ermittelt werden: Bezeichnet man die Anzahl der Freiheitsgrade der Form für die k-te Objektklasse mit fk und das Maximum der fk für 1 ≤ k ≤ K mit F, dann definiert F den Komplexitätsgrad des Problems.
  • Der Komplexitätsgrad des Problems bestimmt die Dimension des euklidischen Merkmalsraums : dim() = F.
  • Die Klassierung geschieht ausschließlich mit Merkmalsvektoren Ψ = (Ψ1, Ψ2, Ψ3, Ψ4, Ψ5, ....ΨF ), deren Koordinaten Ψi (l ≤ i ≤ F dimensionslose, skalare, beschränkte Formmerkmale sind.
  • Der Merkmalsvektor jedes beliebigen, separierten, beschränkten, ebenen Objekts im Bild liegt im Innern eines beschränkten, normierten F-dimensionalen Teilbereichs ("Einheits-Hyperwürfel") des F-dimensionalen, euklidischen Merkmalsraums F.
  • Die Musterklassierung geschieht durch problemspezifische Clusterung des Inneren dieses F-dimensionalen Einheits-Hyperwürfels.

Zur Demonstration der Universalität des vorgestellten neuen Verfahrens der Objekterkennung wurde es auf 6 verschiedene Probleme der Objekterkennung angewandt. Die Spezifizierung der Problemstellung, die Art der Bilder, die Spezifizierung der Objekterkennung sowie ihr jeweiliger Komplexitätsgrad F sind aus nachstehender Tabelle zu entnehmen:

Problemstellung Art der Bilder Objektklassen F
Gussteilprüfung Radioskopien Gussteil-Fehlertypen 9
Schweißnahtprüfung Radioskopien Schweißnaht-Fehlertypen 14
Schrifterkennung /maschinell / Times Optische Bilder Buchstaben und Ziffern 20
Schrift- und Schriftarterkennung /maschinell / 5 Schriftarten Optische Bilder 52 Buchstaben und 10 Ziffern 30
Handschrifterkennung / 1 Schreiber Optische Bilder 52 Buchstaben und 10 Ziffern 25
Handschrift- und Schreibererkennung / 5 Schreiber Optische Bilder 52 Buchstaben und 10 Ziffern 40

Da die Clusterung eines 9-, 14-, 20-, 25-, 30- oder 40-dimensionalen Merkmalsraum sich graphisch nicht darstellen lässt, sei stattdessen am Beispiel der Schweißnahtprüfung die Clusterung eines dreidimensionalen Unterraums für den Spezialfall von nur drei Fehlertypen (Risse, Poren und Schlauchporen) dargestellt (siehe Abbildung 4).


Abb 4: Klassierung von Schweißnahtfehlern in einem dreidimensionalen Merkmalsraum

Für die Clusterung wurden 200 Radioskopien mit insgesamt 497 Fehlern ausgewertet. Aus den 497 Fehlern wurden zu jeder der drei ausgewählten Fehlertypen (Risse, Poren und Schlauchporen) eine repräsentative Stichprobe aus 30 Fehlern gebildet.

Wie aus Abbildung 4 ersichtlich, sind die Cluster für die drei ausgewählten Fehlertypen jeweils disjunkt. Daher ist mit dem neuen Verfahrens der Objekterkennung eine zuverlässige, eindeutige Fehlerklassierung gewährleistet.

STARTHerausgeber: DGfZPProgrammierung: NDT.net