-
Gebiet der
Erfindung
-
Die
vorliegende Erfindung bezieht sich auf eine Multimedia-Datenverarbeitung
und spezieller auf eine Multimedia-Datenverarbeitung, die auf semantischen
Beschreibungen basiert.
-
Hintergrund
der Erfindung
-
Die
Bewegtbild-Expertengruppe (MPEG) entwickelt Standards betreffend
einen audiovisuellen Inhalt. Eine Komponente des MPEG-Standardsystems
enthält
MPEG-7-Standards, die darauf gerichtet sind, Beschreibungen eines
audiovisuellen Inhalts bereitzustellen, der für den Benutzer von Interesse sein
kann. Spezieller sind die MPEG-7-Standards dazu entwickelt, eine
Information zu standardisieren, welche den audiovisuellen Inhalt
beschreibt. Die MPEG-7-Standards können in verschiedenen Bereichen
angewandt werden, einschließlich
zur Speicherung und Wiederauffindung von audiovisuellen Posten aus
Datenbanken, zu einer Sende-Medienauswahl, einem Teleshopping, von
Multimedia-Präsentationen,
für einen
personalisierten Nachrichtendienst im Internet, etc.
-
Gemäß den MPEG-7-Standards
bestehen Beschreibungen eines audiovisuellen Inhalts aus Deskriptoren
und Beschreibungsschemen bzw. -systemen. Deskriptoren repräsentieren
Merkmale des audiovisuellen Inhalts und legen die Syntax und die
Semantik der jeweiligen Merkmalsdarstellung fest. Beschreibungsschemen
bzw. -systeme (DS) spezifizieren die Struktur und Semantik der Beziehungen
zwischen ihren Komponenten. Diese Komponenten können Deskriptoren und Beschreibungsschemen
bzw. -systeme sein. Konzeptionelle Aspekte eines Beschreibungsschemas
bzw. -systems können
in einem Baum oder in einem Graphen organisiert sein. Die Graphenstruktur
wird durch einen Satz von Knoten, die Elemente eines Beschreibungsschemas
bzw. -systems repräsentieren,
und einen Satz von Rändern
festgelegt, welche die Beziehung zwischen den Knoten spezifizieren.
-
Beschreibungen
(das sind Deskriptoren und DSen) eines audiovisuellen Inhalts werden
in Segmentbeschreibungen und in semantische Beschreibungen unterteilt.
Segmentbeschreibungen beschreiben den audiovisuellen Inhalt vom
Standpunkt ihrer Struktur. Dies heißt, dass die Beschreibungen um
Segmente herum strukturiert sind, die physikalische räumliche,
zeitliche oder räumlich-zeitliche Komponenten
des audiovisuellen Inhalts repräsentieren.
Jedes Segment kann durch signalbasierte Merkmale (Farbe, Textur,
Form, Bewegung, Audiomerkmale, etc.) und einige elementare semantische Information
beschrieben sein bzw. werden.
-
Semantische
Beschreibungen beschreiben den audiovisuellen Inhalt unter den konzeptionellen Gesichtspunkten,
das sind die semantischen Beschreibungen, die die tatsächliche
Bedeutung des audiovisuellen Inhalts beschreiben anstatt dessen Struktur.
Die Segmentbeschreibungen und die semantischen Beschreibungen beziehen
sich auf einen Satz von Verbindungen bzw. Verbindungsgliedern, die
es ermöglichen,
den audiovisuellen Inhalt auf der Grundlage der Inhaltsstruktur
und der Semantik gemeinsam zu beschreiben. Die Verbindungsglieder beziehen
unterschiedliche semantische Konzepte auf die Instanzen innerhalb
des audiovisuellen Inhalts, der durch die Segmentbeschreibungen
beschrieben ist.
-
Gegenwärtige semantische
Beschreibungen sind in ihren deskriptiven Fähigkeiten beschränkt, da sie
spezifische semantische Entitäten
ohne Identifizierung der Beziehungen zwi schen diesen spezifischen
semantischen Entitäten
und anderen verwandten semantischen Entitäten beschreiben. So enthält das gegenwärtige Modell
einer semantischen Beschreibung beispielsweise eine Vielzahl von
DSen für
verschiedene semantische Entitäten,
wie beispielsweise ein Ereignis, ein Objekt, einen Zustand, ein
abstraktes Konzept, etc. Ein Ereignis DS beschreibt eine bedeutungsvolle
zeitliche Begrenzung bzw. Ortsbestimmung. Ein Ereignis DS kann beispielsweise
einer konkreten Instanz in der realen Welt oder den Medien (z.B.
einer Hochzeit) zugeordnet sein. Ein Objekt DS beschreibt semantisch
ein spezifisches Objekt (z.B. ein in einem Bild abgebildetes Auto).
Ein Zustand DS identifiziert semantische Eigenschaften der Entität (beispielsweise
eines Objekts oder Ereignisses) zu einer vorgegebenen Zeit an einer
vorgegebenen räumlichen
Stelle oder in bzw. an einer vorgegebenen Medienstelle. Ein Konzept
DS beschreibt abstrakte Elemente, die durch Abstraktion aus konkreten
Objekten und Ereignissen nicht erzeugt werden. Konzepte, wie die
Freiheit oder ein Geheimnis bzw. Rätsel sind typische Beispiele von
Entitäten,
die durch Konzeptbeschreibungen beschrieben werden.
-
Die
obigen DSen beschreiben spezifische Entitäten. Eine Beschreibung kann
nicht vollständig sein,
wenn sie lediglich eine individuelle Entität selbst beschreibt. Die meiste
menschliche Beschreibung und Kommunikation wird dadurch vorgenommen, dass
Informationen zusammengebracht werden, wobei eine Information selten
vollständig
in irgendeinem Austausch dargestellt wird. Hinweise sind in Sprache vorhanden,
die die beiden Parteien veranlassen, vernünftige kompatible oder ähnliche
mentale Modelle zu konstruieren, und die erörterte Information wird innerhalb
eines solchen Kontextes diskutiert. Demgemäß kann eine Beschreibung nicht
genau und vollständig
den Inhalt beschreiben, solange sie nicht verschiedene zusätzliche
Informationen bezüglich
dieses Inhalts enthält.
Diese zusätzliche
Information kann eine Hintergrundinformation, eine Kontextinformation,
eine Beziehungen zwischen dem Inhalt, der beschrieben wird, und
anderen Entitäten,
etc. identifizierende Information enthalten.
-
Zusätzlich existiert
kein gegenwärtiger
Mechanismus zur Erzeugung von Beschreibungen von Metaphern oder
Analogien. Eine traditionelle Meinung besteht darin, dass semantische
Beschreibungen lediglich audiovisuelles Material beschreiben sollten
und dass daher ein Bedarf für
die Erzeugung von Metapher-Beschreibungen existiert. Menschen nutzen
jedoch Metaphern und Analogien die ganze Zeit, ohne eine solche
Anwendung zu realisieren. Derartige Metaphern und Analogien, wie "Ein Gefühl, wie
ein Fisch aus dem Wasser", "An die Grenzlinie nahe
herankommen", "Fliegen wie ein Vogel", etc. sind der menschlichen
Kommunikation inhärent.
Daher wäre
es unerwünscht,
Beschreibungen von Metaphern und Analogien aus einer Liste möglicher
Beschreibungen auszuschließen.
-
Ferner
sind gegenwärtige
semantische Beschreibungen statisch. Wenn das durch eine existierende
semantische Beschreibung beschriebene Material sich ändert, muss
der Prozess zur Erzeugung einer Beschreibung erneut ausgeführt werden,
um eine durch das geänderte
Material beschriebene neue semantische Beschreibung zu erzeugen.
-
Demgemäß ist ein
Werkzeug zur Erzeugung von semantischen Beschreibungen erforderlich,
das imstande ist, jegliche semantische Situation, audiovisuell oder
sonst wie, vollständig
und genau zu beschreiben. Ein derartiges Werkzeug sollte außerdem imstande
sein, Beschreibungen zu erzeugen, die dynamisch Änderungen im beschriebenen
Material reflektieren würden.
-
Zusammenfassung
der Erfindung
-
Ein
Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen
eines audiovisuellen Inhalts werden beschrieben. Gemäß einer
Ausführungsform
wird eine Beschreibung eines au diovisuellen Inhalts erzeugt, und
eine eine Wiederverwendung der Beschreibung des audiovisuellen Inhalts
betreffende Information wird definiert. Ferner werden die Beschreibung
des audiovisuellen Inhalts und die entsprechende Wiederverwendungsinformation
in einem Speicher (Repository) aus deskriptiven Daten gespeichert,
um eine anschließende
Wiederverwendung dieser Beschreibung zu ermöglichen.
-
Die
vorliegende Erfindung ist in den Figuren der beigefügten Zeichnungen,
in denen entsprechende Bezugszeichen ähnliche bzw. entsprechende
Elemente bezeichnen, beispielhaft und nicht beschränkend veranschaulicht.
-
1 und 2 sind Ausführungsformen des Standes der
Technik zur Erzeugung von mentalen Räumen;
-
3 veranschaulicht eine Hierarchie
von verschiedenen strukturellen Formen semantischer Beschreibungen
eines audiovisuellen Inhalts;
-
4 ist ein Blockdiagramm
einer Ausführungsform
eines Systems zur Verarbeitung von Beschreibungen eines audiovisuellen
Inhalts;
-
5 ist ein Flussdiagramm
einer Ausführungsform
zur Bereitstellung verteilter Beschreibungen eines audiovisuellen
Inhalts;
-
6 ist ein Flussdiagramm
einer Ausführungsform
zur Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts;
-
7 ist ein Flussdiagramm
einer Ausführungsform
zur dynamischen Wiederverwendung von Beschreibungen eines audiovisuellen
Inhalts;
-
8 veranschaulicht ein beispielhaftes
semantisches Mosaik; und
-
9 ist ein Blockdiagramm
einer Ausführungsform
eines Computersystems.
-
Detaillierte
Beschreibung
-
Es
werden ein Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen
eines audiovisuellen Inhalts beschrieben. In der folgenden detaillierten
Beschreibung der vorliegenden Erfindung werden zahlreiche spezifische
Details ausgeführt,
um ein völliges
Verständnis
der vorliegenden Erfindung zu liefern. Es wird jedoch für einen
Durchschnittsfachmann auf dem Gebiet der Technik ersichtlich sein,
dass die vorliegende Erfindung ohne diese spezifischen Details praktisch
ausgeführt
werden kann. In einigen Fällen
sind gut bekannte Strukturen und Vorrichtungen in Blockdiagrammform
anstatt im Detail dargestellt, um eine Verdunkelung der vorliegenden
Erfindung zu vermeiden.
-
Einige
Teile der detaillierten Beschreibungen, die folgen, werden in Begriffen
von Algorithmen und symbolischen Darstellungen von Operationen bezüglich Datenbits
innerhalb eines Computerspeichers gegeben. Diese algorithmischen
Beschreibungen und Darstellungen sind die Mittel, die von Durchschnittsfachleuten
auf dem Gebiet der Datenverarbeitung genutzt werden, um höchst effektiv
die Substanz ihrer Arbeit an andere Durchschnittsfachleute auf dem
betreffenden Gebiet weiterzuleiten. Ein Algorithmus stellt man sich
hier und generell als eine widerspruchsfreie Sequenz von Schritten
vor, die zu einem gewünschten
Ergebnis führen.
Die Schritte sind solche, die physikalische Manipulationen von physikalischen
Quantitäten
bzw. Größen erfordern. Üblicherweise,
obwohl nicht notwendigerweise besitzen diese Quantitäten die
Form von elektrischen oder magnetischen Signalen, die imstande sind,
gespeichert, übertragen,
kombiniert, verglichen oder sonst wie manipuliert zu werden. Es
hat sich zuweilen als praktisch bzw. günstig erwiesen, prinzipiell
aus Gründen
eines gemeinsamen Gebrauchs, sich auf diese Signale als Bits, Werte,
Elemente, Symbole, Zeichen, Terme, Zahlen bzw. Nummern oder dergleichen
zu beziehen.
-
Es
sollte jedoch in Erinnerung behalten werden, dass alle diese und ähnliche
Terme den in Frage kommenden physikalischen Quantitäten zuzuordnen sind
und lediglich auf diese Quantitäten
angewandte zweckmäßige Etiketten
sind. Sofern nicht speziell anders angegeben, offensichtlich aus
der vorliegenden Erörterung
ersichtlich, wird es geschätzt,
dass durch die Beschreibung, Erörterungen
unter Nutzung von Termen, wie "Verarbeitung" oder "Berechnung" ("Computing") oder "Berechnen" ("Calculating") oder "Bestimmen" oder "Anzeigen" oder dergleichen
sich auf die Aktion und die Prozesse eines Computersystems oder
einer entsprechenden bzw. ähnlichen elektronischen
Rechenvorrichtung beziehen, die Daten, welche als physikalische
(elektronische) Quantitäten
innerhalb der Computersystem-Register und -Speicher dargestellt
sind, manipuliert und in andere Daten transformiert, die ähnlich bzw.
entsprechend als physikalische Quantitäten innerhalb der Computersystem-Speicher
oder -Register oder anderer derartiger Informationsspeicher-, -übertragungs-
oder Anzeigevorrichtungen dargestellt werden.
-
Die
vorliegende Erfindung bezieht sich außerdem auf eine Vorrichtung
zur Ausführung
der Operationen hierin. Die Vorrichtung kann speziell für die geforderten
Zwecke konstruiert sein, oder sie kann einen Allzweck-Computer umfassen,
der selektiv durch ein in dem Computer gespeichertes Computerprogramm
aktiviert oder rekonfiguriert ist bzw. wird. Ein derartiges Computerprogramm
kann in einem computerlesbaren Speichermedium gespeichert sein,
wie in irgendeinem – ohne
darauf beschränkt
zu sein – Typ
von Diskette, einschließlich
von Floppydiscs, optischen Platten bzw. Discs, CD-ROMs und magnetooptischen
Platten, Festwertspeichern (ROMs), Schreib-Lese-Speichern mit wahlfreiem Zugriff (RAMs),
EPROMs, EEPROMs, magnetischen oder optischen Karten oder irgendeinem
Typ von Medien, die für
die Speicherung von elektronischen Befehlen geeignet sind und die
jeweils mit einem Computersystembus verbunden sind.
-
Die
hier dargestellten Algorithmen und Anzeigen beziehen sich nicht
inhärent
auf irgendeinen praktischen Computer oder eine andere Vorrichtung. Verschiedene
Allzwecksysteme können
mit Programmen gemäß den Lehren
hier genutzt werden, oder es kann sich als zweckmäßig erweisen,
eine stärker
spezialisierte Vorrichtung zu konstruieren, um die geforderten Verfahrensschritte
auszuführen.
Die geforderte Struktur für
eine Vielfalt dieser Systeme wird aus der nachstehenden Beschreibung
hervorgehen. Darüber
hinaus wird die vorliegende Erfindung nicht unter Bezugnahme auf
irgendeine besondere Programmiersprache beschrieben. Es wird verständlich sein,
dass eine Vielfalt von Programmiersprachen angewandt werden, um
die Lehren der Erfindung, wie hier beschrieben, zu implementieren.
-
Die
vorliegende Erfindung bezieht sich auf verschiedene Aspekte der
Erzeugung von Beschreibungen eines audiovisuellen Inhalts. Wie oben
beschrieben, mangelt es den gegenwärtigen deskriptiven Werkzeugen
an der Fähigkeit,
Beschreibungen zu erzeugen, die einen audiovisuellen Inhalt in einer vollständigen und
genauen Weise beschreiben können.
Diese Beschränkung
wird durch die Entitäts-spezifische
Natur der gegenwärtigen
semantischen Beschreibungen hervorgerufen. Dies heißt, dass
jede semantische Beschreibung eine spezifische Entität unabhängig von
der kontextuellen und Hintergrundinformation beschreibt, welche
sich auf diese spezifische Entität
bezieht. Dieser Ansatz widerspricht jedoch den Regeln, welche die
Wahrnehmung und Interpretation von Sprache bestimmen, was der Prototyp
für semantische
Beschreibungen ist. Einige dieser Regeln basieren auf der Anwendung
der mentalen Raumtheorie, die im Stand der Technik bekannt ist.
-
Mentale
bzw. geistige Räume
liefern den Kontext für
eine Kommunikation, indem sie eine Menge an Information, die nicht
in der Sprache enthalten ist, importieren, wodurch ein Mechanismus
zum Interpretieren des semantischen Inhalts in einer Sprache bereitgestellt
wird. Diese Information wird unter Verwendung von Karten importiert.
Diese Karten funktionieren durch die Verwendung (das heißt durch "Rekrutieren") von Kästchen,
die vordefinierte Konstruktionen zur Interpretation, eine Projektionsstruktur
von einem mentalen Raum zu einem anderen und zum Integrieren oder
Abstrahieren von importiertem Material von mehr als einem anderen
mentalen Raum darstellen. Demgemäß kann jeder
mentale Raum eine erweiterte Beschreibung repräsentieren, die Entitätenbeziehungen
und Kästchen
enthält. Mehrere
mentale Räume
können
auf einmal aktiv sein, sämtliche
der Entitäten
in der Beschreibung in geeigneter Weise zu definieren. Diese mentalen Räume treten
in Beziehungen miteinander ein. Da sich die mentalen Räume Struktur
und Entitäten
voneinander borgen, sind Abbildungen zwischen diesen mentalen Räumen notwendig.
Die gesamten zusammengesetzten Formen bilden eine Kulisse für die ausgedrückte Beschreibung
und vervollständigen den
Prozess des Anbringens der semantischen Bedeutung an die involvierten
Entitäten.
-
1 und 2 sind Ausführungsformen des Standes der
Technik zur Erzeugung von mentalen Räumen. Gemäß 1 wird ein neuer mentaler Raum 50 dadurch
erzeugt, dass einige der Rahmen bzw. Kästchen 10 rekrutiert
werden und dass Strukturen von existierenden mentalen Räumen 20 und 30 geborgt
werden. Gemäß 2 wird ein neuer mentaler
Raum 70 dadurch gebildet, dass zwei existierende mentale
Räume 62 und 64 gemischt
oder integriert werden. Ein artmäßiger Raum 66 kann
dann durch Abstraktion aus allen drei mentalen Räumen erzeugt werden: der neue
mentale Raum 70 und die existierenden mentalen Räume 64 und 62.
Ein artmäßiger Raum 66 enthält Strukturen,
die den mentalen Räumen 62, 64 und 70 gemeinsam
sind.
-
Die
vorliegende Erfindung nutzt das mentale Raummodell, um die Erzeugung
von semantischen Beschreibungen zu ermöglichen, welche imstande sind,
jegliche semantische Situation vollständig zu beschreiben. Bei einer
Ausführungsform
basiert das Werkzeug zur Erzeugung der vollständigen semantischen Be schreibungen
auf einer Anzahl von Beschreibungskategorien. Diese Kategorien können Objekte,
Ereignisse, Zustände,
Episoden, Rahmen bzw. Kästchen,
beschreibende Strukturen und mentale Räume enthalten. Der Begriff "Objekt", wie er hier verwendet
wird, bezieht sich auf eine Beschreibung eines realen Objekts oder
auf eine Zusammensetzung oder Abstraktion von verschiedenen realen Objekten.
Objekte enthalten Zustände.
Jeder Zustand ist eine Sammlung von Attributen, die Objekten und
Beziehungen angehängt
sind. Durch Erweiterung können
Zustände
Sammlungen von mentalen Räumen
beitragen. Objekte können
Subobjekte haben, und Objektzustände
können
Subzustände
haben. Eine Änderung
im Zustand ist ein Ereignis. Als solches kann ein Ereignis eine Änderung
in irgendeinem der Bestandteile der Beschreibung eines Objekts oder
einer Beziehung sein (einschließlich
dessen, was die mentalen Räume
darstellt). Da Zustände
Subzustände
haben können,
können
Ereignisse Subereignisse haben.
-
Zustände können außerdem an
Episoden angehängt
sein, und ein Ereignis kann eine Änderung in irgendeinem der
Bestandteile einer Beschreibung einer Episode sein. Eine Episode
ist eine semantisch signifikante Zeitspanne. Episoden können mit
dem Verhalten von Objekten, mit dem Auftreten von Ereignissen, mit Änderungen
in Beziehungen oder mit Änderungen
in mentalen Räumen
koinzidieren, die zur Bereitstellung des Kontextes für die Objekte,
Ereignisse und Beziehungen genutzt werden. Falls semantisch signifikante
Zeitspannen in einer Episode richtig enthalten sind, sind sie Subepisoden.
-
Ein
Rahmen bzw. Kästchen
ist ein angenommener oder vordefinierter Satz von Regeln zum Interpretieren
oder Beschreiben eines Satzes von semantischen Objekten. Als solches
können
Rahmen bzw. Kästchen
prototypische Beschreibungen von sich selbst sein, oder sie können Sätze von
Regeln, Definitionen und beschreibenden Strukturen sein. Beschreibende
Strukturen sind Abstraktionen von Objekten, Episoden, Zuständen und
Beziehungen. Ein mentaler Raum ist eine Sammlung von Objekten, Beziehungen
und Rahmen zusammen mit Abbildungen, die beschreibende Strukturen
von Beschreibungen oder von anderen mentalen Räumen einbetten.
-
Eine
vollständige
Beschreibung des semantischen Inhalts kann aus irgendeiner Kombination von
Beschreibungen der obigen Kategorien bestehen. Darüber hinaus
sollte die vollständige
Beschreibung Beschreibungen von Beziehungen zwischen semantischen
Entitäten
enthalten, die in der vollständigen
Beschreibung des semantischen Inhalts enthalten sind. Eine Beziehung
zwischen den Entitäten ist
entweder eine Beziehung oder eine Abbildung. Da Beziehungen als
Zusammensetzungen von Abbildungen ausgedrückt werden können, kann
der Begriff "Abbildung" auch zur Identifizierung
einer Beziehung herangezogen werden. Beziehungen können von
verschiedenen Typen sein, wie beispielsweise ein Einschluss, ein
Containment, eine Ähnlichkeit, ein
Beispiel von, eine relative Position, etc.
-
Die
Beziehungen zwischen Objekten bilden eine Struktur. Ferner ist die
Abbildung von Objekten, Zuständen
und Ereignissen in einer Episode eine Struktur. Die Abbildungen,
die die darunter liegenden mentalen Räume ausmachen, sind Strukturen.
Zustände
können
als Karten von den Entitäten
repräsentiert
werden, die durch Zustände
für Räume von Attributwerten
beschrieben sind. Sogar Objekte können als Struktur beschrieben
werden bzw. sein: Objekte sind in einer 1-zu-1-Korrespondenz mit
den Abbildungen von irgendeinem Punkt, der auf die Objekte selbst
festgelegt ist, oder mit irgendwelchen Abbildungen von den Objekten
selbst auf einem festgelegten Punkt). Damit ist die Struktur ein
inhärenter
Teil eines semantischen Beschreibungskonstruktes.
-
Die
Struktur kann verschiedene Formen annehmen, einschließlich Morphismen,
Graphen, Kategorien, Funktoren, natürliche Transformationen, etc. Morphismen
sind Pfeile zwischen Objekten einer Kategorie. Eine Kategorie besteht
aus zwei Sätzen, einem
Satz von Objekten und einem Satz von Morphismen, welche den folgenden
zwei Regeln gehorchen:
- 1) Für jedes Objekt muss ein Morphismus
zu sich selbst vorhanden sein, genannt der "Identitäts"-Morphismus;
- 2) falls f ein Morphismus von A nach B ist und falls g ein Morphismus
von B nach C ist, dann muss ein Morphismus (üblicherweise geschrieben als
(g o f)) von A nach C sein, der der ersten Bestimmung f und dann
der Bestimmung g äquivalent
ist.
-
Es
ist möglich,
zwischen Kategorien Abbildungen zu definieren. Abbildungen zwischen
Kategorien müssen
Objekte für
Objekte und Morphismen für
Morphismen heranziehen. Abbildungen zwischen Kategorien benötigen ebenfalls
die Heranziehung der Quelle und des Zieles irgendeines Morphismus zur
Quelle und dem Ziel seines Bildes unter der Abbildung (dies ist
eine Regel, die Morphismen für
die Kategorie von Graphen definiert). Abbildungen zwischen Kategorien
müssen
zwei Einschränkungen
genügen,
kategorische Einschränkungen
genannt:
- 1) Sie müssen die Identitätskarten
zur Identität der
Karten heranziehen; und
- 2) sie müssen
Zusammensetzungen aufrecht erhalten, das heißt, dass dann, wenn F von A
bis X, B bis Y, C bis Z und f bis h sowie g bis p heranzieht, muss
F (g o f) bis (p o h) herangezogen werden. Jegliche Karte, die den
obigen Einschränkungen
gehorcht, wird "kategorisch" genannt.
-
Eine
kategorische Karte zwischen zwei Kategorien wird ein Funktor genannt.
Ein Funktor bildet zwischen Kategorien ab, z.B. F bildet die Kategorie
C auf die Kategorie D ab. Es ist möglich, dies mit C und D als
entsprechende bzw. ähnliche
Objekte anzusehen, und F ist ähnlich
bzw. entspricht einem Pfeil (Morphismus). Falls G die Kategorie
H auf die Kategorie J abbildet, dann können wir eine neue Karte erstellen,
die C bis H, D bis J und F bis H heranzieht. Falls diese neue Karte
kategorischen Beschränkungen
folgt, dann wird sie eine natürlich
Transformation genannt.
-
3 veranschaulicht eine Hierarchie
von verschiedenen strukturellen Formen einer semantischen Beschreibung
eines audiovisuellen Inhalts. Der Morphismus 302 ist ein
Kästchen
zwischen zwei Objekten 304. Jede Kategorie 310 besteht
aus einem Satz von Objekten (beispielsweise einschließlich der Objekte 304)
und einem Satz von Morphismen (beispielsweise einschließlich des
Morphismus 302). Der Funktor 306 ist ein Kästchen zwischen
Kategorien 310. Eine natürliche Transformation 308 ist
ein Kästchen
zwischen Funktoren. Es besteht dort kein Bedarf, ein Kästchen zwischen
natürlichen
Transformationen zu machen, da die Hierarchie unter Heranziehung
der "Funktor-Kategorien" fortgesetzt werden kann).
-
Somit
kann eine vollständige
Beschreibung eines audiovisuellen Inhalts Beschreibungen von verschiedenen
semantischen Einheiten (beispielsweise Objekte, Ereignisse, Zustände, Episoden, Rahmen,
beschreibende Strukturen und mentale Räume) zusammen mit Beschreibungen
enthalten, die die Struktur der vollständigen Beschreibung ausdrücken. Obwohl
dieser Ansatz bzw. diese Lösung semantische
Beschreibungen bereitstellt, die jegliche semantische Beschreibung
in einer vollständigen und
genauen Weise zu beschreiben imstande ist, kann sie einen signifikanten
Grad an Komplexheit den resultierenden semantischen Beschreibungen hinzufügen. Eine
Ausführungsform
der vorliegenden Erfindung ist auf diese Komplexheit durch Verteilung von
existierenden Beschreibungen eines audiovisuellen Inhalts gerichtet.
Bei dieser Ausführungsform können existierende
Beschreibungen erzielt und dann wieder verwendet werden, um neue
Beschreibungen zu erzeugen, wie dies unten in weiteren Einzelheiten
beschrieben wird.
-
4 ist ein Blockdiagramm
einer Ausführungsform
eines Systems 100 zur Verarbeitung von Beschreibungen eines
audiovisuellen Inhalts. Das System 100 besteht aus einem
oder mehreren Server-Computern 112, die mit einem oder
mehreren Client-Computern,
wie dem Client 112 verbunden sind. Der Client 112 kann
mit dem Server 102 über
irgendeine Draht- oder drahtlose Kommunikationsverbindung kommunizieren,
einschließlich
beispielsweise über
ein öffentliches
Netzwerk, wie das Internet, ein lokales Netzwerk, wie das Ethernet,
ein Intranet und ein LAN-Netzwerk (lokales Bereichsnetzwerk) oder über eine
Kombination von Netzwerken. Der Client 112 und der Server 102 können jeweils
irgendein Typ einer Rechenvorrichtung sein, wie beispielsweise ein
Desktop- bzw. Tischrechner, eine Arbeitsstation, ein Laptop, ein
Mainframe-Rechner, etc.
-
Bei
einer Ausführungsform
enthält
der Server 102 eine Datenspeichereinrichtung 104,
die verschiedene Beschreibungen eines audiovisuellen Inhalts speichert.
Bei einer Ausführungsform
enthält die
Datenspeichereinrichtung 104 lediglich semantische Beschreibungen
eines audiovisuellen Inhalts, das heißt Beschreibungen, die die
tatsächliche
Bedeutung des audiovisuellen Inhalts beschreiben. Alternativ speichert
die Datenspeichereinrichtung 104 Beschreibungen von anderen
Typen (beispielsweise Segmentbeschreibungen) zusätzlich zu semantischen Beschreibungen.
Beschreibungen werden unabhängig
von dem audiovisuellen Inhalt, den sie beschreiben, gespeichert.
Bei einer Ausführungsform wird
jede Beschreibung mit einer zugeordneten Wiederverwendungsinformation
gespeichert, die angibt, wie dies Beschreibung wieder verwendet
werden kann, um andere bzw. weitere Beschreibungen eines audiovisuellen
Inhalts zu erzeugen. Die Funktionalität der Wiederverwendungsinformation
wird unten in weiteren Einzelheiten beschrieben.
-
Der
Client 112 enthält
ein Werkzeug zur Erzeugung von neuen Beschreibungen durch die Wiederverwendung
von existierenden Beschreibungen eines audiovisuellen Inhalts. Bei
einer Ausführungsform
enthält
dieses Werkzeug ein Wiederverwendungsmodul 106, einen Beschreibungsprozessor 108 und
einen Wiederverwendungsinformationserzeuger 110. Bei einer
Ausführungsform
enthält
der Client 112 ebenfalls eine Datenspeichereinrichtung 114 zur
lokalen Speicherung von Beschreibungen eines audiovisuellen Inhalts.
-
Das
Wiederverwendungsmodul 106 ist verantwortlich für das Auffinden
von existierenden beschreibenden Daten, die wieder verwendet werden können, um
eine neue Beschreibung eines audiovisuellen Inhalts zu erzeugen.
Bei einer Ausführungsform
liegen die beschreibenden bzw. deskriptiven Daten in der Datenspeichereinrichtung 104 eines oder
mehrerer Server 102. Alternativ können einige oder sämtliche
dieser deskriptiven Daten lokal in der Datenspeichereinrichtung 114 liegen.
Das Vorhandensein von deskriptiven Daten kann Teile oder gesamte
Beschreibungen von audiovisuellen Daten enthalten. Wie oben beschrieben,
wird bzw. ist jede Beschreibung mit einer zugehörigen Wiederverwendungsinformation
gespeichert. Das Wiederverwendungsmodul 106 ist verantwortlich
für das
Analysieren dieser Wiederverwendungsinformation, um zu bestimmen,
welcher Typ von Wiederverwendung für diese besondere Beschreibung
zulässig
ist.
-
Der
Beschreibungsprozessor 108 ist verantwortlich für die Erzeugung
von neuen Beschreibungen eines audiovisuellen Inhalts unter Heranziehung der
existierenden beschreibenden Daten und der zugehörigen Wiederverwendungsinformation.
Der Wiederverwendungsinformationserzeuger 119 ist verantwortlich
für die
Definition einer Wiederverwendungsinformation für die neu erzeugte Beschreibung eines
audiovisuellen Inhalts. Bei einer Ausführungsform wird bzw. ist die
neue Beschreibung lokal in der Datenspeichereinrichtung 114 gespeichert.
Alternativ wird die neue Beschreibung zum Server 102 übertragen,
um in der Datenspeichereinrichtung 104 gespeichert zu werden.
Bei jeder Ausführungsform
wird die neue Beschreibung mit der zugehörigen Wiederverwendungsinformation
gespeichert, um eine anschließende
Wiederverwendung dieser Beschreibung zu ermöglichen.
-
5 ist ein Flussdiagramm
einer Ausführungsform
zur Bereitstellung von verteilten Beschreibungen eines audiovisuellen
Inhalts. Am Verarbeitungsblock 504 wird eine neue Be schreibung
eines audiovisuellen Inhalts erzeugt. Bei einer Ausführungsform
wird die neue Beschreibung durch Wiederverwendung einer oder mehrerer
existierender Beschreibungen erzeugt, wie dies in weiteren Einzelheiten
unten in Verbindung mit 6 beschrieben wird.
Alternativ wird eine neue Beschreibung durch Abstrahieren aus einer
Vielzahl von existierenden Beschreibungen erzeugt, das heißt durch
Extrahieren üblicher
Attribute aus den existierenden Beschreibungen. Bei einer Ausführungsform
ist die neue Beschreibung ein Deskriptor. Alternativ ist die neue
Beschreibung ein Beschreibungsschema bzw. -system (DS). Wie oben
beschrieben, repräsentieren Deskriptoren
Merkmale eines audiovisuellen Inhalts und definieren die Syntax
und die Semantik der jeweiligen Merkmalsdarstellung. DSen spezifizieren die
Struktur und die Semantik der Beziehungen zwischen ihren Komponenten.
Diese Komponenten können
Deskriptoren und Beschreibungsschemen bzw. -systeme sein. Bei einer
Ausführungsform
ist die neue Beschreibung eine semantische Beschreibung. Eine semantische
Beschreibung kann solche semantische Entitäten, wie Ereignisse, Objekte,
Zustände, Beziehungen,
Episoden, deskriptive Strukturen, mentale Räume oder jegliche Kombination
der obigen semantischen Entitäten
beschreiben.
-
Beim
Verarbeitungsblock 506 wird die die anschließende Wiederverwendung
der erzeugten Beschreibung betreffende Information definiert. Diese Information
gibt an, welcher Typ von Wiederverwendung für diese Beschreibung zulässig ist.
Die Wiederverwendungsinformation kann beispielsweise angeben, ob
diese Beschreibung in eine andere bzw. weitere Beschreibung ohne Änderung
der beabsichtigten Bedeutung dieser Beschreibung eingebettet werden
kann, oder ob diese Beschreibung in Komponenten unterteilt werden
kann, die ihre Bedeutung beibehalten, wenn sie für eine Wiederverwendung extrahiert
werden. Die Wiederverwendungsinformation kann außerdem angeben, ob die Beschreibung transformiert
bzw. umgesetzt werden kann, um die Wiederverwendung dieser Beschreibung
zu ermöglichen.
So kann die Wiederverwendungsinformation beispielsweise spezifi zieren,
ob eine Beschreibung eines Auges gespiegelt werden kann, um eine
Beschreibung des anderen Auges zu erzeugen. Ferner kann die Wiederverwendungsinformation
angeben, ob die Beschreibung ihre transitive Eigenschaft beibehalten
kann, wenn diese Beschreibung wieder verwendet wird. Die Wiederverwendungsinformation kann
beispielsweise spezifizieren, ob die Beschreibung als Sub- bzw.
Untersatz funktioniert, falls diese Beschreibung in eine größere Beschreibung
eingebettet wird.
-
Beim
Verarbeitungsblock 508 werden die Beschreibung und die
zugehörige
Wiederverwendungsinformation in einer Speichereinrichtung von beschreibenden
Daten gespeichert, um die anschließende Wiederverwendung dieser
Beschreibung zu ermöglichen.
Die Wiederverwendungsinformation kann als Satz von Flags gespeichert
werden, die den verschiedenen Wiederverwendungstypen zugehörig sind,
als eine Zahl, welche eine Kombination von Wiederverwendungstypen
spezifiziert, die für
die Beschreibung zulässig
sind, oder in irgendeiner anderen Form. Bei einer Ausführungsform
wird die Beschreibung in einem Netzwerkserver gespeichert, und auf
sie kann durch eine Vielzahl von Client-Computern oder ein Netzwerk
(beispielsweise das Internet oder ein lokales Netzwerk) zugegriffen
werden. Alternativ kann die Beschreibung lokal auf einem Client-Computer gespeichert
werden, und auf sie kann durch die Benutzer des Client-Computers
zugegriffen werden. Bei jeder Ausführungsform kann die Beschreibung
anschließend
wiederverwendet werden, um neue Beschreibungen auf der Grundlage
der Wiederverwendungsinformation zu erzeugen, die dieser Beschreibung
zugeordnet ist.
-
6 ist ein Flussdiagramm
von einer Ausführungsform
für die
Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts.
Beim Verarbeitungsblock 604 werden existierende beschreibende
Daten gefunden, die in eine neue Beschreibung eingeschlossen sein
sollten. Bei einer Ausführungsform
enthalten die existierenden beschreibenden Daten eine oder meh rere
Beschreibungen eines audiovisuellen Inhalts (oder Teile von Beschreibungen),
die aus einer Vielzahl von Beschreibungen ausgewählt sind, welche in bzw. auf
einem Netzwerkserver(n) gespeichert sind. So kann ein Beschreibungs-Bereitsteller
beispielsweise eine Vielzahl von Beschreibungen erzeugen, die potentiell
eine ausgedehnte Anwendung haben, und sie auf einer Webseite für eine zukünftige Wiederverwendung
publizieren. Bei einem weiteren Beispiel können auf einer Webseite publizierte
Beschreibungen Abstraktionen (oder Schablonen) sein, die durch Extrahieren
von üblichen
Merkmalen aus verschiedenen existierenden Beschreibungen erzeugt
sind. Bei diesem Beispiel kann eine derartige Beschreibung mit einem
Anzeiger bzw. einem Hinweis gespeichert werden, der spezifiziert,
dass diese Beschreibung eine Abstraktion ist. Bei einer anderen
Ausführungsform
werden bzw. sind die existierenden beschreibenden Daten oder ihr
Teil aus einer lokalen Speichereinrichtung von beschreibenden Daten
ausgewählt.
-
Beim
Verarbeitungsblock 606 wird eine den ausgewählten beschreibenden
Daten zugeordnete Wiederverwendungsinformation analysiert, um zu bestimmen,
wie die ausgewählten
beschreibenden Daten wiederverwendet werden können. Wie oben beschrieben,
kann die Wiederverwendungsinformation angeben, ob die selektiven
beschreibenden Daten subsummiert, unterteilt oder transformatiert
werden können
oder ob die ausgewählten
beschreibenden Daten transitiv sind.
-
Beim
Verarbeitungsblock 608 wird eine neue Beschreibung unter
Heranziehung der ausgewählten beschreibenden
Daten und der zugeordneten Wiederverwendungsinformation erzeugt.
Bei einer Ausführungsform
enthält
die neue Beschreibung eine Bezugnahme auf die ausgewählten beschreibenden Daten
anstatt auf die Daten selbst, wodurch die Erzeugung einer großen und
komplexen Beschreibung vermieden ist. Da die beschreibenden Daten
aus einer Vielzahl von Beschreibungen (oder deren Teilen) bestehen,
kann die Beschreibung Bezugnahmen auf Mehrfachbeschreibungen enthalten.
So kann beispielsweise eine neue DS Bezug nahmen auf solche DSen
enthalten, wie beispielsweise Objekt-DSen, Ereignis-DSen, Zustands-DSen,
Beziehungs-DSen, Episoden-DSen, Beschreibungsstruktur-DSen und DSen
eines mentalen Raumes. In Abhängigkeit
von der Form der Wiederverwendung wird eine Abbildung der jeweiligen
existierenden Beschreibung in einer neuen Beschreibung benötigt. Bei
einer Ausführungsform
wird eine derartige Abbildung jedes Mal dann, wenn es erforderlich
ist, eine neue Beschreibung zu erzeugen, definiert. Alternativ wird
auf eine archivierte Version der Abbildung in einer neuen Beschreibung
Bezug genommen.
-
Bei
einer Ausführungsform
wird die neue Beschreibung dadurch erzeugt, dass die existierenden beschreibenden
Daten in einen Teil einer Beschreibung konvertiert werden und dass
diese Teilbeschreibung in einer neuen Beschreibung abgebildet wird. So
kann beispielsweise unter gegenwärtigen MPEG-7-Standards
eine vollständige
semantische Beschreibung Vielfachobjekte-DSen, Ereignis-DSen und Konzept-DSen
enthalten. Eine Konzept-DS,
deren Zweck darin liegt, einen Einschluss einer komplexen Abstraktion
zu ermöglichen,
kann wieder Objekt-DSen, Ereignis-DSen und Konzept-DSen enthalten.
Da eine Konzept-DS in Beschreibungen von Objekten und Ereignissen
eingeschlossen sein kann, erfordert die Erzeugung einer neuen Beschreibung
eines Objekts oder eines Ereignisses die Umsetzung einer existierenden
Konzept-DS in einen Teil der neuen Beschreibung und die Abbildung
dieser Konzept-DS in der neuen Beschreibung.
-
Bei
einer weiteren Ausführungsform
wird eine neue Beschreibung dadurch erzeugt, dass auf einen Teil
einer existierenden Beschreibung zugegriffen wird und dass diese
Teilbeschreibung in der neuen Beschreibung abgebildet wird, wodurch
die Wiederverwendung eines Teiles einer existierenden Beschreibung
ermöglicht
ist anstelle der gesamten existierenden Beschreibung. So kann beispielsweise
auf ein Objekt DS, welches innerhalb einer existierenden Konzept-DS
enthalten ist, zugegriffen werden, und die betreffende Objekt-DS
kann in einer neuen Beschreibung eines audiovisuellen Materials
abgebildet werden. Bei einer Ausführungsform wird eine Teilbeschreibung
aus einer existierenden Beschreibung extrahiert, in eine eigenständige Beschreibung
umgesetzt und dann in eine neue Beschreibung eingebettet.
-
Bei
einer noch weiteren Ausführungsform wird
eine neue Beschreibung dadurch erzeugt, dass verschiedene existierende
Beschreibungen (oder deren Teile) ausgewählt und unter Anwendung von Kombinationsregeln
aus einem Regel-Wörterbuch für die Kombination
von Beschreibungen kombiniert werden. Die existierenden Beschreibungen
werden in den Wörterbucheinträgen abgebildet,
und die Regeln werden ausgeführt,
um eine neue Beschreibung zu erzeugen. Sodann werden die entsprechenden Objekte
mit Teilen der neuen Beschreibung identifiziert. Die Regeln und
Beschreibungen können
auf der lokalen Maschine, in einem einzigen Datenspeicher oder in
mehreren Datenspeichern festgelegt sein, und sie können durch
den Beschreibungsprozessor ausgeführt werden. Die Datenspeicher
können
Regeln zur Ausführung
von Beschreibungen sowie zur Nutzung existierender Beschreibungen
haben, und diese sind in Wörterbüchern organisiert.
-
Bei
einer Ausführungsform
werden bzw. sind existierende Beschreibungen oder Teile von existierenden
Beschreibungen in neuen Beschreibungen unter Anwendung irgendwelcher
bekannter Mechanismen abgebildet, die imstande sind, Graphenoperationen
zwischen verschiedenen Beschreibungen von audiovisuellen Daten auszuführen. Alternativ können objektorientierte
Erbschaftmechanismen für diesen
Zweck genutzt werden. So ermöglicht
beispielsweise eine private Erbschaft die Erbschaft von Attributen
und Verfahren ohne den Erwerb einer Datentyp-Beziehung. Demgemäß kann eine private Erbschaft
beispielsweise dazu herangezogen werden, einen Teil einer existierenden
Beschreibung in einer neuen Beschreibung abzubilden. Eine öffentliche
Erbschaft stellt einen Mechanismus zur Erzeugung einer kategorischen
Struktur bereit. Damit kann die öffentli che
Erbschaft beispielsweise zur Abbildung einer existierenden Beschreibung,
die in einen Teil einer neuen Beschreibung umgesetzt ist, in die neue
Beschreibung herangezogen werden. Darüber hinaus können die
private Erbschaft und die öffentliche
Erbschaft dazu herangezogen werden, existierende Beschreibungen
auf bzw. bei neuen Beschreibungen abzubilden. So können beispielsweise
beide Erbschaftstypen dazu benutzt werden, existierende Beschreibungen
in Abstraktionen abzubilden und dann die Abstraktionen weiter in
einer neuen Beschreibung abzubilden, die diese Abstraktionen kombiniert.
-
Bei
einer Ausführungsform
ermöglicht
eine mehrfache Wiederverwendung von Beschreibungen eine De-fakto-Standardisierung
(im Gegensatz zur reinen Standardisierung) von Beschreibungen durch die
Kategorie. Dies heißt,
dass im Gegensatz zur reinen Standardisierung, die als Anfang in
MPEG-7 auferlegt ist, welche möglicherweise
nicht die Kategorien kennen kann, die sich in bzw. aus der Anwendung ergeben,
nachdem der Standard übernommen
ist, der Standard natürlich
durch Identifizieren mittels mehrfacher Wiederverwendung jener Beschreibungskategorien
erzeugt werden kann, die die höchste
Anwendung und Nutzung haben.
-
Gemäß einer
Ausführungsform
der vorliegenden Erfindung wird die Erzeugung von Beschreibungen
eines audiovisuellen Inhalts zur selben Zeit durchgeführt wie
die Erzeugung des audiovisuellen Inhalts durch dynamische Wiederverwendung
von existierenden Beschreibungen. Wenn beispielsweise ein Nachrichtenprogramm,
welches einer nationalen Katastrophe gewidmet ist, gleichzeitig
mit der fortgesetzten Berichterstattung über die nationale Katastrophe
beschrieben bzw. geschrieben wird, dann werden die Beschreibungen
des Nachrichtenprogramms dynamisch aktualisiert, um neue Beschreibungen
des sich entwickelnden Inhalts zu erzeugen.
-
7 ist ein Flussdiagramm
von einer Ausführungsform
zur dynamischen Wiederverwendung von Beschreibungen eines audio visuellen
Inhalts. Beim Verarbeitungsblock 704 wird eine erste Beschreibung
eines audiovisuellen Inhalts erzeugt. Beim Verarbeitungsblock 706 wird
eine der ersten Beschreibung zugehörige bzw. zugeordnete Wiederverwendungsinformation
definiert, wie dies oben in weiteren Einzelheiten beschrieben ist.
Bei einer Ausführungsform
werden die erste Beschreibung und die zugeordnete Wiederverwendungsinformation
in einen lokalen Datenspeicher gespeichert.
-
Beim
Verarbeitungsblock 708 wird die erste Beschreibung wiederverwendet,
um eine zweite Beschreibung eines modifizierten audiovisuellen Inhalts auf
der Grundlage der Wiederverwendungsinformation zu erzeugen. Die
zweite Beschreibung wird gleichzeitig mit der Erzeugung des modifizierten
audiovisuellen Inhalts erzeugt. Bei einer anderen Ausführungsform
wird die zweite Beschreibung durch Aktualisieren von Parameterwerten
der ersten Beschreibung erzeugt. Bei einer weiteren Ausführungsform
wird die zweite Beschreibung durch Kombinieren der ersten Beschreibung
mit anderen neuen oder existierenden beschreibenden Daten erzeugt.
Bei einer noch weiteren Ausführungsform
wird die zweite Beschreibung durch Wiederverwendung gewisser Teile
der ersten Beschreibung und Verwurf der anderen Teile der ersten
Beschreibung erzeugt, die nicht länger passend sind. Während der
Beschreibung einer Online-Episode können sich beispielsweise die Beziehungen
zwischen deren Objekten sowie die Strukturen ändern, die für deren
Beschreibung benötigt
werden. Sodann mag die gegenwärtige
Beschreibung es erfordern, durch Aktualisierung ihrer Parameterwerte
und durch Einbringen in neue Beschreibungen oder Teilbeschreibungen
modifiziert zu werden, um ein junges Verhalten zu beschreiben, Teile der
gegenwärtigen
Beschreibung zu verwerfen, die nicht länger benötigt werden.
-
Bei
einer Ausführungsform
wird eine dynamische Wiederverwendung unter Heranziehung einer objektorientierten
Modellierung, wie eines Systemmodells (SOM) von IBMTM.
SOM vorgenommen, was eine Architektur ist, die es ermöglicht,
dass Binär- Objekte von unterschiedlichen
Anwendungen gemeinsam genutzt werden, dass dynamische Änderungen von
Beschreibungen, Beziehungen und Attributen einer Struktur ermöglicht sind,
während
sich diese entwickelt.
-
Eine
Ausführungsform
der vorliegenden Erfindung nutzt ein semantisches Mosaik zur Erzeugung
neuer Beschreibungen audiovisuellen Inhalts. Ein semantisches Mosaik
ist eine Sammlung von verschiedenen Beschreibungen, die unter Verwendung von
Beziehungen zwischen benachbarten Beschreibungen gemischt sind. 8 veranschaulicht ein beispielhaftes
semantisches Mosaik 800. Das Mosaik 800 besteht
aus einer Vielzahl von semantischen Beschreibungen eines audiovisuellen
Inhalts, einschließlich
von Beschreibungen 1–18.
Wenn das Mosaik 800 erzeugt wird, werden die Beschreibungen, die
sich aufeinander beziehen, gemischt. So haben beispielsweise die
Beschreibungen 1 und 2 einen Punkt, an dem sie
dieselbe Information tragen. Dieser Punkt wird zum Zusammenmischen
der Beschreibungen 1 und 2 genutzt. Die Beschreibung 2 kann
außerdem
einen weiteren gemeinsamen Punkt mit einer Beschreibung 3 haben.
Dieser weitere Punkt kann zum Mischen der Beschreibung 3 mit
der Beschreibung 2 genutzt werden. Ein dritter gemeinsamer
Punkt kann dazu genutzt werden, die Beschreibungen 2 und 5 zusammenzumischen,
etc. Als Ergebnis wird die Beschreibung 2 mit den Beschreibungen 1, 3, 4 und 5 gemischt,
die sich alle auf die Beschreibung 2 beziehen, jedoch nicht
irgendwelche Beziehungen zwischen einander haben. Somit repräsentiert
das semantische Mosaik 800 eine Beschreibung, die nicht
im Besonderen irgendwelches semantisches Material beschreibt, sondern
die lokale Stücke
enthält,
welche Beschreibungen eines verschiedenen semantischen Inhalts repräsentieren.
Jedes lokale Stück
kann mehrere Beschreibungen kombinieren, um eine gewisse semantische
Entität zu
beschreiben. In Abhängigkeit
vom Kontext kann die Anzahl der in einem bestimmten lokalen Stück enthaltenen
Beschreibungen variieren. So kann beispielsweise in einem Kontext
die Kombination von Beschreibungen 5, 10 und 11 eine
vollständige
Beschreibung eines audiovisuellen In halts bereitstellen. In einem
anderen Kontext kann die Kombination von Beschreibungen 5, 9, 10, 12 und 13 erforderlich
sein, um eine vollständige
Beschreibung eines audiovisuellen Inhalts bereitzustellen. Wenn
eine neue Beschreibung erzeugt wird, kann ein in Frage kommendes
lokales Stück
wieder verwendet werden, um die neue Beschreibung zu erzeugen. Die
in jedem lokalen Stück
enthaltenen Beschreibungen haben zuvor definierte Beziehungen. Somit
können
neue Beschreibungen einfach dadurch erzeugt werden, dass in Frage
kommende bzw. geeignete lokale Stücke aus dem semantischen Mosaik
extrahiert werden. Alternativ können
die lokalen Stücke
mit anderen beschreibenden Daten zur Bildung von neuen Beschreibungen
kombiniert werden.
-
9 ist ein Blockdiagramm
einer Ausführungsform
eines Computersystems 900, innerhalb dessen ein Satz von
Befehlen ausgeführt
werden kann, um die Maschine zu veranlassen, irgendeine der oben
erörterten
Methodiken auszuführen.
Bei alternativen Ausführungsformen
kann die Maschine einen Netzwerk-Router,
einen Netzwerkschalter bzw. eine Netzwerkvermittlung, eine Netzwerkbrücke, einen
persönlichen
digitalen Assistenten (PDA), ein Handy (Mobilfunktelefon), eine
Web-Anwendung oder eine Maschine umfassen, die imstande ist, eine Folge
von Befehlen auszuführen,
die Aktionen spezifizieren, welche durch die betreffende Maschine
auszuführen
sind.
-
Das
Computersystem 900 enthält
einen Prozessor 902, einen Hauptspeicher 904 und
einen statischen Speicher 906, die über einen Bus 908 miteinander
kommunizieren. Das Computersystem 900 kann ferner eine
Videoanzeigeeinheit 910 (beispielsweise eine Flüssigkristallanzeige-(LCD)-Einrichtung oder
eine Kathodenstrahlröhre
(CRT)) enthalten. Das Computersystem 900 kann außerdem eine
alphanumerische Eingabevorrichtung 912 (beispielsweise eine
Tastatur), eine Zeiger- bzw. Cursor-Steuervorrichtung 914 (beispielsweise
eine Maus), eine Plattenlaufwerkseinheit 916, eine Signalerzeugungsvorrichtung 920 (z.B.
einen Lautsprecher) und eine Netzwerk-Schnittstellenvorrichtung 922 enthalten.
-
Die
Plattenlaufwerkseinheit 916 enthält ein computer-lesbares Medium 924,
auf dem ein Satz von Befehlen 926 (das ist Software) gespeichert
ist, welche irgendeine oder sämtliche
der oben beschriebenen Methodiken verkörpern. Die Software 916 ist außerdem dargestellt,
um vollständig
oder zumindest teilweise im Hauptspeicher 904 und/oder
innerhalb des Prozessors 902 zu liegen. Die Software 926 kann ferner über die
Netzwerks-Schnittstellenvorrichtung 922 übertragen
oder über
diese empfangen werden. Für
Zwecke dieser Anmeldung soll der Begriff "computer-lesbares Medium" jegliches Medium
einschließen,
welches imstande ist, eine Folge von Befehlen zur Ausführung durch
den Computer zu speichern und zu codieren, und welches den Computer
veranlasst, irgendeine der Methodiken der vorliegenden Erfindung
auszuführen.
Der Begriff "computerlesbares
Medium" soll demgemäß herangezogen
werden, um einzuschließen,
jedoch nicht zu beschränken, Halbleiterspeicher,
optische und magnetische Platten bzw. Discs und Trägerwellensignale.
-
Somit
sind ein Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen
eines audiovisuellen Inhalts beschrieben worden. Obwohl die vorliegende
Erfindung unter Bezugnahme auf spezifische beispielhafte Ausführungsformen
beschrieben worden ist, wird offensichtlich sein, dass verschiedene
Modifikationen und Änderungen
an diesen Ausführungsformen
ohne Abweichung vom breiteren Schutzumfang der Erfindung vorgenommen
werden können.
Demgemäß sind die
Beschreibung und die Zeichnungen in einem veranschaulichenden anstatt in
einem beschränkenden
Sinne zu betrachten.
-
Zusammenfassung
-
Beschränkte Autorisierung
-
Ein
Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen
eines audiovisuellen Inhalts (4)
werden beschrieben. Gemäß einer Ausführungsform
wird eine Beschreibung (104) eines audiovisuellen Inhalts
erzeugt, und eine eine Wiederverwendung der Beschreibung eines audiovisuellen Inhalts
betreffende Information wird festgelegt bzw. definiert. Ferner werden
die Beschreibung des audiovisuellen Inhalts und die Wiederverwendungsinformation
in einem Speicher (104) von beschreibenden Daten gespeichert,
um eine anschließende
Wiederverwendung dieser Beschreibung zu ermöglichen.
(5)