DE10297509T5

DE10297509T5 - Beschränkte Autorisierung

Info

Publication number: DE10297509T5
Application number: DE10297509T
Authority: DE
Inventors: Hawley K III San Jose Rising; Ali Beaverton Tabatabai
Original assignee: Sony Electronics Inc
Current assignee: Sony Electronics Inc
Priority date: 2001-12-03
Filing date: 2002-12-03
Publication date: 2004-11-11
Also published as: EP1461945A1; CN1618232A; JP2005512213A; EP1461945A4; US20040202450A1; WO2003049432A1; GB0413227D0; GB2400517B; CN100403788C; JP4328623B2; US7925139B2; GB2400517A; AU2002359556A1

Abstract

Verfahren zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts, umfassend:
Erzeugen einer ersten Beschreibung eines audiovisuellen Inhalts (504);
Definieren einer Information betreffend die Wiederverwendung der ersten Beschreibung (506);
und Speichern der ersten Beschreibung und der Information betreffend die Wiederverwendung der ersten Beschreibung (508) in einem Speicher (104) von beschreibenden Daten, um eine anschließende Wiederverwendung der ersten Beschreibung zu ermöglichen.

Description

Gebiet der Erfindung
Die vorliegende Erfindung bezieht sich auf eine Multimedia-Datenverarbeitung und spezieller auf eine Multimedia-Datenverarbeitung, die auf semantischen Beschreibungen basiert.
Hintergrund der Erfindung
Die Bewegtbild-Expertengruppe (MPEG) entwickelt Standards betreffend einen audiovisuellen Inhalt. Eine Komponente des MPEG-Standardsystems enthält MPEG-7-Standards, die darauf gerichtet sind, Beschreibungen eines audiovisuellen Inhalts bereitzustellen, der für den Benutzer von Interesse sein kann. Spezieller sind die MPEG-7-Standards dazu entwickelt, eine Information zu standardisieren, welche den audiovisuellen Inhalt beschreibt. Die MPEG-7-Standards können in verschiedenen Bereichen angewandt werden, einschließlich zur Speicherung und Wiederauffindung von audiovisuellen Posten aus Datenbanken, zu einer Sende-Medienauswahl, einem Teleshopping, von Multimedia-Präsentationen, für einen personalisierten Nachrichtendienst im Internet, etc.
Gemäß den MPEG-7-Standards bestehen Beschreibungen eines audiovisuellen Inhalts aus Deskriptoren und Beschreibungsschemen bzw. -systemen. Deskriptoren repräsentieren Merkmale des audiovisuellen Inhalts und legen die Syntax und die Semantik der jeweiligen Merkmalsdarstellung fest. Beschreibungsschemen bzw. -systeme (DS) spezifizieren die Struktur und Semantik der Beziehungen zwischen ihren Komponenten. Diese Komponenten können Deskriptoren und Beschreibungsschemen bzw. -systeme sein. Konzeptionelle Aspekte eines Beschreibungsschemas bzw. -systems können in einem Baum oder in einem Graphen organisiert sein. Die Graphenstruktur wird durch einen Satz von Knoten, die Elemente eines Beschreibungsschemas bzw. -systems repräsentieren, und einen Satz von Rändern festgelegt, welche die Beziehung zwischen den Knoten spezifizieren.
Beschreibungen (das sind Deskriptoren und DSen) eines audiovisuellen Inhalts werden in Segmentbeschreibungen und in semantische Beschreibungen unterteilt. Segmentbeschreibungen beschreiben den audiovisuellen Inhalt vom Standpunkt ihrer Struktur. Dies heißt, dass die Beschreibungen um Segmente herum strukturiert sind, die physikalische räumliche, zeitliche oder räumlich-zeitliche Komponenten des audiovisuellen Inhalts repräsentieren. Jedes Segment kann durch signalbasierte Merkmale (Farbe, Textur, Form, Bewegung, Audiomerkmale, etc.) und einige elementare semantische Information beschrieben sein bzw. werden.
Semantische Beschreibungen beschreiben den audiovisuellen Inhalt unter den konzeptionellen Gesichtspunkten, das sind die semantischen Beschreibungen, die die tatsächliche Bedeutung des audiovisuellen Inhalts beschreiben anstatt dessen Struktur. Die Segmentbeschreibungen und die semantischen Beschreibungen beziehen sich auf einen Satz von Verbindungen bzw. Verbindungsgliedern, die es ermöglichen, den audiovisuellen Inhalt auf der Grundlage der Inhaltsstruktur und der Semantik gemeinsam zu beschreiben. Die Verbindungsglieder beziehen unterschiedliche semantische Konzepte auf die Instanzen innerhalb des audiovisuellen Inhalts, der durch die Segmentbeschreibungen beschrieben ist.
Gegenwärtige semantische Beschreibungen sind in ihren deskriptiven Fähigkeiten beschränkt, da sie spezifische semantische Entitäten ohne Identifizierung der Beziehungen zwi schen diesen spezifischen semantischen Entitäten und anderen verwandten semantischen Entitäten beschreiben. So enthält das gegenwärtige Modell einer semantischen Beschreibung beispielsweise eine Vielzahl von DSen für verschiedene semantische Entitäten, wie beispielsweise ein Ereignis, ein Objekt, einen Zustand, ein abstraktes Konzept, etc. Ein Ereignis DS beschreibt eine bedeutungsvolle zeitliche Begrenzung bzw. Ortsbestimmung. Ein Ereignis DS kann beispielsweise einer konkreten Instanz in der realen Welt oder den Medien (z.B. einer Hochzeit) zugeordnet sein. Ein Objekt DS beschreibt semantisch ein spezifisches Objekt (z.B. ein in einem Bild abgebildetes Auto). Ein Zustand DS identifiziert semantische Eigenschaften der Entität (beispielsweise eines Objekts oder Ereignisses) zu einer vorgegebenen Zeit an einer vorgegebenen räumlichen Stelle oder in bzw. an einer vorgegebenen Medienstelle. Ein Konzept DS beschreibt abstrakte Elemente, die durch Abstraktion aus konkreten Objekten und Ereignissen nicht erzeugt werden. Konzepte, wie die Freiheit oder ein Geheimnis bzw. Rätsel sind typische Beispiele von Entitäten, die durch Konzeptbeschreibungen beschrieben werden.
Die obigen DSen beschreiben spezifische Entitäten. Eine Beschreibung kann nicht vollständig sein, wenn sie lediglich eine individuelle Entität selbst beschreibt. Die meiste menschliche Beschreibung und Kommunikation wird dadurch vorgenommen, dass Informationen zusammengebracht werden, wobei eine Information selten vollständig in irgendeinem Austausch dargestellt wird. Hinweise sind in Sprache vorhanden, die die beiden Parteien veranlassen, vernünftige kompatible oder ähnliche mentale Modelle zu konstruieren, und die erörterte Information wird innerhalb eines solchen Kontextes diskutiert. Demgemäß kann eine Beschreibung nicht genau und vollständig den Inhalt beschreiben, solange sie nicht verschiedene zusätzliche Informationen bezüglich dieses Inhalts enthält. Diese zusätzliche Information kann eine Hintergrundinformation, eine Kontextinformation, eine Beziehungen zwischen dem Inhalt, der beschrieben wird, und anderen Entitäten, etc. identifizierende Information enthalten.
Zusätzlich existiert kein gegenwärtiger Mechanismus zur Erzeugung von Beschreibungen von Metaphern oder Analogien. Eine traditionelle Meinung besteht darin, dass semantische Beschreibungen lediglich audiovisuelles Material beschreiben sollten und dass daher ein Bedarf für die Erzeugung von Metapher-Beschreibungen existiert. Menschen nutzen jedoch Metaphern und Analogien die ganze Zeit, ohne eine solche Anwendung zu realisieren. Derartige Metaphern und Analogien, wie "Ein Gefühl, wie ein Fisch aus dem Wasser", "An die Grenzlinie nahe herankommen", "Fliegen wie ein Vogel", etc. sind der menschlichen Kommunikation inhärent. Daher wäre es unerwünscht, Beschreibungen von Metaphern und Analogien aus einer Liste möglicher Beschreibungen auszuschließen.
Ferner sind gegenwärtige semantische Beschreibungen statisch. Wenn das durch eine existierende semantische Beschreibung beschriebene Material sich ändert, muss der Prozess zur Erzeugung einer Beschreibung erneut ausgeführt werden, um eine durch das geänderte Material beschriebene neue semantische Beschreibung zu erzeugen.
Demgemäß ist ein Werkzeug zur Erzeugung von semantischen Beschreibungen erforderlich, das imstande ist, jegliche semantische Situation, audiovisuell oder sonst wie, vollständig und genau zu beschreiben. Ein derartiges Werkzeug sollte außerdem imstande sein, Beschreibungen zu erzeugen, die dynamisch Änderungen im beschriebenen Material reflektieren würden.
Zusammenfassung der Erfindung
Ein Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts werden beschrieben. Gemäß einer Ausführungsform wird eine Beschreibung eines au diovisuellen Inhalts erzeugt, und eine eine Wiederverwendung der Beschreibung des audiovisuellen Inhalts betreffende Information wird definiert. Ferner werden die Beschreibung des audiovisuellen Inhalts und die entsprechende Wiederverwendungsinformation in einem Speicher (Repository) aus deskriptiven Daten gespeichert, um eine anschließende Wiederverwendung dieser Beschreibung zu ermöglichen.
Die vorliegende Erfindung ist in den Figuren der beigefügten Zeichnungen, in denen entsprechende Bezugszeichen ähnliche bzw. entsprechende Elemente bezeichnen, beispielhaft und nicht beschränkend veranschaulicht.
1 und 2 sind Ausführungsformen des Standes der Technik zur Erzeugung von mentalen Räumen;
3 veranschaulicht eine Hierarchie von verschiedenen strukturellen Formen semantischer Beschreibungen eines audiovisuellen Inhalts;
4 ist ein Blockdiagramm einer Ausführungsform eines Systems zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts;
5 ist ein Flussdiagramm einer Ausführungsform zur Bereitstellung verteilter Beschreibungen eines audiovisuellen Inhalts;
6 ist ein Flussdiagramm einer Ausführungsform zur Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts;
7 ist ein Flussdiagramm einer Ausführungsform zur dynamischen Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts;
8 veranschaulicht ein beispielhaftes semantisches Mosaik; und
9 ist ein Blockdiagramm einer Ausführungsform eines Computersystems.
Detaillierte Beschreibung
Es werden ein Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts beschrieben. In der folgenden detaillierten Beschreibung der vorliegenden Erfindung werden zahlreiche spezifische Details ausgeführt, um ein völliges Verständnis der vorliegenden Erfindung zu liefern. Es wird jedoch für einen Durchschnittsfachmann auf dem Gebiet der Technik ersichtlich sein, dass die vorliegende Erfindung ohne diese spezifischen Details praktisch ausgeführt werden kann. In einigen Fällen sind gut bekannte Strukturen und Vorrichtungen in Blockdiagrammform anstatt im Detail dargestellt, um eine Verdunkelung der vorliegenden Erfindung zu vermeiden.
Einige Teile der detaillierten Beschreibungen, die folgen, werden in Begriffen von Algorithmen und symbolischen Darstellungen von Operationen bezüglich Datenbits innerhalb eines Computerspeichers gegeben. Diese algorithmischen Beschreibungen und Darstellungen sind die Mittel, die von Durchschnittsfachleuten auf dem Gebiet der Datenverarbeitung genutzt werden, um höchst effektiv die Substanz ihrer Arbeit an andere Durchschnittsfachleute auf dem betreffenden Gebiet weiterzuleiten. Ein Algorithmus stellt man sich hier und generell als eine widerspruchsfreie Sequenz von Schritten vor, die zu einem gewünschten Ergebnis führen. Die Schritte sind solche, die physikalische Manipulationen von physikalischen Quantitäten bzw. Größen erfordern. Üblicherweise, obwohl nicht notwendigerweise besitzen diese Quantitäten die Form von elektrischen oder magnetischen Signalen, die imstande sind, gespeichert, übertragen, kombiniert, verglichen oder sonst wie manipuliert zu werden. Es hat sich zuweilen als praktisch bzw. günstig erwiesen, prinzipiell aus Gründen eines gemeinsamen Gebrauchs, sich auf diese Signale als Bits, Werte, Elemente, Symbole, Zeichen, Terme, Zahlen bzw. Nummern oder dergleichen zu beziehen.
Es sollte jedoch in Erinnerung behalten werden, dass alle diese und ähnliche Terme den in Frage kommenden physikalischen Quantitäten zuzuordnen sind und lediglich auf diese Quantitäten angewandte zweckmäßige Etiketten sind. Sofern nicht speziell anders angegeben, offensichtlich aus der vorliegenden Erörterung ersichtlich, wird es geschätzt, dass durch die Beschreibung, Erörterungen unter Nutzung von Termen, wie "Verarbeitung" oder "Berechnung" ("Computing") oder "Berechnen" ("Calculating") oder "Bestimmen" oder "Anzeigen" oder dergleichen sich auf die Aktion und die Prozesse eines Computersystems oder einer entsprechenden bzw. ähnlichen elektronischen Rechenvorrichtung beziehen, die Daten, welche als physikalische (elektronische) Quantitäten innerhalb der Computersystem-Register und -Speicher dargestellt sind, manipuliert und in andere Daten transformiert, die ähnlich bzw. entsprechend als physikalische Quantitäten innerhalb der Computersystem-Speicher oder -Register oder anderer derartiger Informationsspeicher-, -übertragungs- oder Anzeigevorrichtungen dargestellt werden.
Die vorliegende Erfindung bezieht sich außerdem auf eine Vorrichtung zur Ausführung der Operationen hierin. Die Vorrichtung kann speziell für die geforderten Zwecke konstruiert sein, oder sie kann einen Allzweck-Computer umfassen, der selektiv durch ein in dem Computer gespeichertes Computerprogramm aktiviert oder rekonfiguriert ist bzw. wird. Ein derartiges Computerprogramm kann in einem computerlesbaren Speichermedium gespeichert sein, wie in irgendeinem – ohne darauf beschränkt zu sein – Typ von Diskette, einschließlich von Floppydiscs, optischen Platten bzw. Discs, CD-ROMs und magnetooptischen Platten, Festwertspeichern (ROMs), Schreib-Lese-Speichern mit wahlfreiem Zugriff (RAMs), EPROMs, EEPROMs, magnetischen oder optischen Karten oder irgendeinem Typ von Medien, die für die Speicherung von elektronischen Befehlen geeignet sind und die jeweils mit einem Computersystembus verbunden sind.
Die hier dargestellten Algorithmen und Anzeigen beziehen sich nicht inhärent auf irgendeinen praktischen Computer oder eine andere Vorrichtung. Verschiedene Allzwecksysteme können mit Programmen gemäß den Lehren hier genutzt werden, oder es kann sich als zweckmäßig erweisen, eine stärker spezialisierte Vorrichtung zu konstruieren, um die geforderten Verfahrensschritte auszuführen. Die geforderte Struktur für eine Vielfalt dieser Systeme wird aus der nachstehenden Beschreibung hervorgehen. Darüber hinaus wird die vorliegende Erfindung nicht unter Bezugnahme auf irgendeine besondere Programmiersprache beschrieben. Es wird verständlich sein, dass eine Vielfalt von Programmiersprachen angewandt werden, um die Lehren der Erfindung, wie hier beschrieben, zu implementieren.
Die vorliegende Erfindung bezieht sich auf verschiedene Aspekte der Erzeugung von Beschreibungen eines audiovisuellen Inhalts. Wie oben beschrieben, mangelt es den gegenwärtigen deskriptiven Werkzeugen an der Fähigkeit, Beschreibungen zu erzeugen, die einen audiovisuellen Inhalt in einer vollständigen und genauen Weise beschreiben können. Diese Beschränkung wird durch die Entitäts-spezifische Natur der gegenwärtigen semantischen Beschreibungen hervorgerufen. Dies heißt, dass jede semantische Beschreibung eine spezifische Entität unabhängig von der kontextuellen und Hintergrundinformation beschreibt, welche sich auf diese spezifische Entität bezieht. Dieser Ansatz widerspricht jedoch den Regeln, welche die Wahrnehmung und Interpretation von Sprache bestimmen, was der Prototyp für semantische Beschreibungen ist. Einige dieser Regeln basieren auf der Anwendung der mentalen Raumtheorie, die im Stand der Technik bekannt ist.
Mentale bzw. geistige Räume liefern den Kontext für eine Kommunikation, indem sie eine Menge an Information, die nicht in der Sprache enthalten ist, importieren, wodurch ein Mechanismus zum Interpretieren des semantischen Inhalts in einer Sprache bereitgestellt wird. Diese Information wird unter Verwendung von Karten importiert. Diese Karten funktionieren durch die Verwendung (das heißt durch "Rekrutieren") von Kästchen, die vordefinierte Konstruktionen zur Interpretation, eine Projektionsstruktur von einem mentalen Raum zu einem anderen und zum Integrieren oder Abstrahieren von importiertem Material von mehr als einem anderen mentalen Raum darstellen. Demgemäß kann jeder mentale Raum eine erweiterte Beschreibung repräsentieren, die Entitätenbeziehungen und Kästchen enthält. Mehrere mentale Räume können auf einmal aktiv sein, sämtliche der Entitäten in der Beschreibung in geeigneter Weise zu definieren. Diese mentalen Räume treten in Beziehungen miteinander ein. Da sich die mentalen Räume Struktur und Entitäten voneinander borgen, sind Abbildungen zwischen diesen mentalen Räumen notwendig. Die gesamten zusammengesetzten Formen bilden eine Kulisse für die ausgedrückte Beschreibung und vervollständigen den Prozess des Anbringens der semantischen Bedeutung an die involvierten Entitäten.
1 und 2 sind Ausführungsformen des Standes der Technik zur Erzeugung von mentalen Räumen. Gemäß 1 wird ein neuer mentaler Raum 50 dadurch erzeugt, dass einige der Rahmen bzw. Kästchen 10 rekrutiert werden und dass Strukturen von existierenden mentalen Räumen 20 und 30 geborgt werden. Gemäß 2 wird ein neuer mentaler Raum 70 dadurch gebildet, dass zwei existierende mentale Räume 62 und 64 gemischt oder integriert werden. Ein artmäßiger Raum 66 kann dann durch Abstraktion aus allen drei mentalen Räumen erzeugt werden: der neue mentale Raum 70 und die existierenden mentalen Räume 64 und 62. Ein artmäßiger Raum 66 enthält Strukturen, die den mentalen Räumen 62, 64 und 70 gemeinsam sind.
Die vorliegende Erfindung nutzt das mentale Raummodell, um die Erzeugung von semantischen Beschreibungen zu ermöglichen, welche imstande sind, jegliche semantische Situation vollständig zu beschreiben. Bei einer Ausführungsform basiert das Werkzeug zur Erzeugung der vollständigen semantischen Be schreibungen auf einer Anzahl von Beschreibungskategorien. Diese Kategorien können Objekte, Ereignisse, Zustände, Episoden, Rahmen bzw. Kästchen, beschreibende Strukturen und mentale Räume enthalten. Der Begriff "Objekt", wie er hier verwendet wird, bezieht sich auf eine Beschreibung eines realen Objekts oder auf eine Zusammensetzung oder Abstraktion von verschiedenen realen Objekten. Objekte enthalten Zustände. Jeder Zustand ist eine Sammlung von Attributen, die Objekten und Beziehungen angehängt sind. Durch Erweiterung können Zustände Sammlungen von mentalen Räumen beitragen. Objekte können Subobjekte haben, und Objektzustände können Subzustände haben. Eine Änderung im Zustand ist ein Ereignis. Als solches kann ein Ereignis eine Änderung in irgendeinem der Bestandteile der Beschreibung eines Objekts oder einer Beziehung sein (einschließlich dessen, was die mentalen Räume darstellt). Da Zustände Subzustände haben können, können Ereignisse Subereignisse haben.
Zustände können außerdem an Episoden angehängt sein, und ein Ereignis kann eine Änderung in irgendeinem der Bestandteile einer Beschreibung einer Episode sein. Eine Episode ist eine semantisch signifikante Zeitspanne. Episoden können mit dem Verhalten von Objekten, mit dem Auftreten von Ereignissen, mit Änderungen in Beziehungen oder mit Änderungen in mentalen Räumen koinzidieren, die zur Bereitstellung des Kontextes für die Objekte, Ereignisse und Beziehungen genutzt werden. Falls semantisch signifikante Zeitspannen in einer Episode richtig enthalten sind, sind sie Subepisoden.
Ein Rahmen bzw. Kästchen ist ein angenommener oder vordefinierter Satz von Regeln zum Interpretieren oder Beschreiben eines Satzes von semantischen Objekten. Als solches können Rahmen bzw. Kästchen prototypische Beschreibungen von sich selbst sein, oder sie können Sätze von Regeln, Definitionen und beschreibenden Strukturen sein. Beschreibende Strukturen sind Abstraktionen von Objekten, Episoden, Zuständen und Beziehungen. Ein mentaler Raum ist eine Sammlung von Objekten, Beziehungen und Rahmen zusammen mit Abbildungen, die beschreibende Strukturen von Beschreibungen oder von anderen mentalen Räumen einbetten.
Eine vollständige Beschreibung des semantischen Inhalts kann aus irgendeiner Kombination von Beschreibungen der obigen Kategorien bestehen. Darüber hinaus sollte die vollständige Beschreibung Beschreibungen von Beziehungen zwischen semantischen Entitäten enthalten, die in der vollständigen Beschreibung des semantischen Inhalts enthalten sind. Eine Beziehung zwischen den Entitäten ist entweder eine Beziehung oder eine Abbildung. Da Beziehungen als Zusammensetzungen von Abbildungen ausgedrückt werden können, kann der Begriff "Abbildung" auch zur Identifizierung einer Beziehung herangezogen werden. Beziehungen können von verschiedenen Typen sein, wie beispielsweise ein Einschluss, ein Containment, eine Ähnlichkeit, ein Beispiel von, eine relative Position, etc.
Die Beziehungen zwischen Objekten bilden eine Struktur. Ferner ist die Abbildung von Objekten, Zuständen und Ereignissen in einer Episode eine Struktur. Die Abbildungen, die die darunter liegenden mentalen Räume ausmachen, sind Strukturen. Zustände können als Karten von den Entitäten repräsentiert werden, die durch Zustände für Räume von Attributwerten beschrieben sind. Sogar Objekte können als Struktur beschrieben werden bzw. sein: Objekte sind in einer 1-zu-1-Korrespondenz mit den Abbildungen von irgendeinem Punkt, der auf die Objekte selbst festgelegt ist, oder mit irgendwelchen Abbildungen von den Objekten selbst auf einem festgelegten Punkt). Damit ist die Struktur ein inhärenter Teil eines semantischen Beschreibungskonstruktes.
Die Struktur kann verschiedene Formen annehmen, einschließlich Morphismen, Graphen, Kategorien, Funktoren, natürliche Transformationen, etc. Morphismen sind Pfeile zwischen Objekten einer Kategorie. Eine Kategorie besteht aus zwei Sätzen, einem Satz von Objekten und einem Satz von Morphismen, welche den folgenden zwei Regeln gehorchen:

1) Für jedes Objekt muss ein Morphismus zu sich selbst vorhanden sein, genannt der "Identitäts"-Morphismus;
2) falls f ein Morphismus von A nach B ist und falls g ein Morphismus von B nach C ist, dann muss ein Morphismus (üblicherweise geschrieben als (g o f)) von A nach C sein, der der ersten Bestimmung f und dann der Bestimmung g äquivalent ist.

Es ist möglich, zwischen Kategorien Abbildungen zu definieren. Abbildungen zwischen Kategorien müssen Objekte für Objekte und Morphismen für Morphismen heranziehen. Abbildungen zwischen Kategorien benötigen ebenfalls die Heranziehung der Quelle und des Zieles irgendeines Morphismus zur Quelle und dem Ziel seines Bildes unter der Abbildung (dies ist eine Regel, die Morphismen für die Kategorie von Graphen definiert). Abbildungen zwischen Kategorien müssen zwei Einschränkungen genügen, kategorische Einschränkungen genannt:

1) Sie müssen die Identitätskarten zur Identität der Karten heranziehen; und
2) sie müssen Zusammensetzungen aufrecht erhalten, das heißt, dass dann, wenn F von A bis X, B bis Y, C bis Z und f bis h sowie g bis p heranzieht, muss F (g o f) bis (p o h) herangezogen werden. Jegliche Karte, die den obigen Einschränkungen gehorcht, wird "kategorisch" genannt.

Eine kategorische Karte zwischen zwei Kategorien wird ein Funktor genannt. Ein Funktor bildet zwischen Kategorien ab, z.B. F bildet die Kategorie C auf die Kategorie D ab. Es ist möglich, dies mit C und D als entsprechende bzw. ähnliche Objekte anzusehen, und F ist ähnlich bzw. entspricht einem Pfeil (Morphismus). Falls G die Kategorie H auf die Kategorie J abbildet, dann können wir eine neue Karte erstellen, die C bis H, D bis J und F bis H heranzieht. Falls diese neue Karte kategorischen Beschränkungen folgt, dann wird sie eine natürlich Transformation genannt.
3 veranschaulicht eine Hierarchie von verschiedenen strukturellen Formen einer semantischen Beschreibung eines audiovisuellen Inhalts. Der Morphismus 302 ist ein Kästchen zwischen zwei Objekten 304. Jede Kategorie 310 besteht aus einem Satz von Objekten (beispielsweise einschließlich der Objekte 304) und einem Satz von Morphismen (beispielsweise einschließlich des Morphismus 302). Der Funktor 306 ist ein Kästchen zwischen Kategorien 310. Eine natürliche Transformation 308 ist ein Kästchen zwischen Funktoren. Es besteht dort kein Bedarf, ein Kästchen zwischen natürlichen Transformationen zu machen, da die Hierarchie unter Heranziehung der "Funktor-Kategorien" fortgesetzt werden kann).
Somit kann eine vollständige Beschreibung eines audiovisuellen Inhalts Beschreibungen von verschiedenen semantischen Einheiten (beispielsweise Objekte, Ereignisse, Zustände, Episoden, Rahmen, beschreibende Strukturen und mentale Räume) zusammen mit Beschreibungen enthalten, die die Struktur der vollständigen Beschreibung ausdrücken. Obwohl dieser Ansatz bzw. diese Lösung semantische Beschreibungen bereitstellt, die jegliche semantische Beschreibung in einer vollständigen und genauen Weise zu beschreiben imstande ist, kann sie einen signifikanten Grad an Komplexheit den resultierenden semantischen Beschreibungen hinzufügen. Eine Ausführungsform der vorliegenden Erfindung ist auf diese Komplexheit durch Verteilung von existierenden Beschreibungen eines audiovisuellen Inhalts gerichtet. Bei dieser Ausführungsform können existierende Beschreibungen erzielt und dann wieder verwendet werden, um neue Beschreibungen zu erzeugen, wie dies unten in weiteren Einzelheiten beschrieben wird.
4 ist ein Blockdiagramm einer Ausführungsform eines Systems 100 zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts. Das System 100 besteht aus einem oder mehreren Server-Computern 112, die mit einem oder mehreren Client-Computern, wie dem Client 112 verbunden sind. Der Client 112 kann mit dem Server 102 über irgendeine Draht- oder drahtlose Kommunikationsverbindung kommunizieren, einschließlich beispielsweise über ein öffentliches Netzwerk, wie das Internet, ein lokales Netzwerk, wie das Ethernet, ein Intranet und ein LAN-Netzwerk (lokales Bereichsnetzwerk) oder über eine Kombination von Netzwerken. Der Client 112 und der Server 102 können jeweils irgendein Typ einer Rechenvorrichtung sein, wie beispielsweise ein Desktop- bzw. Tischrechner, eine Arbeitsstation, ein Laptop, ein Mainframe-Rechner, etc.
Bei einer Ausführungsform enthält der Server 102 eine Datenspeichereinrichtung 104, die verschiedene Beschreibungen eines audiovisuellen Inhalts speichert. Bei einer Ausführungsform enthält die Datenspeichereinrichtung 104 lediglich semantische Beschreibungen eines audiovisuellen Inhalts, das heißt Beschreibungen, die die tatsächliche Bedeutung des audiovisuellen Inhalts beschreiben. Alternativ speichert die Datenspeichereinrichtung 104 Beschreibungen von anderen Typen (beispielsweise Segmentbeschreibungen) zusätzlich zu semantischen Beschreibungen. Beschreibungen werden unabhängig von dem audiovisuellen Inhalt, den sie beschreiben, gespeichert. Bei einer Ausführungsform wird jede Beschreibung mit einer zugeordneten Wiederverwendungsinformation gespeichert, die angibt, wie dies Beschreibung wieder verwendet werden kann, um andere bzw. weitere Beschreibungen eines audiovisuellen Inhalts zu erzeugen. Die Funktionalität der Wiederverwendungsinformation wird unten in weiteren Einzelheiten beschrieben.
Der Client 112 enthält ein Werkzeug zur Erzeugung von neuen Beschreibungen durch die Wiederverwendung von existierenden Beschreibungen eines audiovisuellen Inhalts. Bei einer Ausführungsform enthält dieses Werkzeug ein Wiederverwendungsmodul 106, einen Beschreibungsprozessor 108 und einen Wiederverwendungsinformationserzeuger 110. Bei einer Ausführungsform enthält der Client 112 ebenfalls eine Datenspeichereinrichtung 114 zur lokalen Speicherung von Beschreibungen eines audiovisuellen Inhalts.
Das Wiederverwendungsmodul 106 ist verantwortlich für das Auffinden von existierenden beschreibenden Daten, die wieder verwendet werden können, um eine neue Beschreibung eines audiovisuellen Inhalts zu erzeugen. Bei einer Ausführungsform liegen die beschreibenden bzw. deskriptiven Daten in der Datenspeichereinrichtung 104 eines oder mehrerer Server 102. Alternativ können einige oder sämtliche dieser deskriptiven Daten lokal in der Datenspeichereinrichtung 114 liegen. Das Vorhandensein von deskriptiven Daten kann Teile oder gesamte Beschreibungen von audiovisuellen Daten enthalten. Wie oben beschrieben, wird bzw. ist jede Beschreibung mit einer zugehörigen Wiederverwendungsinformation gespeichert. Das Wiederverwendungsmodul 106 ist verantwortlich für das Analysieren dieser Wiederverwendungsinformation, um zu bestimmen, welcher Typ von Wiederverwendung für diese besondere Beschreibung zulässig ist.
Der Beschreibungsprozessor 108 ist verantwortlich für die Erzeugung von neuen Beschreibungen eines audiovisuellen Inhalts unter Heranziehung der existierenden beschreibenden Daten und der zugehörigen Wiederverwendungsinformation. Der Wiederverwendungsinformationserzeuger 119 ist verantwortlich für die Definition einer Wiederverwendungsinformation für die neu erzeugte Beschreibung eines audiovisuellen Inhalts. Bei einer Ausführungsform wird bzw. ist die neue Beschreibung lokal in der Datenspeichereinrichtung 114 gespeichert. Alternativ wird die neue Beschreibung zum Server 102 übertragen, um in der Datenspeichereinrichtung 104 gespeichert zu werden. Bei jeder Ausführungsform wird die neue Beschreibung mit der zugehörigen Wiederverwendungsinformation gespeichert, um eine anschließende Wiederverwendung dieser Beschreibung zu ermöglichen.
5 ist ein Flussdiagramm einer Ausführungsform zur Bereitstellung von verteilten Beschreibungen eines audiovisuellen Inhalts. Am Verarbeitungsblock 504 wird eine neue Be schreibung eines audiovisuellen Inhalts erzeugt. Bei einer Ausführungsform wird die neue Beschreibung durch Wiederverwendung einer oder mehrerer existierender Beschreibungen erzeugt, wie dies in weiteren Einzelheiten unten in Verbindung mit 6 beschrieben wird. Alternativ wird eine neue Beschreibung durch Abstrahieren aus einer Vielzahl von existierenden Beschreibungen erzeugt, das heißt durch Extrahieren üblicher Attribute aus den existierenden Beschreibungen. Bei einer Ausführungsform ist die neue Beschreibung ein Deskriptor. Alternativ ist die neue Beschreibung ein Beschreibungsschema bzw. -system (DS). Wie oben beschrieben, repräsentieren Deskriptoren Merkmale eines audiovisuellen Inhalts und definieren die Syntax und die Semantik der jeweiligen Merkmalsdarstellung. DSen spezifizieren die Struktur und die Semantik der Beziehungen zwischen ihren Komponenten. Diese Komponenten können Deskriptoren und Beschreibungsschemen bzw. -systeme sein. Bei einer Ausführungsform ist die neue Beschreibung eine semantische Beschreibung. Eine semantische Beschreibung kann solche semantische Entitäten, wie Ereignisse, Objekte, Zustände, Beziehungen, Episoden, deskriptive Strukturen, mentale Räume oder jegliche Kombination der obigen semantischen Entitäten beschreiben.
Beim Verarbeitungsblock 506 wird die die anschließende Wiederverwendung der erzeugten Beschreibung betreffende Information definiert. Diese Information gibt an, welcher Typ von Wiederverwendung für diese Beschreibung zulässig ist. Die Wiederverwendungsinformation kann beispielsweise angeben, ob diese Beschreibung in eine andere bzw. weitere Beschreibung ohne Änderung der beabsichtigten Bedeutung dieser Beschreibung eingebettet werden kann, oder ob diese Beschreibung in Komponenten unterteilt werden kann, die ihre Bedeutung beibehalten, wenn sie für eine Wiederverwendung extrahiert werden. Die Wiederverwendungsinformation kann außerdem angeben, ob die Beschreibung transformiert bzw. umgesetzt werden kann, um die Wiederverwendung dieser Beschreibung zu ermöglichen. So kann die Wiederverwendungsinformation beispielsweise spezifi zieren, ob eine Beschreibung eines Auges gespiegelt werden kann, um eine Beschreibung des anderen Auges zu erzeugen. Ferner kann die Wiederverwendungsinformation angeben, ob die Beschreibung ihre transitive Eigenschaft beibehalten kann, wenn diese Beschreibung wieder verwendet wird. Die Wiederverwendungsinformation kann beispielsweise spezifizieren, ob die Beschreibung als Sub- bzw. Untersatz funktioniert, falls diese Beschreibung in eine größere Beschreibung eingebettet wird.
Beim Verarbeitungsblock 508 werden die Beschreibung und die zugehörige Wiederverwendungsinformation in einer Speichereinrichtung von beschreibenden Daten gespeichert, um die anschließende Wiederverwendung dieser Beschreibung zu ermöglichen. Die Wiederverwendungsinformation kann als Satz von Flags gespeichert werden, die den verschiedenen Wiederverwendungstypen zugehörig sind, als eine Zahl, welche eine Kombination von Wiederverwendungstypen spezifiziert, die für die Beschreibung zulässig sind, oder in irgendeiner anderen Form. Bei einer Ausführungsform wird die Beschreibung in einem Netzwerkserver gespeichert, und auf sie kann durch eine Vielzahl von Client-Computern oder ein Netzwerk (beispielsweise das Internet oder ein lokales Netzwerk) zugegriffen werden. Alternativ kann die Beschreibung lokal auf einem Client-Computer gespeichert werden, und auf sie kann durch die Benutzer des Client-Computers zugegriffen werden. Bei jeder Ausführungsform kann die Beschreibung anschließend wiederverwendet werden, um neue Beschreibungen auf der Grundlage der Wiederverwendungsinformation zu erzeugen, die dieser Beschreibung zugeordnet ist.
6 ist ein Flussdiagramm von einer Ausführungsform für die Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts. Beim Verarbeitungsblock 604 werden existierende beschreibende Daten gefunden, die in eine neue Beschreibung eingeschlossen sein sollten. Bei einer Ausführungsform enthalten die existierenden beschreibenden Daten eine oder meh rere Beschreibungen eines audiovisuellen Inhalts (oder Teile von Beschreibungen), die aus einer Vielzahl von Beschreibungen ausgewählt sind, welche in bzw. auf einem Netzwerkserver(n) gespeichert sind. So kann ein Beschreibungs-Bereitsteller beispielsweise eine Vielzahl von Beschreibungen erzeugen, die potentiell eine ausgedehnte Anwendung haben, und sie auf einer Webseite für eine zukünftige Wiederverwendung publizieren. Bei einem weiteren Beispiel können auf einer Webseite publizierte Beschreibungen Abstraktionen (oder Schablonen) sein, die durch Extrahieren von üblichen Merkmalen aus verschiedenen existierenden Beschreibungen erzeugt sind. Bei diesem Beispiel kann eine derartige Beschreibung mit einem Anzeiger bzw. einem Hinweis gespeichert werden, der spezifiziert, dass diese Beschreibung eine Abstraktion ist. Bei einer anderen Ausführungsform werden bzw. sind die existierenden beschreibenden Daten oder ihr Teil aus einer lokalen Speichereinrichtung von beschreibenden Daten ausgewählt.
Beim Verarbeitungsblock 606 wird eine den ausgewählten beschreibenden Daten zugeordnete Wiederverwendungsinformation analysiert, um zu bestimmen, wie die ausgewählten beschreibenden Daten wiederverwendet werden können. Wie oben beschrieben, kann die Wiederverwendungsinformation angeben, ob die selektiven beschreibenden Daten subsummiert, unterteilt oder transformatiert werden können oder ob die ausgewählten beschreibenden Daten transitiv sind.
Beim Verarbeitungsblock 608 wird eine neue Beschreibung unter Heranziehung der ausgewählten beschreibenden Daten und der zugeordneten Wiederverwendungsinformation erzeugt. Bei einer Ausführungsform enthält die neue Beschreibung eine Bezugnahme auf die ausgewählten beschreibenden Daten anstatt auf die Daten selbst, wodurch die Erzeugung einer großen und komplexen Beschreibung vermieden ist. Da die beschreibenden Daten aus einer Vielzahl von Beschreibungen (oder deren Teilen) bestehen, kann die Beschreibung Bezugnahmen auf Mehrfachbeschreibungen enthalten. So kann beispielsweise eine neue DS Bezug nahmen auf solche DSen enthalten, wie beispielsweise Objekt-DSen, Ereignis-DSen, Zustands-DSen, Beziehungs-DSen, Episoden-DSen, Beschreibungsstruktur-DSen und DSen eines mentalen Raumes. In Abhängigkeit von der Form der Wiederverwendung wird eine Abbildung der jeweiligen existierenden Beschreibung in einer neuen Beschreibung benötigt. Bei einer Ausführungsform wird eine derartige Abbildung jedes Mal dann, wenn es erforderlich ist, eine neue Beschreibung zu erzeugen, definiert. Alternativ wird auf eine archivierte Version der Abbildung in einer neuen Beschreibung Bezug genommen.
Bei einer Ausführungsform wird die neue Beschreibung dadurch erzeugt, dass die existierenden beschreibenden Daten in einen Teil einer Beschreibung konvertiert werden und dass diese Teilbeschreibung in einer neuen Beschreibung abgebildet wird. So kann beispielsweise unter gegenwärtigen MPEG-7-Standards eine vollständige semantische Beschreibung Vielfachobjekte-DSen, Ereignis-DSen und Konzept-DSen enthalten. Eine Konzept-DS, deren Zweck darin liegt, einen Einschluss einer komplexen Abstraktion zu ermöglichen, kann wieder Objekt-DSen, Ereignis-DSen und Konzept-DSen enthalten. Da eine Konzept-DS in Beschreibungen von Objekten und Ereignissen eingeschlossen sein kann, erfordert die Erzeugung einer neuen Beschreibung eines Objekts oder eines Ereignisses die Umsetzung einer existierenden Konzept-DS in einen Teil der neuen Beschreibung und die Abbildung dieser Konzept-DS in der neuen Beschreibung.
Bei einer weiteren Ausführungsform wird eine neue Beschreibung dadurch erzeugt, dass auf einen Teil einer existierenden Beschreibung zugegriffen wird und dass diese Teilbeschreibung in der neuen Beschreibung abgebildet wird, wodurch die Wiederverwendung eines Teiles einer existierenden Beschreibung ermöglicht ist anstelle der gesamten existierenden Beschreibung. So kann beispielsweise auf ein Objekt DS, welches innerhalb einer existierenden Konzept-DS enthalten ist, zugegriffen werden, und die betreffende Objekt-DS kann in einer neuen Beschreibung eines audiovisuellen Materials abgebildet werden. Bei einer Ausführungsform wird eine Teilbeschreibung aus einer existierenden Beschreibung extrahiert, in eine eigenständige Beschreibung umgesetzt und dann in eine neue Beschreibung eingebettet.
Bei einer noch weiteren Ausführungsform wird eine neue Beschreibung dadurch erzeugt, dass verschiedene existierende Beschreibungen (oder deren Teile) ausgewählt und unter Anwendung von Kombinationsregeln aus einem Regel-Wörterbuch für die Kombination von Beschreibungen kombiniert werden. Die existierenden Beschreibungen werden in den Wörterbucheinträgen abgebildet, und die Regeln werden ausgeführt, um eine neue Beschreibung zu erzeugen. Sodann werden die entsprechenden Objekte mit Teilen der neuen Beschreibung identifiziert. Die Regeln und Beschreibungen können auf der lokalen Maschine, in einem einzigen Datenspeicher oder in mehreren Datenspeichern festgelegt sein, und sie können durch den Beschreibungsprozessor ausgeführt werden. Die Datenspeicher können Regeln zur Ausführung von Beschreibungen sowie zur Nutzung existierender Beschreibungen haben, und diese sind in Wörterbüchern organisiert.
Bei einer Ausführungsform werden bzw. sind existierende Beschreibungen oder Teile von existierenden Beschreibungen in neuen Beschreibungen unter Anwendung irgendwelcher bekannter Mechanismen abgebildet, die imstande sind, Graphenoperationen zwischen verschiedenen Beschreibungen von audiovisuellen Daten auszuführen. Alternativ können objektorientierte Erbschaftmechanismen für diesen Zweck genutzt werden. So ermöglicht beispielsweise eine private Erbschaft die Erbschaft von Attributen und Verfahren ohne den Erwerb einer Datentyp-Beziehung. Demgemäß kann eine private Erbschaft beispielsweise dazu herangezogen werden, einen Teil einer existierenden Beschreibung in einer neuen Beschreibung abzubilden. Eine öffentliche Erbschaft stellt einen Mechanismus zur Erzeugung einer kategorischen Struktur bereit. Damit kann die öffentli che Erbschaft beispielsweise zur Abbildung einer existierenden Beschreibung, die in einen Teil einer neuen Beschreibung umgesetzt ist, in die neue Beschreibung herangezogen werden. Darüber hinaus können die private Erbschaft und die öffentliche Erbschaft dazu herangezogen werden, existierende Beschreibungen auf bzw. bei neuen Beschreibungen abzubilden. So können beispielsweise beide Erbschaftstypen dazu benutzt werden, existierende Beschreibungen in Abstraktionen abzubilden und dann die Abstraktionen weiter in einer neuen Beschreibung abzubilden, die diese Abstraktionen kombiniert.
Bei einer Ausführungsform ermöglicht eine mehrfache Wiederverwendung von Beschreibungen eine De-fakto-Standardisierung (im Gegensatz zur reinen Standardisierung) von Beschreibungen durch die Kategorie. Dies heißt, dass im Gegensatz zur reinen Standardisierung, die als Anfang in MPEG-7 auferlegt ist, welche möglicherweise nicht die Kategorien kennen kann, die sich in bzw. aus der Anwendung ergeben, nachdem der Standard übernommen ist, der Standard natürlich durch Identifizieren mittels mehrfacher Wiederverwendung jener Beschreibungskategorien erzeugt werden kann, die die höchste Anwendung und Nutzung haben.
Gemäß einer Ausführungsform der vorliegenden Erfindung wird die Erzeugung von Beschreibungen eines audiovisuellen Inhalts zur selben Zeit durchgeführt wie die Erzeugung des audiovisuellen Inhalts durch dynamische Wiederverwendung von existierenden Beschreibungen. Wenn beispielsweise ein Nachrichtenprogramm, welches einer nationalen Katastrophe gewidmet ist, gleichzeitig mit der fortgesetzten Berichterstattung über die nationale Katastrophe beschrieben bzw. geschrieben wird, dann werden die Beschreibungen des Nachrichtenprogramms dynamisch aktualisiert, um neue Beschreibungen des sich entwickelnden Inhalts zu erzeugen.
7 ist ein Flussdiagramm von einer Ausführungsform zur dynamischen Wiederverwendung von Beschreibungen eines audio visuellen Inhalts. Beim Verarbeitungsblock 704 wird eine erste Beschreibung eines audiovisuellen Inhalts erzeugt. Beim Verarbeitungsblock 706 wird eine der ersten Beschreibung zugehörige bzw. zugeordnete Wiederverwendungsinformation definiert, wie dies oben in weiteren Einzelheiten beschrieben ist. Bei einer Ausführungsform werden die erste Beschreibung und die zugeordnete Wiederverwendungsinformation in einen lokalen Datenspeicher gespeichert.
Beim Verarbeitungsblock 708 wird die erste Beschreibung wiederverwendet, um eine zweite Beschreibung eines modifizierten audiovisuellen Inhalts auf der Grundlage der Wiederverwendungsinformation zu erzeugen. Die zweite Beschreibung wird gleichzeitig mit der Erzeugung des modifizierten audiovisuellen Inhalts erzeugt. Bei einer anderen Ausführungsform wird die zweite Beschreibung durch Aktualisieren von Parameterwerten der ersten Beschreibung erzeugt. Bei einer weiteren Ausführungsform wird die zweite Beschreibung durch Kombinieren der ersten Beschreibung mit anderen neuen oder existierenden beschreibenden Daten erzeugt. Bei einer noch weiteren Ausführungsform wird die zweite Beschreibung durch Wiederverwendung gewisser Teile der ersten Beschreibung und Verwurf der anderen Teile der ersten Beschreibung erzeugt, die nicht länger passend sind. Während der Beschreibung einer Online-Episode können sich beispielsweise die Beziehungen zwischen deren Objekten sowie die Strukturen ändern, die für deren Beschreibung benötigt werden. Sodann mag die gegenwärtige Beschreibung es erfordern, durch Aktualisierung ihrer Parameterwerte und durch Einbringen in neue Beschreibungen oder Teilbeschreibungen modifiziert zu werden, um ein junges Verhalten zu beschreiben, Teile der gegenwärtigen Beschreibung zu verwerfen, die nicht länger benötigt werden.
Bei einer Ausführungsform wird eine dynamische Wiederverwendung unter Heranziehung einer objektorientierten Modellierung, wie eines Systemmodells (SOM) von IBM^TM. SOM vorgenommen, was eine Architektur ist, die es ermöglicht, dass Binär- Objekte von unterschiedlichen Anwendungen gemeinsam genutzt werden, dass dynamische Änderungen von Beschreibungen, Beziehungen und Attributen einer Struktur ermöglicht sind, während sich diese entwickelt.
Eine Ausführungsform der vorliegenden Erfindung nutzt ein semantisches Mosaik zur Erzeugung neuer Beschreibungen audiovisuellen Inhalts. Ein semantisches Mosaik ist eine Sammlung von verschiedenen Beschreibungen, die unter Verwendung von Beziehungen zwischen benachbarten Beschreibungen gemischt sind. 8 veranschaulicht ein beispielhaftes semantisches Mosaik 800. Das Mosaik 800 besteht aus einer Vielzahl von semantischen Beschreibungen eines audiovisuellen Inhalts, einschließlich von Beschreibungen 1–18. Wenn das Mosaik 800 erzeugt wird, werden die Beschreibungen, die sich aufeinander beziehen, gemischt. So haben beispielsweise die Beschreibungen 1 und 2 einen Punkt, an dem sie dieselbe Information tragen. Dieser Punkt wird zum Zusammenmischen der Beschreibungen 1 und 2 genutzt. Die Beschreibung 2 kann außerdem einen weiteren gemeinsamen Punkt mit einer Beschreibung 3 haben. Dieser weitere Punkt kann zum Mischen der Beschreibung 3 mit der Beschreibung 2 genutzt werden. Ein dritter gemeinsamer Punkt kann dazu genutzt werden, die Beschreibungen 2 und 5 zusammenzumischen, etc. Als Ergebnis wird die Beschreibung 2 mit den Beschreibungen 1, 3, 4 und 5 gemischt, die sich alle auf die Beschreibung 2 beziehen, jedoch nicht irgendwelche Beziehungen zwischen einander haben. Somit repräsentiert das semantische Mosaik 800 eine Beschreibung, die nicht im Besonderen irgendwelches semantisches Material beschreibt, sondern die lokale Stücke enthält, welche Beschreibungen eines verschiedenen semantischen Inhalts repräsentieren. Jedes lokale Stück kann mehrere Beschreibungen kombinieren, um eine gewisse semantische Entität zu beschreiben. In Abhängigkeit vom Kontext kann die Anzahl der in einem bestimmten lokalen Stück enthaltenen Beschreibungen variieren. So kann beispielsweise in einem Kontext die Kombination von Beschreibungen 5, 10 und 11 eine vollständige Beschreibung eines audiovisuellen In halts bereitstellen. In einem anderen Kontext kann die Kombination von Beschreibungen 5, 9, 10, 12 und 13 erforderlich sein, um eine vollständige Beschreibung eines audiovisuellen Inhalts bereitzustellen. Wenn eine neue Beschreibung erzeugt wird, kann ein in Frage kommendes lokales Stück wieder verwendet werden, um die neue Beschreibung zu erzeugen. Die in jedem lokalen Stück enthaltenen Beschreibungen haben zuvor definierte Beziehungen. Somit können neue Beschreibungen einfach dadurch erzeugt werden, dass in Frage kommende bzw. geeignete lokale Stücke aus dem semantischen Mosaik extrahiert werden. Alternativ können die lokalen Stücke mit anderen beschreibenden Daten zur Bildung von neuen Beschreibungen kombiniert werden.
9 ist ein Blockdiagramm einer Ausführungsform eines Computersystems 900, innerhalb dessen ein Satz von Befehlen ausgeführt werden kann, um die Maschine zu veranlassen, irgendeine der oben erörterten Methodiken auszuführen. Bei alternativen Ausführungsformen kann die Maschine einen Netzwerk-Router, einen Netzwerkschalter bzw. eine Netzwerkvermittlung, eine Netzwerkbrücke, einen persönlichen digitalen Assistenten (PDA), ein Handy (Mobilfunktelefon), eine Web-Anwendung oder eine Maschine umfassen, die imstande ist, eine Folge von Befehlen auszuführen, die Aktionen spezifizieren, welche durch die betreffende Maschine auszuführen sind.
Das Computersystem 900 enthält einen Prozessor 902, einen Hauptspeicher 904 und einen statischen Speicher 906, die über einen Bus 908 miteinander kommunizieren. Das Computersystem 900 kann ferner eine Videoanzeigeeinheit 910 (beispielsweise eine Flüssigkristallanzeige-(LCD)-Einrichtung oder eine Kathodenstrahlröhre (CRT)) enthalten. Das Computersystem 900 kann außerdem eine alphanumerische Eingabevorrichtung 912 (beispielsweise eine Tastatur), eine Zeiger- bzw. Cursor-Steuervorrichtung 914 (beispielsweise eine Maus), eine Plattenlaufwerkseinheit 916, eine Signalerzeugungsvorrichtung 920 (z.B. einen Lautsprecher) und eine Netzwerk-Schnittstellenvorrichtung 922 enthalten.
Die Plattenlaufwerkseinheit 916 enthält ein computer-lesbares Medium 924, auf dem ein Satz von Befehlen 926 (das ist Software) gespeichert ist, welche irgendeine oder sämtliche der oben beschriebenen Methodiken verkörpern. Die Software 916 ist außerdem dargestellt, um vollständig oder zumindest teilweise im Hauptspeicher 904 und/oder innerhalb des Prozessors 902 zu liegen. Die Software 926 kann ferner über die Netzwerks-Schnittstellenvorrichtung 922 übertragen oder über diese empfangen werden. Für Zwecke dieser Anmeldung soll der Begriff "computer-lesbares Medium" jegliches Medium einschließen, welches imstande ist, eine Folge von Befehlen zur Ausführung durch den Computer zu speichern und zu codieren, und welches den Computer veranlasst, irgendeine der Methodiken der vorliegenden Erfindung auszuführen. Der Begriff "computerlesbares Medium" soll demgemäß herangezogen werden, um einzuschließen, jedoch nicht zu beschränken, Halbleiterspeicher, optische und magnetische Platten bzw. Discs und Trägerwellensignale.
Somit sind ein Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts beschrieben worden. Obwohl die vorliegende Erfindung unter Bezugnahme auf spezifische beispielhafte Ausführungsformen beschrieben worden ist, wird offensichtlich sein, dass verschiedene Modifikationen und Änderungen an diesen Ausführungsformen ohne Abweichung vom breiteren Schutzumfang der Erfindung vorgenommen werden können. Demgemäß sind die Beschreibung und die Zeichnungen in einem veranschaulichenden anstatt in einem beschränkenden Sinne zu betrachten.
Zusammenfassung
Beschränkte Autorisierung
Ein Verfahren und eine Vorrichtung zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts (4) werden beschrieben. Gemäß einer Ausführungsform wird eine Beschreibung (104) eines audiovisuellen Inhalts erzeugt, und eine eine Wiederverwendung der Beschreibung eines audiovisuellen Inhalts betreffende Information wird festgelegt bzw. definiert. Ferner werden die Beschreibung des audiovisuellen Inhalts und die Wiederverwendungsinformation in einem Speicher (104) von beschreibenden Daten gespeichert, um eine anschließende Wiederverwendung dieser Beschreibung zu ermöglichen.
(5)

Claims

Verfahren zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts, umfassend: Erzeugen einer ersten Beschreibung eines audiovisuellen Inhalts (504); Definieren einer Information betreffend die Wiederverwendung der ersten Beschreibung (506); und Speichern der ersten Beschreibung und der Information betreffend die Wiederverwendung der ersten Beschreibung (508) in einem Speicher (104) von beschreibenden Daten, um eine anschließende Wiederverwendung der ersten Beschreibung zu ermöglichen.
Verfahren nach Anspruch 1, wobei die erste Beschreibung eine semantische Beschreibung ist.
Verfahren nach Anspruch 1, wobei die erste Beschreibung ein Beschreibungsschema bzw. -system ist.
Verfahren nach Anspruch 1, wobei die Information, welche die Wiederverwendung der ersten Beschreibung betrifft, angibt, ob die erste Beschreibung in einer zweiten Beschreibung eines audiovisuellen Inhalts ohne Änderung einer beabsichtigten Bedeutung der ersten Beschreibung eingebettet werden kann.
Verfahren nach Anspruch 1, wobei die Information, welche die Wiederverwendung der ersten Beschreibung betrifft, angibt, ob die erste Beschreibung in eine Vielzahl von Teilbeschreibungen unterteilt werden kann, wobei jede der Vielzahl von Teilbeschreibungen für eine anschließende Wiederverwendung geeignet ist.
Verfahren nach Anspruch 1, wobei die Information, die die Wiederverwendung der ersten Beschreibung betrifft, angibt, ob die erste Beschreibung transformiert werden kann, wenn sie wieder verwendet wird, um eine zweite Beschreibung eines audiovisuellen Inhalts zu erzeugen.
Verfahren nach Anspruch 1, wobei die Information, die die Wiederverwendung der ersten Beschreibung betrifft, angibt, ob die erste Beschreibung eine transitive Eigenschaft beibehalten kann, falls die erste Beschreibung wiederverwendet wird, um eine zweite Beschreibung eines audiovisuellen Inhalts zu erzeugen.
Verfahren nach Anspruch 1, ferner umfassend: eine Wiederverwendung einer Vielzahl von Beschreibungen (708) die in einer oder mehreren Speichern (104) von beschreibenden Daten in einer Mehrzahl gespeichert sind, um eine De-fakto-Standardisierung der Vielzahl von Beschreibungen durch eine Kategorie bereitzustellen.
Verfahren zur Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts, umfassend: Herausfinden bzw. Ermitteln von existierenden beschreibenden Daten (604), die in einer neuen Beschreibung audiovisuellen Inhalts enthalten sein sollten; Analysieren einer Wiederverwendungsinformation, die den beschreibenden Daten (606} zugeordnet ist; und Erzeugen einer neuen Beschreibung (608) unter Heranziehung der existierenden beschreibenden Daten und der zugeordneten Wiederverwendungsinformation.
Verfahren nach Anspruch 9, wobei die neue Beschreibung eine semantische Beschreibung ist.
Verfahren nach Anspruch 9, wobei die neue Beschreibung ein Beschreibungsschema bzw. -system ist.
Verfahren nach Anspruch 9, wobei die beschreibenden Daten zumindest ein Teil einer oder mehrerer existierender Beschreibungen eines audiovisuellen Inhalts sind.
Verfahren nach Anspruch 9, ferner umfassend: Wiederauffinden der beschreibenden Daten aus einer oder mehreren Speichern (104) von beschreibenden Daten.
Verfahren nach Anspruch 9, wobei die Erzeugung der neuen Beschreibung ferner umfasst: Umsetzung der existierenden beschreibenden Daten in eine Teilbeschreibung; und Abbildung der Teilbeschreibung auf die neue Beschreibung.
Verfahren nach Anspruch 9, wobei die Erzeugung der neuen Beschreibung ferner umfasst: Zugreifen auf einen Teil der existierenden beschreibenden Daten in einem Speicher (104) von beschreibenden Daten; und Abbildung des Teiles der existierenden beschreibenden Daten auf die neue Beschreibung.
Verfahren nach Anspruch 9, wobei die Erzeugung der neuen Beschreibung ferner umfasst: Ausführen einer Wörterbuch-Abbildung von Objekten in den existierenden beschreibenden Daten bezüglich korrespondierender Objekte in der neuen Beschreibung.
Verfahren nach Anspruch 9, wobei die Erzeugung der neuen Beschreibung ferner umfasst: Einschließen einer Bezugnahme auf die existierenden beschreibenden Daten in die neue Beschreibung.
Verfahren nach Anspruch 9, wobei die neue Beschreibung unter Heranziehung eines Mechanismus zur Ausführung von Graphenoperationen erzeugt wird.
Verfahren nach Anspruch 9, wobei die neue Beschreibung unter Heranziehung eines objektorientierten Erbschaftsmechanismus erzeugt wird.
Verfahren nach Anspruch 9, wobei die Erzeugung der neuen Beschreibung ferner umfasst: Extrahieren der existierenden beschreibenden Daten aus einem semantischen Mosaik, welches eine Vielzahl von verwandten Beschreibungen integriert.
Verfahren zur dynamischen Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts, umfassend: Erzeugen einer ersten Beschreibung eines audiovisuellen Inhalts (704); Definieren einer Wiederverwendungsinformation, die der ersten Beschreibung (706) zugeordnet ist; Wiederverwendung der ersten Beschreibung (708) zur Erzeugung einer zweiten Beschreibung eines modifizierten audiovisuellen Inhalts auf der Grundlage der Wiederverwendungsinformation, wobei die Wiederverwendung gleichzeitig mit der Erzeugung des modifizierten audiovisuellen Inhalts ausgeführt wird.
System zur Verarbeitung von Beschreibungen eines audiovisuellen Inhalts, umfassend: Mittel (108) zur Erzeugung einer ersten Beschreibung eines audiovisuellen Inhalts; Mittel (110) zum Definieren einer Information betreffend die Wiederverwendung einer ersten Beschreibung; und Mittel zur Speicherung der ersten Beschreibung und der Information betreffend die Wiederverwendung der ersten Beschreibung in einem Speicher (104) von beschreibenden Daten, um eine anschließende Wiederverwendung der ersten Beschreibung zu ermöglichen.
Vorrichtung, umfassend: einen Beschreibungsprozessor (108) zur Erzeugung einer ersten Beschreibung eines audiovisuellen Inhalts; einen Wiederverwendungsinformations-Erzeuger (110) zum Definieren einer Information betreffend eine Wiederverwendung der ersten Beschreibung; und einen Speicher (104) von beschreibenden Daten zur Speicherung der ersten Beschreibung und der Information betreffend die Wiederverwendung der ersten Beschreibung, um eine anschließende Wiederverwendung der ersten Beschreibung zu ermöglichen.
Vorrichtung nach Anspruch 23, wobei die erste Beschreibung eine semantische Beschreibung ist.
Vorrichtung nach Anspruch 23, wobei die erste Beschreibung ein Beschreibungsschema bzw. -system ist.
Vorrichtung nach Anspruch 23, wobei die die Wiederverwendung der ersten Beschreibung betreffende Information angibt, ob die erste Beschreibung in eine zweite Beschreibung eines audiovisuellen Inhalts ohne Änderung einer beabsichtigten Bedeutung der ersten Beschreibung eingebettet werden kann.
Vorrichtung nach Anspruch 23, wobei die die Wiederverwendung der ersten Beschreibung betreffende Information angibt, ob die erste Beschreibung in eine Vielzahl von Teilbeschreibungen unterteilt werden kann, wobei jede der Vielzahl von Teilbeschreibungen für eine anschließende Wiederverwendung geeignet ist.
Vorrichtung nach Anspruch 23, wobei die die Wiederverwendung der ersten Beschreibung betreffende Information angibt, ob die erste Beschreibung, wenn wiederverwendet, transformiert werden kann, um eine zweite Beschreibung eines audiovisuellen Inhalts zu erzeugen.
Vorrichtung nach Anspruch 23, wobei die eine Wiederverwendung der ersten Beschreibung betreffende Information angibt, ob die erste Beschreibung eine transitive Eigenschaft beibehalten kann, wenn die erste Beschreibung wiederverwendet wird, um eine zweite Beschreibung eines audiovisuellen Inhalts zu erzeugen.
System zur Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts, umfassend: Mittel (106) zum Auffinden existierender beschreibender Daten, die in einer neuen Beschreibung eines audiovisuellen Inhalts enthalten sein sollten; Mittel (106) zum Analysieren einer Wiederverwendungsinformation, die den beschreibenden Daten zugeordnet ist; und Mittel (108) zur Erzeugung der neuen Beschreibung unter Heranziehung der existierenden beschreibenden Daten und der zugeordneten Wiederverwendungsinformation.
Vorrichtung, umfassend: ein Wiederverwendungsmodul (106) zum Herausfinden von existierenden beschreibenden Daten, die in einer neuen Beschreibung eines audiovisuellen Inhalts enthalten sein sollten, und zum Analysieren einer Wiederverwendungsinformation, die den beschreibenden Daten zugeordnet ist; und einen Beschreibungsprozessor (108) zur Erzeugung der neuen Beschreibung unter Heranziehung der existierenden beschreibenden Daten und der zugeordneten Wiederverwendungsinformation.
Vorrichtung nach Anspruch 31, wobei die neue Beschreibung eine semantische Beschreibung ist.
Vorrichtung nach Anspruch 31, wobei die neue Beschreibung ein Beschreibungsschema bzw. -system ist.
Vorrichtung nach Anspruch 31, wobei die beschreibenden Daten zumindest ein Teil eines oder mehrerer existierender Beschreibungen eines audiovisuellen Inhalts sind.
Vorrichtung nach Anspruch 31, wobei die neue Beschreibung unter Heranziehung eines Mechanismus zur Ausführung von Graphenoperationen erzeugt ist.
Vorrichtung nach Anspruch 31, wobei die neue Beschreibung unter Heranziehung eines objektorientierten Erbschaftsmechanismus erzeugt ist.
System zur dynamischen Wiederverwendung von Beschreibungen eines audiovisuellen Inhalts, wobei das Verfahren umfasst: Mittel (108) zum Erzeugen einer ersten Beschreibung eines audiovisuellen Inhalts; Mittel (110) zum Festlegen bzw. Definieren einer Wiederverwendungsinformation, die der ersten Beschreibung zugeordnet ist, und Mittel (108) zur Wiederverwendung der ersten Beschreibung für die Erzeugung einer zweiten Beschreibung eines modifizierten audiovisuellen Inhalts auf der Grundlage der Wiederverwendungsinformation, wobei die Wiederverwendung gleichzeitig mit der Erzeugung des modifizierten audiovisuellen Inhalts ausgeführt wird.
Vorrichtung, umfassend: einen Beschreibungs-Prozessor (108) zur Erzeugung einer ersten Beschreibung eines audiovisuellen Inhalts; und einen Wiederverwendungsinformations-Erzeuger (110) zum Festlegen bzw. Definieren einer Wiederverwendungsinformation, die der ersten Beschreibung zugeordnet ist, wobei der Beschreibungs-Prozessor (108) die erste Beschreibung für die Erzeugung einer zweiten Beschreibung eines modifizierten audiovisuellen Inhalts auf der Grundlage der Wiederverwendungsinformation wieder verwendet, wobei die Wiederverwendung gleichzeitig mit der Erzeugung des modifizierten audiovisuellen Inhalts vorgenommen wird.
Computer-lesbares Medium, welches Befehle bereitstellt, die dann, wenn sie auf einem Prozessor ausgeführt werden, den betreffenden Prozessor veranlassen, Operationen auszuführen, umfassend: Erzeugen einer ersten Beschreibung eines audiovisuellen Inhalts (504); Festlegen bzw. Definieren einer Information betreffend die Wiederverwendung der ersten Beschreibung (506); und Speichern der ersten Beschreibung und der die Wiederverwendung der ersten Beschreibung (508) betreffenden Information in einem Speicher (104) von beschreibenden Daten, um eine anschließende Wiederverwendung der ersten Beschreibung zu ermöglichen.
Computer-lesbares Medium, welches Befehle bereitstellt, die dann, wenn sie auf einem Prozessor ausgeführt werden, den betreffenden Prozessor veranlassen, Operationen auszuführen, umfassend: Herausfinden von existierenden beschreibenden Daten (604), die in einer neuen Beschreibung eines audiovisuellen Inhalts enthalten sein sollten; Analysieren einer Wiederverwendungsinformation, die den beschreibenden Daten (606) zugeordnet ist; und Erzeugen der neuen Beschreibung (608) unter Heranziehung der existierenden beschreibenden Daten und der zugeordneten Wiederverwendungsinformation.
Computer-lesbares Medium, welches Befehle bereitstellt, die dann, wenn sie auf einem Prozessor ausgeführt werden, den betreffenden Prozessor veranlassen, Operationen auszuführen, umfassend: Erzeugen einer ersten Beschreibung eines audiovisuellen Inhalts (704); Festlegen bzw. Definieren einer Wiederverwendungsinformation, die der ersten Beschreibung (706) zugeordnet ist; und Wiederverwenden der ersten Beschreibung (708) zur Erzeugung einer zweiten Beschreibung eines modifizierten audiovi suellen Inhalts auf der Grundlage der Wiederverwendungsinformation, wobei die Wiederverwendung gleichzeitig mit der Erzeugung des modifizierten audiovisuellen Inhalts vorgenommen wird.