-
Technisches
Gebiet
-
Die vorliegende Erfindung betrifft
die Nachrichtenübermittlung
von Sprachpost.
-
Allgemeiner
Stand der Technik
-
Nachrichtenübermittlungssysteme gestatten
es, dass ein Nachrichtenempfänger über sein
Telefon oder ein anderes Audioendgerät eine Audionachricht anhört. Wenn
in so genannten Sprachpostsystemen auf die Nachricht in dem Sprachpostsystem
zugegriffen wird, präsentiert
das Sprachpostsystem typischerweise Anfangsinformationen, wie beispielsweise
den Zeitpunkt des Empfangs der Nachricht und die Identität des Absenders,
falls bekannt, und spielt für
den Empfänger
eine aufgezeichnete Nachricht ab, die aus einem Segment aus akustischem
Material besteht. Der Empfänger
kann unter Verwendung seiner Telefontastatur oder von Spracheingabe,
die ein Überspringen,
einen Rücklauf,
eine Pause oder ähnliche
Vorgänge
bewirken, durch die aufgezeichnete Nachricht navigieren. Vor kurzem
wurden integrierte Nachrichtenübermittlungssysteme
eingeführt,
die Sprachschnittstellen aufweisen, die herkömmliche Sprachpostnachrichten
sowie Nachrichten anderer Medienarten, wie zum Beispiel eine Email,
handhaben können.
Im letzteren Fall wird eine Email-Textnachricht an die Mailbox des
Empfängers
geliefert. Wenn sie von dem Empfänger
durch sein Audioendgerät
abgerufen wird, wird die Email-Anfangsinformation in akustische
Form ungewandelt und dem Empfänger
zusammen mit dem Nachrichtenkörper
präsentiert,
der dem Empfänger
unter Verwendung von Text-zu-Sprache-Verarbeitung vorgespielt wird.
Sowohl bei herkömmlichen
Sprachpostsystemen als auch bei den integrierten Nachrichtenübermittlungssystemen
wird somit der Körper
der Nachricht als monolithischer Block aufgezeichneten akustischen
Materials oder Text interpretiert, wobei der letztere in akustisches
Material umgewandelt wird, das in beiden Fällen dem Empfänger linear
vorgespielt wird, wenn er auf sein Nachrichtenübermittlungssystem von seinem
Telefon oder einem anderen Audioendgerät zugreift.
-
Kurze Darstellung
der Erfindung
-
Sprachpost und andere Nachrichtenübermittlungssysteme
haben die Art und Weise revolutioniert, in der Menschen im heutigen
elektronischen Zeitalter miteinander kommunizieren. Obwohl heutzutage
verfügbare
Nachrichtenübermittlungssysteme
im allgemeinen nützlich
sind und verbreitete Popularität
gefunden haben, stellte es sich heraus, dass gemäß der vorliegenden Erfindung
zusätzliche
und überaus
vorteilhafte Funktionalität
erzielt werden kann.
-
Die vorliegende Erfindung betrifft
das Zusammensetzen einer strukturierten Nachricht, die eine Vielzahl
von Nachrichtenelementen enthält,
durch ein Nachrichtenübermittlungssystem
eines Empfängers.
-
Die von einem Absender gesendete
strukturierte Nachricht beinhaltet eine Vielzahl von Nachrichtenelementen.
Diese Nachrichtenelemente können
beispielsweise Textfragmente, Sprachfragmente in angehängten Audiodateien,
Verweise auf unter speziellen Adressen gespeicherte Audio- oder
Textfragmente und explizite oder implizite Anweisungen beinhalten,
die die Struktur der Nachricht definieren. Die Nachricht einschließlich einer
Vielzahl derartiger Nachrichtenelemente wird an eine Adresse übersendet,
die in der Nachricht der Mailbox des Empfängers auf einem Nachrichtenübermittlungssystem
angegeben ist, das die Fähigkeit
besitzt, die in der strukturierten Nachricht enthaltenen Anweisungen
zu interpretieren. Dieses Nachrichtenübermittlungssystem stellt nach
dem Abrufen durch den Empfänger
gemäß den Anweisungen,
die die Nachrichtenstruktur definieren, unter Verwendung der mit
dem Nachrichteninhalt verbundenen Nachrichtenelemente eine Audionachricht
zusammen und präsentiert
dem Empfänger
die zusammengestellte Nachricht in ihrem beabsichtigten Format.
-
Die Übersendung der strukturierten
Nachricht kann vorteilhafterweise Interaktionen zwischen dem Empfänger und
dem Nachrichteninhalt und zwischen dem Empfänger und der Außenwelt
ermöglichen.
Die in der Nachricht eingebetteten Anweisungen können insbesondere derart sein,
dass sie einen Dialog zwischen dem Empfänger und dem Nachrichtenübermittlungssystem
erlauben. Dieser Dialog kann es entsprechend den eingebetteten Anweisungen
dem Empfänger
in der Tat erlauben, durch Sprach- und/oder Tastatureingaben zwischen
Nachrichtenelementen zu navigieren, als wäre der Empfänger mit einem aktiven interaktiven Sprachantwortsystem
(IVR) verbunden. Der Empfänger
wird daher jene inhaltsbezogenen Nachrichtenelemente aus der strukturierten
Nachricht hören,
die mit seinen Kommandoeingaben verknüpft sind und eine Reaktion
hierauf sind.
-
Die strukturierte Nachricht kann
auch eingebettete Adressen oder "Links" enthalten, wie sie
derzeit in der Internettechnik bekannt sind, die eine Telefonadresse
wie beispielsweise eine Telefonnummer oder eine IP-Telefonadresse angeben.
Falls der Empfänger
während
seiner Interaktion mit einer strukturierten Nachricht eine Handlung
vornimmt, wie beispielsweise eine Tastatureingabe oder eine Spracheingabe,
die von dem Nachrichtenübermittlungssystem
so interpretiert wird, dass sie eine Auswahl eines spezifischen
Links durch den Empfänger
darstellt, wird von dem Nachrichtenübermittlungssystem ein Anruf
an jene Telefonnummer oder -adresse, die mit dem Link verknüpft ist,
getätigt.
Alternativ kann die strukturierte Nachricht eingebettete Links enthalten,
die einen Bestimmungsort für
eine Nachrichtenübermittlung
anstatt Telefonverbindungen angeben. Beispiele für die letzteren umfassen Emailadressen
und Webdienste für
das Hinaufladen unter HTTP.
-
Das Nachrichtenübermittlungssystem kann von
dem Empfänger
während
seiner Interaktion mit der strukturierten Nachricht Informationen
einholen, die zu einem beispielsweise von dem Absender angegebenen Bestimmungsort
gesendet werden, wie beispielsweise einer Server- oder Emailadresse.
Der Empfang der eingeholten Informationen kann zu einer Antwort
vom angegebenen Bestimmungsort führen,
die durch das Nachrichtenübermittlungssystem
verarbeitet und an den Empfänger
weitergeleitet wird. Tatsächlich
initiiert dies eine interaktive Sitzung zwischen dem Empfänger und
einem Dienst, der an dem in der ursprünglichen strukturierten Nachricht
angegebenen Bestimmungsort aktiv ist.
-
Die verschiedenen Fähigkeiten
der strukturierten Nachricht können
auch auf verschiedene Weisen kombiniert werden. Beispielsweise kann
eine strukturierte Nachricht koordinierte Daten- und Telefonaktionen bewirken.
Das Nachrichtenübermittlungssystem
kann daher Eingabedaten von dem Empfänger sammeln, diese Daten zu
einem angegebenen Zielsystem übertragen,
wie beispielsweise einem Server, und einen Telefonanruf bei einer
Telefonnummer tätigen,
die mit diesem Zielsystem verknüpft
ist. Dieses Zielsystem kann dann über den Telefonanruf mit Information
beliefert werden, die es ihm ermöglicht,
auf die separat gesendeten Daten zuzugreifen. Das Zielsystem kann
dann diese Daten dazu verwenden, die Handhabung des Telefonanrufs auf
verschiedene Weisen zu verbessern.
-
Bei einer speziellen veranschaulichenden
Ausführungsform
wird die strukturierte Nachricht von einem Absender unter Verwendung
beispielsweise einer Telefon-Markup-Sprache
(PML) formuliert, um die Struktur und die inhärent eingebetteten Anweisungen,
die mit der Struktur der Nachricht verknüpft sind, zu definieren. Die
Nachricht besteht dann aus PML-Markup's verwoben mit anderen Nachrichtenelementen
wie beispielsweise Textfragmenten, die durch das Nachrichtenübermittlungssystem
in Sprache umgewandelt werden, und/oder Audio- und Textfragmenten,
die als angehängte
Dateien Teile der Nachricht sind oder die von einer bestimmten Adresse
abrufbar sind. Nach dem Formulieren der Nachricht wird die zusammengesetzte
Nachricht über
ein Datennetz, zum Beispiel ein IP-Netz wie beispielsweise das Internet,
an das Nachrichtenübermittlungssystem versendet,
das die zusammengesetzte Nachricht für den späteren Abruf durch den beabsichtigten
Empfänger speichert.
-
Das Nachrichtenübermittlungssysteme beinhaltet
jene Funktionalitäten,
die notwendig sind, um die eingebetteten Anweisungen in der gespeicherten
strukturierten Nachricht zu interpretieren und sie dem Empfänger hörbar zu
präsentieren,
während
es gleichzeitig auch in der Lage ist, eine Audio- oder Tasteneingabe des
Empfängers
zur Interaktion mit der Nachricht gemäß den Anweisungen zu empfangen
und zu interpretieren. Bei der speziellen veranschaulichenden Ausführungsform
empfängt
und speichert das Nachrichtenübermittlungssystem
PML-formatierte Nachrichten, die von dem Absender über das
Datennetz gesendet werden. Nachdem der Empfänger zum Abruf der Nachricht
auf das System zugegriffen hat, greift das System auf die Nachricht
zu und ein Prozessor interpretiert die PML-Markup's in der Nachricht,
um ein Abspielen der Text- und/oder Audiofragmente der Nachricht
für den
Empfänger
gemäß den eingebetteten
Anweisungen zu bewirken, die mit diesen Markup's verbunden sind. So wird zum Beispiel
für eine
strukturierte, PML-formatierte Nachricht mit Textfragmenten und
angehängten
Audiodateien die Nachricht formuliert, indem der Text unter Verwendung
eines Text-zu-Sprache-Prozessors in Sprache umgewandelt wird und
die geeignete(n) Audiodatei(en) während der Wiedergabe für den Empfänger in
der richtigen Reihenfolge eingesetzt wird bzw. werden, wie es durch
die eingebetteten Anweisungen in der PML-formatierten Nachricht
festgelegt ist. Das veranschaulichende Nachrichtenübermittlungssystem
beinhaltet außerdem
einen Detektor zum Erfassen der Tastentelefon-Tastatureingaben des Empfängers und
einen automatischen Spracherkennungs(ASR)-Prozessor zum Erkennen
und Interpretieren der Sprach- und Telefontastatureingaben des Empfängers, um
eine Interaktion und Navigation innerhalb der strukturierten Nachricht
zu bewirken, wie sie durch die Markup's in der Nachricht zulässig sind,
sowie der Transfer zu anderen Bestimmungsorten und die Interaktion
mit ihnen, wie es durch die Markup's angegeben ist.
-
Die strukturierte Nachricht kann
vorteilhafterweise durch den Absender über einen Editor mit einer
graphischen Nutzerschnittstelle formuliert werden, die auf einem
Computer läuft.
Durch die Eingabe von Textdateien, zuvor aufgenommenen Audiofragmenten
sowie gleichzeitig aufgenommenen Fragmenten ist der Absender in
der Lage, die strukturierte Nachricht zu formulieren. Alternativ
könnte
die strukturierte Nachricht "von Hand" mit einem Texteditor
und einer Audiodateiaufnahmeeinrichtung erzeugt werden.
-
Falls die strukturierte Nachricht
zu mehreren von Empfängern
gesendet wird, kann die Erfindung es vorteilhafterweise gestatten,
dass von jedem Information eingeholt werden kann, ohne eine Echtzeit-Telefonverbindung
mit jedem einzelnen Empfänger
zu erfordern, um diese Informationen zu sammeln.
-
Auch wenn oben festgestellt wurde,
dass die vorliegende Erfindung mit der Audionachrichtenübermittlung
verknüpft
ist, versteht es sich, dass sie ebenso bei Nachrichtenübermittlung
in Multimedia-Art Anwendung finden kann, bei der Nachrichtenelemente
der strukturierten Nachricht Videofragmente enthalten können, die von
dem Nachrichtenübermittlungssystem
gemäß den in
der strukturierten Nachricht eingebetteten Anweisungen zusammengestellt
werden.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist
ein Blockdiagramm eines Systems, das ein Nachrichtenübermittlungssystem
beinhaltet, das in der Lage ist, eine strukturierte Nachricht zu
empfangen, zu speichern und einem Empfänger zu präsentieren;
-
2 ist
ein Flussdiagramm, das die Schritte zeigt, die mit dem Senden und
Zustellen einer strukturierten Nachricht für einen Empfänger verbunden
sind;
-
3 ist
ein Flussdiagramm, das die Schritte zeigt, die mit dem Senden einer
kundenspezifisch strukturierten Nachricht an mehrere Empfänger verbunden
sind;
-
4 ist
ein Flussdiagramm, das mit den Schritten des Sendens einer strukturierten
Nachricht an einen Empfänger
verbunden ist, die eine Interaktion zwischen dem Empfänger und
der Nachricht gestattet;
-
5 ist
ein Flussdiagramm, das mit den Schritten des Sendens einer strukturierten
Nachricht, die eingebettete Links aufweist, an einen Empfänger verbunden
ist;
-
6 ist
ein Flussdiagramm, das mit den Schritten des Sendens einer strukturierten
Nachricht an einen Empfänger
verbunden ist, wobei während
einer Interaktion des Empfängers
Information gesammelt und an einen speziellen Bestimmungsort gesendet
wird;
-
7 ist
ein Flussdiagramm, das mit den Schritten des Sendens einer strukturierten
Nachricht an einen Empfänger
verbunden ist, wobei während
einer Interaktion des Empfängers
Information von einem speziellen von einem speziellen Bestimmungsort
abgerufen wird, um eine weitere Interaktion zwischen dem Empfänger und
dieser Information zu ermöglichen;
-
8 ist
ein Flussdiagramm, das mit den Schritten des Sendens einer strukturierten
Nachricht an einen Empfänger
verbunden ist, wobei während
einer Interaktion des Empfängers
Information von dem Empfänger
gesammelt und an einen speziellen Bestimmungsort gesendet wird und
ein separater Anruf zwischen dem Empfänger und diesem speziellen
Bestimmungsort getätigt
wird;
-
9 ist
ein Blockdiagramm eines integrierten Nachrichtenübermittlungssystems, das eine
strukturierte Nachricht empfängt,
interpretiert und präsentiert;
und
-
10 ist
ein Blockdiagramm einer graphischen Benutzerschnittstelle (GUI)
zur Erzeugung einer strukturierten Nachricht.
-
Ausführliche
Beschreibung
-
Mit Bezug auf 1 ist ein System gezeigt, das eine strukturierte
Nachricht beinhaltet und verwendet. Ein Absender an einem Client-Endgerät 101,
auf dem ein Editor 102 mit einer graphischen Benutzerschnittstelle
(GUI) 103 läuft,
bereitet die strukturierte Sprachpostnachricht vor, die zu einem
integrierten Nachrichtenübermittlungssystem 104 über ein
Ferndatennetz oder ein lokales Datennetz, wie beispielsweise ein
IP-Netz 105 wie das Internet oder ein Intranet, übertragen
wird. Das integrierte Nachrichtenübermittlungssystem 104 ist
ein Nachrichtenübermittlungssystem,
das in der Lage ist, herkömmliche
Sprachpostnachrichten, Emailnachrichten und strukturierte Nachrichten
des hier beschriebenen Typs zu empfangen. Hinsichtlich der strukturierten
Nachrichten ist das Nachrichtenübermittlungssystem 104 in
der Lage, eine derartige strukturierte Nachricht zu empfangen, zu
speichern, zu interpretieren und dem beabsichtigten Empfänger zuzustellen, wenn
er über
ein Audioendgerät,
wie beispielsweise einen mit dem PSTN 107 verbundenen Telefonapparat 106,
auf seine Mailbox zugreift. Das Nachrichtenübermittlungssystem 104 wie
es beschrieben werden wird ist auch in der Lage, Tastatur- oder
Spracheingaben von dem Empfänger
entgegenzunehmen und zu verarbeiten, die während der Interaktion des Empfängers mit
der strukturierten Nachricht empfangen werden. Obwohl der in 1 gezeigte Empfänger durch
sein Telefon 106 über
das PSTN 107 mit dem Nachrichtenübermittlungssystem 104 verbunden
ist, versteht es sich, dass der Empfänger auch mittels seines Telefonapparats über eine IP-Telefonverbindung oder über eine
beliebige andere Art eines Analog- oder Datennetzes mit dem Nachrichtenübermittlungssystem
verbunden sein könnte.
-
Die strukturierte Nachricht beinhaltet
eine Vielzahl von Nachrichtenelementen. Diese Nachrichtenelemente
umfassen beispielsweise große
oder kleine Textfragmente, die, wenn sie für die Präsentation für den Empfänger formuliert werden, durch
das Nachrichtenübermittlungssystem
in Sprache konvertiert werden; große oder kleine Audio- oder
Textfragmente, die in Dateien enthalten sind, die als separate Dateien
an die strukturierte Nachricht angehängt werden; große oder
kleine Audio- oder Textfragmente, die an einer speziellen Adresse
auf dem Netz, auf dem des Nachrichtenübermittlungssystem 104 lokalisiert
ist, lokalisiert und von dort abrufbar sind; und implizit oder explizit
eingebettete Anweisungen, die die Struktur der Nachricht definieren. Die
letzteren beinhalten nicht nur die Reihenfolge, in der die Fragmente
hörbar
dem Empfänger
zu präsentieren
sind, wenn die Nachricht von dem Empfänger über das Telefon 106 von
dem Nachrichtenübermittlungssystem 104 abgerufen
wird, sondern definieren beispielsweise auch die Eingaben, die von
dem Empfänger durch
seine Tastatur oder durch Spracheingabe über das Telefon 106 während des
Dialogs der Nachricht zu sammeln sind. Die Anweisungen definieren
außerdem
die Nachrichtenelemente, die dem Empfänger als Reaktion auf derartige
Empfängereingaben
hörbar
zu präsentieren
sind. Diese eingebetteten Anweisungen definieren außerdem auch
die Aktionen, die das Nachrichtenübermittlungssystem 104 als
Reaktion auf Eingaben eines Empfängers
ergreifen soll und die sich von einem Navigieren in der Nachricht
unterscheiden, wie beispielsweise das Herstellen einer Verbindung
zu einem anderen Ort. Die Nachricht beinhaltet außerdem die Adresse
des Empfängers
auf einem Nachrichtenübermittlungssystem,
das die in dieser Nachricht eingebetteten Anweisungen interpretieren
kann.
-
Wie später beschrieben werden wird,
wird die strukturierte Nachricht durch den Absender über eine graphische
Benutzerschnittstelle 103 auf dem Editor 102 aus
einer Sammlung zuvor aufgenommener Audiodateien, die entweder kleine
oder große
Sprachfragmente enthalten, durch die Echtzeiteingabe von Audiofragmenten,
durch die Tastatureingabe von großen und/oder kleinen Textnachrichtenfragmenten
und/oder durch Verweis auf andere Text- oder Audiodateien abgefasst.
Für die
spezielle hier offenbarte Ausführungsform
formuliert der Editor 102 die strukturierte Nachricht unter
Verwendung einer Telefon-Markup-Sprache
(PML), um die Text- und Audioelemente der Nachricht und die eingebetteten
Anweisungen in dieser Nachricht zu definieren. Wie aus den speziellen,
später
ausführlich
beschriebenen Beispielen offenbar wird, ist die resultierende Nachricht
eine PML-Markup's
enthaltende "Seite", die in ihrem optischen
Aussehen einer HTML "Seite" ähnlich ist, die von einem HTML-Editor erzeugt wird,
der zur Erzeugung herkömmlicher
Webseiten verwendet wird, die zur visuellen Darstellung auf einem
Videoendgerät
wie beispielsweise einem Fernseher oder einem Computermonitor ausgegeben
werden. Die von dem Editor 102 erzeugte PML-"Seite", die die Nachricht
darstellt, enthält
somit PML-Markup's
und Textkomponenten, die durch das Nachrichtenübermittlungssystem 104 in
akustisches Material umgewandelt werden. Die resultierende strukturierte
Nachricht kann außerdem
auch Anhänge umfassen,
die reale Audio- oder Textdateien sein können, die an die Nachricht
angehängt
werden, oder Adressen auf dem IP-Netz 105, wie beispielsweise
URL's, bei denen
auf Audio- oder Textdateien zugegriffen und von denen sie auf das
Nachrichtenübermittlungssystem
heruntergeladen werden können.
-
Eine Telefon-Markup-Sprache ist eine
Sprache, die implementiert wurde, um es Nutzern an Audioendgeräten wie
beispielsweise Telefonen zu ermöglichen,
eine Schnittstelle zu Web-basierenden Sprachantworteinheiten auszubilden,
um auf interaktive Sprachantwort(IVR)-Dienste zuzugreifen und um auf andere
mit dem Internet verbundene Webserver zuzugreifen. (Siehe z. B. "PML: A Language Interface
to Networked Voice Response Units", von J. C. Ramming, Workshop on Internet
Programming Languages, ICC '98,
Loyola University, Chicago, Illinois, Mai, 1988, die durch Bezugnahme
hier aufgenommen wird). Kürzlich
kündeten
AT&T, Motorola,
IBM and Lucent Technologies eine Zusammenarbeit an, um eine spracherweiterbare
Markup-Sprache zu implementieren, die es Endnutzern an Sprachendgeräten gestatten
wird, durch Sprache auf das Internet zuzugreifen (siehe z. B Wall
Street Journal, 2. März
1999). Von dieser Sprache wird erwartet, dass sie ein Standard zum
Definieren von Sprachkommandos für
das Internet wird und dass sie wahrscheinlich viele Aspekte der
in der oben genannten Veröffentlichung
von J. C. Ramming beschriebenen PML enthalten wird. Derartige Web-basierende
interaktive Sprachdienste werden Telefonnutzern durch eine Einrichtung
bereitgestellt, die im folgenden als Telefon/IP-Server bezeichnet
wird. Ein derartiger Telefon/IP-Server schließt auf einer Seite einen Telefonanruf
ab und ist auf der anderen mit dem IP-Netz verbunden. Die Fähigkeit
eines Endnutzers an einem Audioendgerät wie beispielsweise einem
Telefon, auf das Internet zuzugreifen, ist zum Beispiel beschrieben
in: unter dem Patentkooperationsabkommen (PCT) publizierte internationale
Anmeldung, Veröffentlichungsnummer
WO 97/40611 mit dem Titel "Method
and Apparatus For Information Retrieval Using Audio Interface", veröffentlicht
am 20. Oktober 1997 mit dem Prioritätsdatum 22. April 1996, basierend
auf der gleichzeitig anhängigen
US-Patentanmeldung 08/635.801 von M. A. Benedikt, D. A. Ladd, J.
C. Ramming, K. G. Rehor und C. D. Tuckey; D. L. Atkins, T. Ball,
T. R. Baran, M. A. Benedikt, K. C. Cox, D. A. Ladd, P. A. Mataga, C.
Puchol, J. C. Ramming, K. G. Rehor und C. D. Tuckey, "Integrated Web and
Telephone Service Creation", Bell
Labs Technical Journal, S. 19–35,
Winter 1997; und EP- A-0992980.
Ein Verfahren für
den Zugriff auf das Internet und das Browsen darin unter Verwendung
eines Telefons und von Telefonwahlsignalen ist auch in der WO-A-97/32427
beschrieben.
-
Wie in den vorgenannten Literaturangaben
beschrieben ist, kann ein Endnutzer an einem Audioendgerät, wie beispielsweise
einem Telefon, auf IVR-Dienste auf einem IP-Netz über den
Telefon/IP-Server
zugreifen, der die Schnittstelle zwischen dem PSTN-Sprachnetz und
dem IP-Netz, wie beispielsweise dem Internet oder anderen Fern-
oder lokalen Computernetzen, bildet. Der Telefon/IP-Server funktioniert
derart, dass er es Endnutzern ermöglicht, über ihren Telefonapparat interaktive
Dienste mit Web-Servern
aufzunehmen, die auf einem derartigen Fernnetz oder lokalen Netz
verbunden sind. Der in den Literaturverweisen beschriebene Telefon/IP-Server
ist auf einem Allzweckcomputer als Hardware und Software ausgeführt, die
zusammen die Funktionen der Audiowiedergabe und -aufzeichnung, der
Text-zu-Sprache-Synthese,
der Tonfrequenzwählsystem(DTMF)(Wählsignal)-Erkennung, der Verarbeitung
von automatischer Spracherkennung (ASR) und andere Anrufsteuerungsfunktionen,
die für
interaktive Audiodienste notwendig sind, durchführen. Ein derartiger Telefon/IP-Server
arbeitet derart, dass er Eingaben von Telefonendnutzern als Sprache
oder DTMF-Signale akzeptiert
und als Proxyserver für
diesen Endnutzer agiert, der über
das Internet Anforderungen an jene Webserver schickt, die die IVR-Dienste
bereitstellen, mit denen der Endnutzer zu interagieren wünscht. Der
Telefon/IP-Server und die Webserver, die die IVR-Dienste bereitstellen,
kommunizieren unter Verwendung einer PML. Wie angemerkt wurde, wird
PML in der Zukunft durch die als Standard zu erwartende spracherweiterbare Markup-Sprache
verdrängt
werden.
-
Die Erfinder haben erkannt, dass
vorteilhafte Resultate durch Einbeziehung der Funktionalitäten des Telefon/IP-Servers
in ein integriertes Nachrichten übermittlungssystem 104 erzielt
werden können.
Eine von dem Absender beispielsweise an einem Client-Endgerät 101 abgefasste
strukturierte Nachricht, die eine Vielzahl von Nachrichtenelementen
enthält,
die mit PML-Markup
oder dergleichen formatiert sind, wird an ein derartiges integriertes
Nachrichtenübermittlungssystem 104,
das diese Funktionalitäten
aufweist, gesendet und dann gespeichert. Wenn der Empfänger auf
das Nachrichtenübermittlungssystem 104 zugreift,
wird die Nachricht aus dem Speicher abgerufen und entsprechend den
in der PML-markierten, gespeicherten Nachricht eingebetteten Anweisungen
verarbeitet. Das Nachrichtenübermittlungssystem 104 beinhaltet
somit einen Interpreter, der die eingebetteten Anweisungen interpretieren
und die Nachricht dem Empfänger
hörbar
in der von dem Absender beabsichtigten Weise präsentieren kann. So können die
verschiedenen Nachrichtenelemente eine Kombination von Textfragmenten
in dem Körper
der Nachricht, von Audio- und/oder Textfragmenten in Dateien, die
an die Nachricht angehängt
und mit ihr gespeichert werden, und von Text- und/oder Audiofragmenten,
die an speziellen URL's
auf dem IP-Netz 105 gespeichert sind, umfassen. Für das Abspielen
werden Textnachrichtenelemente durch einen Text-zu-Sprache-Prozessor
in Sprache konvertiert und miteinander und mit Audiofragmenten,
die aus ihren Dateien konvertiert werden, kombiniert, um dem Empfänger eine
Audionachricht zu präsentieren,
die in den Ohren des Empfängers
die akustische Erscheinung einer einheitlichen Nachricht aufweist.
-
Die von dem Absender an das Nachrichtenübermittlungssystem 104 des
Empfängers
gesendete strukturierte Nachricht kann vorteilhafterweise mit PML-Markup's strukturiert sein,
um Interaktionen zwischen dem Empfänger und dem Nachrichteninhalt
und zwischen dem Empfänger
und der Außenwelt
zu ermöglichen, wenn
der Empfänger
die Nachricht abruft. Die PML-formatierte und gespeicherte Nachricht
kann somit Markup's
enthalten, die durch den Interpreter interpretiert werden, um dem
Empfänger
zum Beispiel eine Wahlmöglichkeit
zu präsentieren.
Der Interpreter würde
dann bei dem Präsentieren
der Nachricht für
den Empfänger
erwarten, von dem Empfänger
eine Eingabe als Antwort auf die Wahlmöglichkeit zu empfangen. Die
spezielle Eingabe des Empfängers,
die durch die Wähltastatur
auf dem Telefongerät 106 oder
durch Sprache, die ein automatischer Spracherkennungs(ASR)-Prozessor
erkennt, eingegeben wird, bestimmt wie und was dem Empfänger in
der Nachricht zu präsentieren
ist.
-
Die Einzelheiten des Nachrichtenübermittlungssystems,
wenn es eine strukturierte Nachricht empfängt und speichert und dann
diese Nachricht verarbeitet, wenn sie später von dem Empfänger abgefragt
wird, sowie die Einzelheiten, die mit der Abfassung der strukturierten
Nachricht auf dem absenderseitigen Ende verbunden sind, werden im
folgenden erläutert
werden. Ein besseres Verständnis
der Erfindung kann erzielt werden, wenn man zunächst mehrere unten vorgestellte
spezielle Beispiele von strukturierten Nachrichten studiert.
-
In den unten beschriebenen Beispielen
wird angenommen, dass das integrierte Nachrichtenübermittlungssystem,
an das die strukturierten Nachrichten gesendet werden und von dem
die Nachrichten abgerufen werden, sich auf einem firmeneigenen Intranet
befindet, so dass die PML, die verwendet wird, um die Nachrichten
zu formatieren, für
alle Nachrichtenabsender standardisiert werden kann und das Nachrichtenübermittlungssystem
auf einfache Weise eingerichtet werden kann. Ein Nachrichtenübermittlungssystem,
das verfügbar
ist, um strukturierte Nachrichten von einem beliebigen Empfänger zu
empfangen, würde
eine großangelegte
Standardisierung der Telefon-Markup-Sprache erfordern, was wie zuvor
angemerkt Ziel des angekündigten
Gemeinschaftsprojekts zwischen AT&T,
Motorola und Lucent Technologies ist. Von dem IP-Netz 105 in
den nachstehenden Beispielen wird also angenommen, dass es ein firmeneigenes
Intranet ist, mit dem auch der Absender an einem Client-Endgerät 101 verbunden
ist.
-
Um des Verständnisses willen wird in den
folgenden Beispielen ein gemeinsames Szenario angenommen. Das postulierte
Szenario in diesen Beispielen besteht insbesondere darin, dass der
Absender der strukturierten Nachrichten eine firmeneigene interne
Trainingsorganisation ist, die Angestellte über verfügbare Kurse informieren will,
und dass derartige Angestellte auf Informationen zugreifen können und
sich über
ihre Telefone für
derartige Kurse registrieren können.
Anstatt ein Sprachausgabesystem dafür zu reservieren und die für solche
Zwecke benötigte
Telekommunikationsinfrastruktur (z. B. viele eingehende Leitungen)
zu unterhalten, werden strukturierte Nachrichten an die Mailboxen
der Angestellten auf einem integrierten Nachrichtenübermittlungssystem 104 geschickt,
das derartige strukturierte Nachrichten verstehen und interpretieren
kann. Es wird hier eine spezielle PML für den Strukturierungsmechanismus
in den folgenden Beispielen mit der beschriebenen Interpretation
der Markup's angenommen.
-
Die allgemeine strukturierte Nachricht
der vorliegenden Erfindung mischt eine Vielzahl von Textfragmenten
und Audiofragmenten kleiner Größe. Diese
Fähigkeit
ist wahrscheinlich am nützlichsten
für automatisch
erzeugte Nachrichten mit festgelegtem, aufgezeichnetem Audioinhalt
und erzeugtem Textinhalt. Der Mechanismus der Fragmentzusammenstellung
geschieht durch die Verwendung eingebetteter Markierungen, die angeben,
wann eine Audiodatei und wann Text-zu-Sprache-Verarbeitung von Textfragmenten durchzuführen ist.
Die Audiodatei oder eine Textdatei kann Teil der Nachricht selbst
sein (z. B. ein Emailanhang oder eine vielteilige MIME-Nachricht)
oder kann von anderer Stelle im Netz 105 abrufbar sein,
mit der das Nachrichtenübermittlungssystem über eine
URL verbunden wird. Audioinhalt kann mit anderem Inhalt in der strukturierten Nachricht
eine Sequenz bilden oder im Hintergrund abgespielt werden.
-
Als erstes Beispiel der strukturierten
Nachricht wird angenommen, dass die Trainingsorganisation eine Bestätigungsnachricht
an alle senden will, die sich für
einen Kurs eingetragen haben. Die Nachricht ist eine Email, die
automatisch von dem Registrierungssystem 110 erzeugt und
an die Mailbox des Registrierenden auf dem integrierten Nachrichtenübermittlungssystem 104 gesendet
wird. Die erzeugte Nachricht kann wie in Tabelle 1 gezeigt aussehen.
-
-
Die Nachricht beinhaltet auch sechs
MIME-Anhänge,
Audiodateien: "inspirational.au", "for.au", "from.au", "thanks.au", "course.au" und "when.au", die aus der PML-formatierten
Nachricht abgerufen werden. Um dem Empfänger die Nachricht vorzuspielen,
wenn er sie durch Zugriff auf seine Mailbox auf dem Nachrichtenübermittlungssystem 104 abruft,
stellt das Nachrichtenübermittlungssystem 104 Informationen
aus der Nachricht zusammen, wobei der Textteil der Nachricht auf
zwei Arten verwendet wird. Zuerst werden die Markup-Elemente, die
in dem in Tabelle 1 verwendeten Markup-Beispiel von Winkelklammern
begrenzt werden, dazu verwendet, die Nachrichtenstruktur zu bestimmen.
Als zweites werden Textinhalte, die in oder zwischen den Markup-Elementen
vorkommen, an einer geeigneten Stelle beim Abspielen der Nachricht
für den
Empfänger
zu Sprache synthetisiert. In diesem Beispiel ist die Nachrichtenstruktur
einfach, erfordert das Abspielen von Audiodateien und die Durchführung von
Text-zu-Sprache(TTS)-Verarbeitung auf verwobene (und möglicherweise
parallele) Weise.
-
Der Empfänger am Telefonapparat 106 hört das Folgende,
wenn diese strukturierte Nachricht durch das Nachrichtenübermittlungssystem 104 ausgegeben
wird. Um das Verständnis
der Funktionen des Nachrichtenübermittlungssystems
zu fördern,
sind unten die aus Audiodateien erzeugten Fragmente unterstrichen, während TTS-Fragmente
als einfacher Text gezeigt sind:
(Inspirierende Musik spielt
im Hintergrund...)
"Dies
ist eine Nachricht für
Peter Mataga von der Trainingsorganisation. Vielen Dank für die Registrierung
für den
Kurs 'UM301: Fortgeschrittene
vereinheitlichte Nachrichtenübermittlung'. Der Kurs wird am
26. Januar 1999 von 15:00 bis 17:00 stattfinden."
-
Die Textfragmente "Peter Mataga", "UM301: Fortgeschrittene
vereinheitlichte Nachrichtenübermittlung" und "26. Januar 1999 von
15:00 bis 17:00" werden
in Sprache konvertiert. Die Hintergrundmusik und die Audiofragmente "Dies ist eine Nachricht
für", "von der Trainingsorganisation", "Vielen Dank für die Registrierung
für den
Kurs", "der Kurs" und "wird am stattfinden" werden durch Abspielen
der Audiodateien mit geeigneten Namen (identifiziert in den Markup's) erzeugt, nachdem
sie aus der strukturierten Nachricht herausgelöst wurden.
-
Das Flussdiagramm in 2 veranschaulicht die Schritte des Verfahrens
zum Senden und Empfangen einer elementaren strukturierten Nachricht
der gerade beschriebenen Art. Bei Schritt 201 sendet der
Absender die strukturierte Nachricht an ein integriertes Nachrichtenübermittlungssystem,
das die in der Nachricht eingebetteten Anweisungen empfangen und
interpretieren kann und die Nachricht dem Empfänger gemäß diesen Anweisungen präsentiert,
wenn der Empfänger
auf die Mailbox zugreift. Bei Schritt 202 speichert das Nachrichtenübermittlungssystem
die von dem Absender gesendete Nachricht. Zu einem späteren Zeitpunkt greift
der Empfänger
bei Schritt 203 auf das Nachrichtenübermittlungssystem zu und ruft
die gespeicherte strukturierte Nachricht ab. Bei Schritt 204 interpretiert
das Nachrichtenübermittlungssystem
die Struktur der abgefragten Nachricht mittels der eingebetteten
Anweisungen und formuliert die Nachricht aus einer Kombination von:
TTS-Verarbeitung von Textfragmenten im Nachrichtenkörper, Textfragmenten
in an die Nachricht angehängten
Dateien und/oder Textfragmenten an bestimmten URL's und/oder Abspielen
von Audiofragmenten in angehängten
Dateien oder von Adressen an bestimmten URL's. Bei Schritt 204 präsentiert
das Nachrichtenübermittlungssystem
dem Empfänger
die formulierte strukturierte Nachricht auf hörbare Weise. Nach dem Abhören der
Nachricht bei Schritt 205 kann der Empfänger die Nachricht löschen oder
von vorne abspielen oder eine weitere, strukturierte oder nicht
strukturierte Nachricht aus dem Nachrichtenübermittlungssystem abrufen
oder das Nachrichtenübermittlungssystem
verlassen.
-
Obwohl ein Nachrichtenabsender eine
strukturierte Nachricht dieser Art individuell angeben kann, kann
eine derartige Nachricht auch automatisch erzeugt werden. Die Fähigkeit,
eine strukturierte Nachricht automatisch zu erzeugen, ist von besonderem
Nutzen, wenn ein Absender, wie in diesem Beispiel die Trainingsorganisation,
viele solche Nachrichten an alle Individuen absenden muss, die sich
für einen
Kurs registriert haben. Für
diesen Fall der automatischen Nachrichtenerzeugung würden die
Audiodateien daher aller Wahrscheinlichkeit nach Informationen repräsentieren,
die für
alle Nachrichten dieser Art die gleichen sind, während der eingebettete Text
dynamische Information wäre,
die für
die einzelnen Nachrichten unterschiedlich ist und die beispielsweise
von einer Datenbank 111 oder einem Transaktionssystem abgerufen
werden kann.
-
3 ist
ein Flussdiagramm, das die Schritte zeigt, die mit dem Formulieren
und Senden einer kundenspezifisch strukturierten Nachricht an mehrere
Empfänger
verbunden sind. Bei Schritt 301 formuliert der Absender
eine strukturierte Nachricht, die als inhaltsbezogene Nachrichtenelemente
nur diejenigen Nachrichtenelemente enthält, die sie mit der an die
Mailbox jedes Empfängers
gesendeten Nachricht gemeinsam hat. Bei Schritt 302 wird
auf ein oder mehrere Nachrichtenelemente, die mit einem bestimmten
Empfänger
verknüpft
sind, aus einer anderen Quelle zugegriffen, wie beispielsweise einer
Datenbank oder einem Transaktionssystem. Dieses eine oder die mehreren
Nachrichtenelemente können
textlicher oder akustischer Natur sein. Bei Schritt 303 werden
die empfängerspezifischen
Nachrichtenelemente und die nicht empfängerspezifischen Nachrichtenelemente
kombiniert, um die an die Mailbox des speziellen Empfängers zu
sendende Nachricht zu formulieren. Das empfängerspezifische Nachrichtenelement
kann als Text in die strukturierte Nachricht eingegliedert werden
oder kann an die Nachricht als angehängte Text- oder Audiodatei
angehängt werden.
Bei Schritt 304 wird die kombinierte strukturierte Nachricht an
die Mailbox des vorgesehenen Empfängers gesendet. Bei Schritt 305 wird
ermittelt, ob irgendwelche anderen Empfänger die strukturierte Nachricht empfangen
sollen. Falls das der Fall ist, kehrt der Fluss zu Schritt 302 zurück, um auf
ein oder mehrere inhaltsbezogene Nachrichtenelemente zuzugreifen,
die mit einem anderen derartigen Empfänger verknüpft sind und die dann mit den
nicht empfängerspezifischen
Nachrichtenelementen kombiniert werden, um eine Nachricht zu formulieren,
die an die Mailbox dieses nächsten
Empfängers
gesendet wird.
-
Die strukturierte Nachricht kann
eine Substruktur enthalten, die es dem Empfänger gestattet, durch die Nachricht
zu navigieren, ohne linear alle Nachrichteninhalte anzuhören, die
von dem Absender gesendet wurden und in der Mailbox des Empfängers ruhen.
Ein Beispiel ist eine in Abschnitte mit Überschriften unterteilte Nachricht,
bei der das Nachrichtenübermittlungssystem
alle Überschriften
vorlesen könnte
und es dem Empfänger
dann gestattet, einen oder mehrere anzuhörende Abschnitte auszuwählen. Abschnitte
können
auch Unterabschnitte aufweisen und so weiter. Als Beispiel versendet
die Trainingsorganisation an die Mailboxen ihrer Angestellten eine
wöchentliche
Informationsemail, die die augenblicklichen Kursangebote beschreibt.
Ein Empfänger
will wahrscheinlich nicht alle Informationen in der Nachricht, sondern
nur diejenigen Teile anhören, die
von besonderem Interesse für
ihn sind. Tabelle 2 stellt ein Beispiel einer derartigen Nachricht
dar. Es sollte beachtet werden, dass bei diesem Beispiel und den
Beispielen, die folgen, um der Lesbarkeit willen allgemein Textinhalte
anstelle von Audiodateien verwendet werden. Eingebetteter Audioinhalt,
wie er in dem Beispiel von Tabelle 1 verwendet wurde, könnte jedoch überall ersetzt
werde, wo TTS-Verarbeitung eingesetzt wird.
-
-
-
-
Wenn die Nachricht in Tabelle 2 durch
das Nachrichtenübermittlungssystem 104 empfangen,
gespeichert und später
von dem Empfänger
abgerufen wird, erkennt der Interpreter die Markup's in der Nachricht
und daraus die Struktur der Nachricht, wodurch es ermöglicht wird,
diese Struktur für
die Präsentation
für den
Empfänger
zu interpretieren, wobei diese Struktur in diesem Beispiel einen
Satz hierarchischer Menüs
definiert. Im Beispiel in Tabelle 2 weisen die Markup's im Unterschied
zu dem Beispiel in Tabelle 1 Inhalt auf, der ebenso strukturiert
sein kann. Beispielsweise beginnt ein MENU-Element mit dem Markup <MENU> und endet mit dem Markup </MENU>. Dazwischen können ein
PROMPT-Element (eventuell ohne Inhalt) und ein oder mehrere ITEM-Elemente
vorkommen, die ein TITLE-Element umschließen müssen, gefolgt von einer beliebigen
Art von Inhalt, einschließlich
einem weiteren MENU.
-
Das MENU-Element repräsentiert
eine Gelegenheit für
den Empfänger,
während
des Abhörens
der Nachricht eine Navigationsauswahl zu treffen. Das integrierte
Nachrichtenübermittlungssystem
verarbeitet ein MENU-Element,
wenn es während
der Verarbeitung und Wiedergabe angetroffen wird, indem dem Empfänger der
Inhalt des PROMPT vorgespielt wird, der jede Kombination von Audiodateien
und TTS-Information sein kann, und die TITEL der ITEM's als Auswahlmöglichkeiten
angeboten werden. Man beachte, dass nur ITEM's, die unmittelbar als Inhalt des MENU-Elements
vorkommen, auf diese Weise behandelt werden -ITEM's, die weiter unten
in der Hierarchie als Inhalt eingeschlossener MENU-Elemente vorkommen,
werden nicht verwendet, bis das MENU, in dem sie vorkommen, verarbeitet
ist. Der Empfänger
trifft eine Auswahl durch Tastatureingabe, Sprache oder andere Signalisierungsverfahren,
und der Inhalt des ITEM wird dem Empfänger vorgelesen, eventuell
unter Einschluss einer weiteren komplexen Verarbeitung. Das hier
angenommene Standardverhalten für
Menüs in
diesem Beispiel besteht darin, dass das item verarbeitet wird und
dann das Menü von neuem
präsentiert
wird. Der Empfänger
kann sich dafür
entscheiden, ein Menü zu
verlassen; in diesem Fall wird die Verarbeitung der Nachricht nach
dem Menü fortgesetzt.
Wenn ein Menü Teil
eines item in einem Stammmenü ist,
wird eine Wiederanforderung des Stammmenüs resultieren. Die dem Empfänger präsentierte Auswahlmöglichkeit
des Verlassens kann auch sensitiv darauf sein, ob das Menü ein Menü der obersten
Ebene ist oder nicht. Man beachte, dass es viele andere mögliche Verhaltensgestaltungen
für Menüs gibt;
das Markup könnte
Anweisungen an das Nachrichtenübermittlungssystem
umfassen, die ein solches Verhalten steuern. Das in Tabelle 2 präsentierte
Beispiel ist daher nur ein Beispiel einer möglichen Menügestaltung.
-
Die Wirkung der Interpretation der
Nachrichtenstruktur durch das Nachrichtenübermittlungssystem besteht
darin, dass der Empfänger
durch die Informationen in der Nachricht navigieren kann, wobei
er (eventuell mehr als einmal) nur die Teile anhört, an denen er interessiert
ist. Ein mögliches
Szenario einer Empfängerinteraktion
für die
empfangene Nachricht in Tabelle 2 wird unten vorgestellt. In dem
Szenario unten zeigen kursive Sätze
ein Audiomuster an, das von dem Interpreter 117 in dem
Nachrichtenübermittlungssystem 104 erzeugt
wird, um Menüs
und andere Standardinteraktionen zu präsentieren, während Klarschrifttext
TTS-Übersetzungen
von Fragmenten aus der Nachricht sind, wie beispielsweise die item-Titel;
Einträge
in Klammern bezeichnen die von dem Empfänger vorgenommenen Aktionen:
"Dies ist ihr monatliches
Update für
Trainingskurse.
Neue Kurse auf dem Gebiet der vereinheitlichten
Nachrichtenübermittlung
sind diese Woche neben unseren existierenden Kursangeboten verfügbar.
Für Neue Kurse
drücken
Sie 1;
Für
Existierende Kurse drücken
Sie 2;
Für
Allgemeine Informationen drücken
Sie 3;
Um dieses Menü zu
verlassen, drücken
Sie das Raute-Zeichen."
(Empfänger drückt 2)
"Wir stellen Kurse
in einer Vielzahl von Kategorien bereit. Bitte wählen Sie eine Kurskategorie
Für Widget
Kurse drücken
Sie 1;
Für
Gadget Kurse drücken
Sie 2;
Um zum vorhergehenden Menü zurückzukehren, drücken Sie
das Raute-Zeichen."
(Empfänger drückt 1)
"Bitte wählen Sie
einen Kurs, um eine kurze Beschreibung zu hören:
Für Einführung in Widgets drücken Sie
1;
Für
Mäßig fortgeschrittene
Widgets drücken
Sie 2;
Für
Fortgeschrittene Widgets drücken
Sie 3;
Um zum vorhergehenden Menü zurückzukehren, drücken Sie
das Raute-Zeichen."
(Empfänger drückt 3)
"Dieser Kurs deckt...
Für Einführung in
Widgets drücken
Sie 1;
Für
Mäßig fortgeschrittene
Widgets drücken
Sie 2;
Für
Fortgeschrittene Widgets drücken
Sie 3;
Um zum vorhergehenden Menü zurückzukehren, drücken Sie
das Raute-Zeichen."
(Empfänger drückt #)
"Bitte wählen Sie
eine Kurskategorie:
Für
Widget Kurse drücken
Sie 1;
Für
Gadget Kurse drücken
Sie 2;
Um zum vorhergehenden Menü zurückzukehren, drücken Sie
das Raute-Zeichen."
(Empfänger drückt #)
Für Neue Kurse
drücken
Sie 1;
Für
Existierende Kurse drücken
Sie 2;
Für
Allgemeine Informationen drücken
Sie 3;
Um dieses Menü zu
verlassen, drücken
Sie das Raute-Zeichen."
(Empfänger drückt #)
"Auf Wiedersehen.
Wir hoffen, Sie bald in einem unserer Kurse zu sehen!"
-
(An dieser Stelle empfängt der
Empfänger
die üblichen
Optionen eines Nachrichtenübermittlungssystems,
die Nachricht zu löschen,
die Nachricht noch einmal anzuhören,
etc.)
-
Das Verarbeiten dieser Art von Struktur
beinhaltet immer noch wie bei der Nachricht in dem Beispiel der
Tabelle 1 die Extraktion von Fragmenten aus der Nachricht in Tabelle
2, die dem Empfänger
zu präsentieren
sind. Der Extraktionsprozess ist jedoch komplexer, weil er das Auffinden
aller item-Titel für
ein Menü,
das Konstruieren eines Audiomusters zur Angabe der Auswahlmöglichkeiten
erfordert und charakteristischerweise dynamisch von Interaktionen
mit dem Empfänger
abhängt,
die speziell jene Teile der strukturierten Nachricht bestimmen,
die dem Empfänger
tatsächlich
hörbar
präsentiert
werden.
-
Das Flussdiagramm in 4 veranschaulicht die Schritte, die mit
dem Senden einer strukturierten Nachricht an einen Empfänger verbunden
sind, die eine Interaktion zwischen dem Empfänger und der Nachricht wie
oben beschrieben gestattet. Die Schritte 401, 402 und 403 sind
die gleichen wie die Schritte 201, 202 und 203 in
dem oben beschriebenen Flussdiagramm der 2 und werden um der Kürze willen hier nicht wiederholt.
Bei Schritt 404 interpretiert das Nachrichtenübermittlungssystem
die strukturierte Nachricht, wobei es dem Empfänger hörbar Navigationswahlmöglichkeiten
anbietet und die Präsentation
derartiger Auswahlmöglichkeiten
gemäß den eingebetteten
Anweisungen in der Nachricht bestimmt wird. Bei Schritt 405 wählt der Empfänger, wenn
ihm eine Navigationswahlmöglichkeit
präsentiert
wird, eine Option, beispielsweise mittels einer Tastatur- oder Spracheingabe
durch seinen Telefonapparat. Bei Schritt 406 fährt das
Nachrichtenübermittlungssystem
damit fort, als Reaktion auf die Eingabe des Empfängers und
als Funktion davon, Audioinhalte aus der strukturierten Nachricht
zu übermitteln.
Bei Schritt 407 wird ermittelt, ob die Nachricht abgeschlossen ist.
Falls dies der Fall ist, kann der Empfänger bei Schritt 408 die
Nachricht löschen
oder von neuem abspielen, eine weitere Nachricht abrufen oder seine
Interaktion mit dem Nachrichtenübermittlungssystem
beenden. Falls bei Schritt 407 die Nachricht nicht komplett
ist, setzt sich die Präsentation
der strukturierten Nachricht für
den Empfänger
an einem Eingangspunkt nach der vorhergehenden Navigationswahlmöglichkeit
fort, indem dem Empfänger
weitere Navigationswahlmöglichkeiten
angeboten werden, falls die strukturierte Nachricht so formatiert
ist.
-
Die strukturierte Nachricht kann
auch eingebettete Adressen oder "Links" enthalten, wie sie
gegenwärtig
in der Internettechnik bekannt sind, die eine Telefonadresse wie
beispielsweise eine Telefonnummer (z. B: 630-555-5555 eines Telefonapparats 115 an
dem PSTN 107) oder eine IP-Telefonadresse (z. B. sip:krehor@ipt.training
am Client-Endgerät 116)
angeben. Der Link kann optional auch zusätzliche Informationen enthalten,
wie beispielsweise DTMF-Informationen,
die typischerweise einen "Nebenanschluss" repräsentieren können, der
als Zeichenfolge von Tastaturnummern, Symbolen und/oder Buchstaben
angegeben ist. Im Falle der Pakettelefonie kann der Link andere
Arten zusätzlicher
Information angeben, die mit der Anrufaufbaunachricht weiterzugeben
sind. Zum Beispiel könnte
ein SIP INVITE zusätzliche
Anfangsblockinformation umfassen, wie sie in geeigneten Linkattributen
angegeben ist.
-
Um einen derartigen Link zu verarbeiten,
bietet das Nachrichtenübermittlungssystem 104 dem
Empfänger
beispielsweise die Möglichkeit
an, einen abgehenden Anruf bei dieser Link-Adresse zu tätigen. Falls der
Empfänger
eine Antwortaktion auf dieses Angebot hin ausführt, wie beispielsweise das
Ausführen
einer Tastatureingabe oder das Bereitstellen einer Spracheingabe,
wird das Kommando durch das Nachrichtenübermittlungssystem so interpretiert,
dass es eine bejahende Auswahl durch den Empfänger darstellt, um diesen Link
auszuwählen,
und das Nachrichtenübermittlungssystem 104 wählt diese
Telefonnummer über
das PSTN 107 (oder das Äquivalent
für nicht-PSTN-Bestimmungsorte)
an und spielt bei einer Antwort die Folge von DTMF-Tönen ab,
die dem Nebenanschluss entsprechen, und gestattet es dem Empfänger dann
auf dem Telefonapparat 106 den gerade hergestellten Anruf
mit der antwortenden Partei am Telefonapparat 115 weiterzuführen. Man
beachte, dass die gewählten
Töne alternativ
für einen
anderen allgemeinen Anrufdurchführungszweck
verwendet werden können,
anstatt als Nebenanschluss interpretiert zu werden. Nachdem der Empfänger sein
Gespräch über den
von dem Nachrichtenübermittlungssystem 104 an
dem Telefonapparat 115 platzierten Anruf beendet hat, kann
das Nachrichtenübermittlungssystem
wieder die Steuerung der weitergeführten Interaktion mit dem Empfänger übernehmen,
wodurch es dem Empfänger
gestattet wird, mit dem Abrufen einer nächsten Nachricht aus seiner
Mailbox fortzufahren. Alternativ kann die Nachrichtenübermittlung die
Steuerung zum Zeitpunkt des Anrufs abgeben, wodurch der Empfänger effektiv
zu diesem Anruf beim Telefonapparat 115 transferiert wird
und die Sitzung mit dem Nachrichtenübermittlungssystem 114 verlassen wird.
-
Zusätzlich zu den Links zu Telefonnummern
oder IP-Telefonieadressen
kann die Nachricht eingebettete Links enthalten, die Bestimmungsorte
für Nachrichtenübermittlung
anstelle von Telefonieverbindungen angeben. Beispiele hierfür umfassen
Emailadressen und Web-Dienste für
das Hinaufladen mittels HTTP. Falls der Empfänger sich dafür entscheidet,
auf einen dieser Links zu reagieren, kann eine Sprachnachricht aufgezeichnet
werden und an die angegebene Linkadresse beispielsweise als Emailanhang
gesendet werden.
-
Ein Beispiel einer strukturierten
Nachricht mit mehreren Arten eingebetteter Links ist in Tabelle
3 gezeigt. Für
dieses Beispiel ist angenommen, dass die Trainingsorganisation diese
Email an die integrierte Mailbox jedes Angestellten sendet.
-
-
-
Diese Nachricht wird dem Empfänger auf
die übliche
sequentielle Weise präsentiert,
mit der Ausnahme, dass die eingebetteten Links speziell behandelt
werden. Insbesondere der Inhalt des LINK-Elements (extrahiert zwischen
dem <LINK> und <LINK>-Markup) wird dem Empfänger zusammen
mit zusätzlicher
Information über
den potentiellen Anruf präsentiert.
Der Empfänger
kann dann auswählen,
ob das Nachrichtenübermittlungssystem
den Anruf tätigt
oder eine Nachricht an den angegebenen Bestimmungsort sendet.
-
Für
dieses Beispiel kann die Interaktion zwischen dem Empfänger und
dem Nachrichtenübermittlungssystem
wie folgt sein. Wiederum ist ein von dem Nachrichtenübermittlungssystem
erzeugtes Audiomuster kursiv dargestellt. Es zeigt sich, dass dieses
Muster üblicherweise
TTS-Fragmente umgibt, die aus dem Inhalt und den Attributen der
Markup-Elemente entnommen werden, wie beispielsweise die Beschreibung
und die Telefonnummer des Bestimmungsorts. Die Attribute der Markup-Elemente
beeinflussen zudem die Interaktion des Empfängers. So wird ein LINK-Typ
CALL anders präsentiert
und führt
zu anderen Aktionen durch das Nachrichtenübermittlungssystem als ein
LINK-Typ MESSAGE. Im folgenden Beispiel wird angenommen, dass das integrierte
Nachrichtenübermittlungssystem 104 automatische
Spracherkennungsfähigkeiten
besitzt.
"Die
Nachricht enthält
aktive Links. Sagen sie 'Anruf' oder 'Senden', um einem Link zu
folgen."
"Dies ist ihr monatliches
Update für
Trainingskurse.
Neue Kurse auf dem Gebiet der vereinheitlichten
Nachrichtenübermittlung
sind diese Woche verfügbar.
Für Information
rufen Sie Ken Rehor bei SIP-Adresse krehor bei ipt dot training
an."
(Man beachte,
dass der TTS-Text "Ken
Rehor" aus dem Inhalt
des LINK-Elements kommt, während
die SIP-IP-Telefonadresse "krehor@ipt.training" von dem DEST-Attribut des Elements
kommt, die als SIP-URL erkannt wird.)
(Das Nachrichtenübermittlungssystem
pausiert kurz, um es dem Empfänger
zu gestatten, dem Link zu folgen [d. h. einen IP-Telefonanruf über das
Netz 105 zu der angegebenen Adresse zu tätigen].
Falls keine Aktion erfolgt, fährt
das Nachrichtenübermittlungssystem
fort.)
"Für Informationen über existierende
Kurse, rufen Sie die automatische Kursinformation unter der Nummer 630-555-5555,
Anschluss 3,2 an."
(Das
Nachrichtenübermittlungssystem
pausiert, der Empfänger
sagt 'Anruf')
"Der Anruf wird getätigt...drücken sie
die Raute-Taste,
um den Anruf zu beenden."
(Das
Nachrichtenübermittlungssystem 104 wählt den
Telefonapparat 115 unter 630-555-5555 an, wartet auf die
Antwort, sendet den DTMF-Ton 3, pausiert, sendet dann den Ton 2,
schaltet den Empfänger
zu, wartet dann auf die Anrufbeendigung)
(Der Empfänger spricht
mit der angerufenen Parte, drückt
dann #, um den Anruf zu beenden.)
(Das Nachrichtenübermittlungssystem 104 unterbricht
die Rufverbindung, nimmt die Nachrichtensitzung wieder auf)
(Der
Empfänger
entscheidet sich dafür,
die Nachricht noch einmal zu hören;
diesmal folgt er keinem Telefon-Zink)
"... Wie üblich sollten allgemeine Anfragen über Training
an Steve Gurey unter email sgurey at mailserv dot training gerichtet
werden."
(Das
Nachrichtenübermittlungssystem
pausiert, der Empfänger
sagt 'Senden')
"Nehmen Sie beim Ton
eine Audionachricht auf."
(Der
Empfänger
nimmt eine Audionachricht auf)
"Senden der Nachricht."
(Das Nachrichtenübermittlungssystem
sendet die Nachricht als MIME-Anhang an eine Emailnachricht an sgurey@mailserv.training
auf IMS 104)
(Das Nachrichtenübermittlungssystem nimmt die
Email-Sitzung wieder auf)
(Der Empfänger entscheidet sich dafür, die Nachricht
noch einmal zu hören;
diesmal folgt er keinem Link. Nachdem die Nachricht präsentiert
wurde, bietet das Nachrichtenübermittlungssystem
dem Empfänger
die Möglichkeit
an, die Links in der Nachricht nochmals durchzusehen, indem es den
Inhalt jedes in der Nachricht angetroffenen LINK-Elements präsentiert)
"Um alle Links in
dieser Nachricht aufzulisten, sagen sie 'Links'."
(Der
Empfänger
sagt 'Links')
"Anruf Ken Rehor;"
(Pause)
"Rufen sie die automatische...."
(Der Empfänger platzt 'Rehor' sagend dazwischen)
(Das
Nachrichtenübermittlungssystem
tätigt
den Anruf zur SIP-Adresse krehor@ipt.training)
-
Eine übliche Verwendung für die oben
beschriebene Einrichtung wäre
eine Kombination mit der Navigationseinrichtung des mit Tabelle
2 verknüpften
Beispiels, um einen kleinen, in einer Nachricht enthaltenen Verzeichnisdienst
bereitzustellen.
-
Das Flussdiagramm in 5 veranschaulicht die Schritte, die mit
dem Senden einer strukturierten Nachricht, die wie oben beschrieben
eingebettete Verbindungen aufweist, an einen Empfänger verbunden sind.
Die Schritte 501, 502 und 503 sind die
gleichen wie die Schritte 201, 202 und 203 in
dem oben beschriebenen Flussdiagramm der 2 und werden um der Kürze willen hier nicht wiederholt.
Bei Schritt 504 interpretiert das Nachrichtenübermittlungssystem
die Struktur der Nachricht aus ihren eingebetteten Anweisungen und
spielt für
den Empfänger
eine Nachricht ab, die einen Link zu einem angegebenen Bestimmungsort
enthält.
Als Reaktion auf das Präsentieren
eines Nachrichtenelements mit einem zugehörigen Link während der Nachrichtenwiedergabe
für den
Empfänger
ermittelt das Nachrichtenübermittlungssystem
bei Schritt 505, ob der Empfänger bestätigend antwortet, um einen
Transfer zu diesem Linkziel zu akzeptieren. Falls der Link-Transfer bei Schritt 505 von
dem Empfänger
nicht akzeptiert wird, wird bei Schritt 507 die Nachrichtenwiedergabe
weitergeführt.
Falls bei der weitergeführten
Wiedergabe der Nachricht ein weiterer Zink angetroffen wird und
bei Schritt 508 präsentiert
wird, dann kehrt der Fluss zu Schritt 505 zurück, um zu
ermitteln, ob der Empfänger
diesen Link akzeptiert. Falls bei der fortgeführten Wiedergabe der Nachricht
bei Schritt 508 kein weiterer Link angetroffen wird, setzt
sich die Nachrichtenwiedergabe bis zum Ende der Nachricht bei Schritt 509 fort.
Nach dem Ende der Nachricht bei Schritt 506 wird dem Empfänger die
Option eingeräumt,
die Nachricht zu löschen,
von neuem abzuspielen, im Speicher zu halten oder das Nachrichtenübermittlungssystem
zu verlassen. Falls der Empfänger
bei Schritt 505 einen während
der Nachrichtenwiedergabe präsentierten
Link akzeptiert, wird bei Schritt 515 der Link-TYPE ermittelt.
Falls bei Schritt 516 TYPE=CALL gilt, dann wird bei Schritt 517 aus
dem Parameter DEST ermittelt, ob das CALL-Ziel eine PSTN-Telefonnummer
oder eine IP-Telefonadresse ist. Falls ermittelt wird, dass es eine
PSTN-Telefonnummer ist, wird von dem Nachrichtenübermittlungssystem bei Schritt 510 ein
Anruf bei dieser Telefonnummer gestartet. Falls ermittelt wird,
dass es eine IP-Telefonadresse
ist, tätigt
das Nachrichtenübermittlungssystem
bei Schritt 513 einen Anruf bei dieser IP-Telefonadresse.
Falls nach den Schritten 510 oder 513 der Anruf
bei der PSTN-Telefonnummer oder der IP-Telefonadresse den Empfänger nicht
von dem Nachrichtenübermittlungssystem
für eine
direkte Verbindung zu dem Anrufziel transferiert, dann kehrt der
Empfänger
bei Beendigung des Anrufs zum Nachrichtenübermittlungssystem zur Fortführung der
Nachrichtenwiedergabe bei Schritt 507 zurück. Falls
nach Schritt 515 bei Schritt 518 ermittelt wird,
dass TYPE=MESSAGE gilt, dann empfängt das Nachrichtenübermittlungssystem
bei Schritt 511 die Sprachpostnachricht des Empfängers und
bei Schritt 512 wird diese eingegebene Sprachpostnachricht
von dem Nachrichtenübermittlungssystem
als angehängte
Sprachdatei zu der Link-Emailadresse gesendet. Nach dem Senden der
Sprachpostnachricht des Empfängers
an die Emailadresse, wird der Empfänger zur Fortführung der
Wiedergabe der gespeicherten Nachricht bei Schritt 507 zum
Nachrichtenübermittlungssystem
zurückgeführt. Wie
zuvor, kann bei der weitergeführten
Nachrichtenwiedergabe ein anderer Link angetroffen werden oder die
Nachrichtenwiedergabe kann sich bei Schritt 509 bis zum
Ende der Nachricht fortsetzen. Beim nächsten Schritt 506 kann
der Empfänger
dann die Nachricht löschen,
die Nachricht von neuem abspielen, eine andere Nachricht abrufen
oder das Nachrichtenübermittlungssystem
verlassen.
-
Eine strukturierte Nachricht kann
auch eingebettete Anweisungen beinhalten, die bewirken, dass das Nachrichtenübermittlungssystem
von dem Empfänger
Informationen einholt, beispielsweise durch Abspielen einer Aufforderung,
die von dem Empfänger
eine Eingabe anfordert, und durch Sammeln einer Zeichenfolge von über die
Tastatur eingegebenen Tastenwahlzahlen oder akustisch eingegebenen
Informationen. Die strukturierte Nachricht agiert somit als interaktives
Formular, bei dessen Ausfüllen
der Empfänger
vom Nachrichtenübermittlungssystem 104 unterstützt wird.
Die Kombination der Formulareingaben mit einer Navigationsstruktur
bedeutet, dass der Empfänger
nur einen Teil des Formulars ausfüllen kann, falls es mehr als
eine Eingabe gibt. Das Nachrichtenübermittlungssystem sammelt
eine oder mehrere solche Eingaben, sendet dann die gesammelten Informationen
als Datennachricht beispielsweise an einen von dem Absender angegebenen Bestimmungsort.
Dieser Bestimmungsort könnte
typischerweise ein Netzserver sein, wie beispielsweise ein Web-Server
mit CGI, könnte
aber auch ein Bestimmungsort mit geringerer Echtzeit sein, wie beispielsweise eine
Emailadresse.
-
Tabelle 4 ist eine veranschaulichende
strukturierte Nachricht, die eine derartige Funktionalität bereitstellt.
In diesem Beispiel möchte
die Trainingsorganisation erreichen, dass der Empfänger sich
für einen
Kurs registriert und auch etwas über
ihn hört.
Eine Registrierungsanforderung liefert die ID des Empfängers sowie die
Kursnummer.
-
-
-
Wenn diese Nachricht abgerufen und
dem Empfänger
vorgespielt wird, kann der Empfänger
wiederum in der Nachricht navigieren, wird aber dieses Mal an bestimmten
Punkten auch zu Eingaben aufgefordert, wie es durch INPUT und SELECT-Markup-Elemente
vorgegeben wird. Das INPUT-Element bewirkt, dass das Nachrichtenübermittlungssystem
Eingaben von dem Empfänger
zum Beispiel in Form von über
die Tastatur eingegebenen DTMF-Tastenwahlzahlen oder gesprochenen
Buchstaben sammelt. Das SELECT-Element wird verarbeitet, indem ein
Satz von Auswahlmöglichkeiten
auf eine zu dem MENU-Element analoge Weise gebildet wird, wobei
die eingeschlossenen OPTION-Elemente dazu verwendet werden, nicht
nur die präsentierten Auswahlmöglichkeiten
zu ermitteln, sondern auch die Werte, die mit dem Formular zurückzusenden
sind. Die Nachricht in Tabelle 4 könnte die folgende Empfängerinteraktion
hervorbringen:
"Diese
Nachricht enthält
ein auszufüllendes
Formular. Sie können
zur Eingabe von Informationen aufgefordert werden, die an einen
Dienst zur Verarbeitung des Formulars gesendet werden."
"Sie können sich
für einen
unserer Kurse registrieren, indem Sie auf diese Nachricht antworten.
Bitte geben Sie nun ihre Ausweisnummer an."
(Das Nachrichtenübermittlungssystem
wartet auf die Eingabe der Information durch den Empfänger)
(Der
Empfänger
drückt '0123456' auf seiner Tastatur.
Das Nachrichtenübermittlungssystem akzeptiert
dies ohne auf ein Zeitüberschreitungs-
oder Beendigungssymbol zu warten, weil es eine korrekt gebildete,
exakt sieben Zahlzeichen lange Nummer ist, wie durch die TYPE- und
MAXLENGTH-Attribute
in dem INPUT-Element angegeben ist)
"Bitte wählen Sie eine Kurskategorie.
Für Kurse über vereinheitlichte
Nachrichtenübermittlung
drücken
sie 1; Für
Widget-"
(Der
Empfänger
platzt mit '2' dazwischen)
"Bitte wählen Sie
einen oder mehrere Kurse:"
"Drücken Sie
Eins nach jedem Kurs, den sie wählen
möchten,
oder Null, um nichts zu wählen:
Einführung in
Widgets;"
(Das
Nachrichtenübermittlungssystem
pausiert, der Empfänger
tut nichts)
"Um
diesen Kurs zu wählen,
drücken
Sie Eins; um diesen Kurs nicht zu wählen, drücken Sie Null; um alle Auswahlen
zu löschen
und die Liste von neuem zu starten, drücken Sie das Stern-Zeichen;
um die derzeitigen Auswahlen zu akzeptieren, drücken Sie das Raute-Zeichen."
"Einführung in
Widgets;"
(Der
Empfänger
drückt
1)
"Mäßig fortgeschrittene
Widgets;"
(Der
Empfänger
drückt
1, dann #)
"Sie
haben zwei Kurse ausgewählt."
"Bitte wählen Sie
eine Kurskategorie.
Für
Kurse über
vereinheitlichte Nachrichtenübermittlung-"
(Der Empfänger platzt
mit # dazwischen)
"Danke."
"Um die Information,
die Sie eingegeben haben, abzuschicken, drücken Sie jetzt 1."
(Der Empfänger drückt 1)
-
An dieser Stelle packt das Nachrichtenübermittlungssystem
die von dem Empfänger
abgegebenen Informationen in eine Datennachricht, in diesem Fall
eine HTTP-Anforderung wie beispielsweise:
GET /register.cgi?badgenum=0123456&courseid=W101& courseid=W201
und
sendet sie an den www.training genannten HTTP-Server 120 und setzt dann die
Mailboxsitzung fort, indem die nächste
Nachricht abgerufen wird. Man beachte, dass der badgenum-Wert, der
in der Anforderung abgegeben wird, die Folge von Zahlen ist, die
von dem Nutzer bei, dem INPUT-Element eingegeben wurde, während die
courseid-Werte, die in der Anforderung abgegeben werden, diejenigen
sind, die als VALUE-Attribute in den OPTION-Elementen angegeben
sind, die den vom Empfänger
getroffenen Auswahlentscheidungen entsprechen.
-
Die HTTP-Anforderung würde dazu
führen,
dass die Information von dem Webserver 120 der Trainingsorganisation
verarbeitet wird. Die HTTP-Antwort
würde in
diesem Beispiel von dem Nachrichtenübermittlungssystem nicht verwendet
werden, es sei denn, um eventuell einen Fehler anzuzeigen. Die Verarbeitung auf
dem Server 120 kann jedoch zu einer separaten Bestätigungsnachricht
führen,
die an die Mailbox des Empfängers
gesendet wird.
-
Das Flussdiagramm in 6 veranschaulicht die Schritte, die mit
dem Senden einer strukturierten Nachricht verbunden sind, wobei
während
der Interaktion des Empfängers
Information gesammelt und an einen Bestimmungsort gesendet wird,
der in der Nachricht angegeben ist. Die Schritte 601, 602 und 603 sind identisch
zu den oben beschriebenen Schritten 201, 202 und 203 und
werden um der Kürze
willen hier nicht wiederholt. Bei Schritt 604 interpretiert
das Nachrichtenübermittlungssystem
die Struktur aufgrund der eingebetteten Anweisungen und spielt dem
Empfänger
die Nachricht vor, wobei von dem Empfänger an einer oder mehreren
Stellen während
der Nachrichtenpräsentation
eine Eingabe angefordert wird. Wenn während der Wiedergabe der Nachricht
eine Eingabe von dem Empfänger
angefordert wird, nimmt der Empfänger
bei Schritt 605 eine Sprach- oder Telefontastatureingabe
vor. Falls der Empfänger
eine Spracheingabe vorgenommen hat, konvertiert der ASR-Prozessor
in dem Nachrichtenübermittlungssystem
bei Schritt 606 die Eingabe des Empfängers in Text- oder Zahleninformation.
Bei Schritt 607 wird ermittelt, ob die Nachricht vollständig an den
Empfänger
ausgegeben wurde. Falls nicht, setzt das Nachrichtenübermittlungssystem
bei Schritt 608 das Abspielen der Nachricht für den Empfänger fort.
Bei Schritt 609 wird ermittelt, ob während der weitergeführten Wiedergabe
eine zusätzliche
Eingabe von dem Empfänger
erforderlich ist. Falls das der Fall ist, dann kehrt der Fluss zu
Schritt 605 zurück.
Falls nicht, kehrt der Fluss zu dem Entscheidungsschritt 607 zurück. Falls
die Nachricht bei Schritt 607 vollständig an den Empfänger ausgegeben
wurde, sendet das Nachrichtenübermittlungssystem
bei Schritt 610 alle von dem Empfänger gesammelten Informationen
an einen in der Nachricht angegebenen Bestimmungsort. Bei Schritt 611 wird
dem Empfänger
dann die Option angeboten, die Nachricht zu löschen, von vorne abzuspielen,
eine andere Nachricht zu erhalten oder das Nachrichtenübermittlungssystem
zu verlassen.
-
Der Vorteil der Verwendung des Nachrichtenübermittlungssystems
zum Einholen von Informationen vom Empfänger und von mehreren anderen
Empfängern,
wie beispielsweise an den Telefonapparaten 121-1–121-4,
ist aus Sicht des Nachrichtenabsenders die Verteilung der Verarbeitung.
Mit einer derartigen Anordnung ist es insbesondere nicht länger nötig, einen spezialisierten
Dienst und eine Telekommunikationsinfrastruktur zu unterhalten,
um es einer Vielzahl derartiger Empfänger zu gestatten, den Dienst
gleichzeitig anzurufen.
-
Eine strukturierte Nachricht kann
auch eingebettete Anweisungen enthalten, die bewirken, dass das Nachrichtenübermittlungssystem 104 nicht
nur ein Formular einreicht, sondern auch die Antwort vom Server verarbeitet,
bei dem das Formular eingereicht wurde. Diese Antwort kann eine
andere Nachricht sein, die das Nachrichtenübermittlungssystem 104 sofort
verarbeitet. Da diese neue Nachricht ebenfalls ein Formular sein kann,
hatte die ursprüngliche
Nachricht die Wirkung, eine interaktive Sitzung mit einem Dienst
zu initiieren, der an dem entfernten Bestimmungsort aktiv ist, der
von dem Nachrichtenabsender angegeben wird. Aus Sicht des Empfängers ist
es die Wahrnehmung einer komplexen und dynamischen Sprachinteraktion
mit der ursprünglichen
Nachricht.
-
Bei einem derartigen interaktiven
Szenario ist es auch möglich,
dass überhaupt
keine Information von dem Empfänger
eingeholt wird, sondern dass der einzige Zweck des Vorgangs darin
besteht, die Antwort von dem entfernten Dienst zu verarbeiten. Dies
erlaubt es einer Nachricht, auf Informationen zu verweisen, die
auf einem entfernten Server bereitgehalten werden. Der Absender
der ursprünglichen
Nachricht kann zum Beispiel beabsichtigen, dass dem Empfänger die
aktuellste Version zeitlich veränderlicher
Informationen präsentiert
wird. Zudem kann die Nachrichtengröße erheblich kleiner sein,
da nur der explizit von dem Empfänger
angeforderte Inhalt letztlich in das Nachrichtenübermittlungssystem geladen
wird.
-
In beiden Fällen agiert das Nachrichtenübermittlungssystem 104 wie
ein Web-Browser, dessen Nutzer, in diesem Fall der Nachrichtenempfänger am
Telefonapparat 106, auf einen Dienst auf einem entfernten Web-Server 120 zugreift.
Die ursprüngliche
Nachricht wirkt daher wie eine "Vorderseite" für den Dienst.
Das Nachrichtenübermittlungssystem
kann somit einen akustischen Hinweis darauf vorsehen, dass der dargebotene
Inhalt in Wirklichkeit ein Link ist, beispielsweise ein Piepton
vor dem Präsentieren
der Link-Beschreibung.
-
Als Beispiel für die zuvor beschriebene Situation
wird unter Fortsetzung des Trainingsorganisationsbeispiels angenommen,
dass die Trainingsorganisation eine strukturierte Nachricht senden
könnte,
die zu einem Netzdienst verweist, der die derzeitigen Angebote bereitstellt,
anstatt eine strukturierte Nachricht mit allen derzeitigen Angeboten
an die Mailboxen jedes Empfängers
zu senden. Dies stellt sicher, dass der Nachrichteninhalt nicht
veraltet ist. Dieser Dienst könnte
die Registrierung für
diese Kurse gestatten und eine unmittelbare Antwort auf die Registrierungsanforderung
vorsehen. Tabelle 5 gibt ein Beispiel einer strukturierten Nachricht,
die Links enthält,
die Seiten von dem Trainings-Webserver 120 unter der URL
www.training abrufen.
-
-
Bei diesem Beispiel identifiziert
der Bestimmungsort des Links die URL der Markup-Seite, die von dem Nachrichtenübermittlungssystem
aus dem Netz abzurufen ist. Ein Beispiel eines Szenarios könnte wie
folgt aussehen:
Diese Nachricht enthält Links, die durch einen Piepton
angezeigt werden. Um einem Link zu folgen, sagen sie 'go'."
"Dies ist Ihr monatliches Update für Trainingskurse.
Diese
Woche sind neue Kurse auf dem Gebiet der vereinheitlichten Nachrichtenübermittlung
verfügbar.
Sie
können
Information über
(Piep) neue Kurse erhalten"
(Das
Nachrichtenübermittlungssystem
pausiert kurz)
"oder
Information über
(Piep) existierende Kurse."
(Das
Nachrichtenübermittlungssystem
pausiert kurz)
"Sie
können
sich auch für
einen Kurs (Piep) registrieren."
(Das
Nachrichtenübermittlungssystem
pausiert kurz)
(Empfänger
sagt 'go')
-
An dieser Stelle ruft das Nachrichtenübermittlungssystem
die Seite (d. h. eine weitere Nachricht) von dem Webserver an der
URL ab, die in den Attributen des LINK-Elements, das der Nutzer
zur Aktivierung ausgewählt
hat, angegebenen ist, wobei in diesem Fall eine HTTP-Anforderung:
GET
/register.pm1
an den HTTP-Server an der URL www.training gesendet
wird (von der angenommen wird, dass sie im Besitz des Absenders
der ursprünglichen
Nachricht ist). Die Antwort auf diese Anforderung wird eine weitere
Seite sein. Tabelle 6 ist ein Beispiel einer derartigen Antwortseite,
die aus einer weiteren strukturierten Nachricht besteht. Tabelle
6
mit der folgenden Interaktion:
"Willkommen beim Kursregistrierungsdienst.
Bitte geben Sie jetzt Ihre Ausweisnummer ein."
(Das Nachrichtenübermittlungssystem
pausiert)
(Der Empfänger
gibt auf der Tastatur '0123456' ein)
"Bitte wählen Sie
eine Kurskategorie:
Für
Kurse über
vereinheitlichte Nachrichtenübermittlung
drücken
Sie 1;
Für
Widget Kurse drücken
Sie 2;
Für
Gadget Kurse drücken
Sie 3;
Um dieses Menü zu
verlassen, drücken
Sie das Raute-Zeichen.
(Empfänger drückt 1)
"Bitte wählen Sie
einen Kurs:
Für
Einführung
in vereinheitlichte Nachrichtenübermittlung
drücken
Sie 1;
Für
Fortgeschrittene vereinheitlichte Nachrichtenübermittlung drücken Sie
2;
Um zum vorhergehenden Menü zurückzukehren, drücken Sie
das Raute-Zeichen."
(Empfänger drückt 1)
"Sie haben Einführung in
vereinheitlichte Nachrichtenübermittlung
ausgewählt.
Drücken Sie
1, um fortzufahren, das Raute-Zeichen, um zu annulieren."
(Empfänger drückt #)
"Bitte wählen Sie
einen Kurs:
Für
Einführung
in vereinheitlichte Nachrichtenübermittlung
drücken
Sie 1;
Für
Fortgeschrittene vereinheitlichte Nachrichtenübermittlung drücken Sie
2;
Um zum vorhergehenden Menü zurückzukehren, drücken Sie
das Raute-Zeichen."
(Empfänger drückt 2)
"Sie haben Fortgeschrittene
vereinheitlichte Nachrichtenübermittlung
ausgewählt."
Drücken Sie
1, um fortzufahren, das Raute-Zeichen, um zu annulieren."
(Empfänger drückt 1)
-
An dieser Stelle reicht das Nachrichtenübermittlungssystem
ein weiteres Formular ein, indem es eine Anforderung
GET/register.cgi?sessionid=98765&badgenum=0123456& courseid=UM301
an
den Webserver an der URL www.training sendet. Diese zweite Formulareinreichung
könnte
zu einer weitergeführten
Sitzung führen
(z. B. die Möglichkeit,
sich für
einen anderen Kurs zu registrieren). Bei diesem Beispiel beendet
der entfernte Dienst jedoch die Sitzung mit einer Bestätigungsnachricht,
die in Tabelle 7 gezeigt ist und die ähnlich der Nachricht in Tabelle
1 ist, die zuvor erläutert
wurde.
-
-
Dies ergibt die folgende Präsentation
für den
Empfänger:
"Danke für die Registrierung.
Dies bestätigt,
dass Peter Mataga für
den Kurs UM301: Fortgeschrittene vereinheitlichte Nachrichtenübermittlung
registriert ist, der am 26. Januar 1999 von 15:00 bis 17:00 angesetzt
ist."
"Nachrichtenverarbeitung
abgeschlossen."
(Das
Nachrichtenübermittlungssystem
fährt dann
damit fort, dem Empfänger
die üblichen
Mailboxaktionen wie Löschen,
Nächste,
etc. anzubieten)
-
Der Vorteil des oben erläuterten
Mechanismus besteht darin, dass die ursprüngliche strukturierte Nachricht,
die eventuell eine Massenemail sein kann, die an viele Empfänger gesendet
wurde, klein ist. Wenn eine Teilmenge von Empfängern sich dafür entscheidet, zu
antworten, führt
das Nachrichtenübermittlungssystem 104 wieder
ein Gros der Verarbeitung durch, die mit dem Einholen von Informationen
verknüpft
ist.
-
Das Flussdiagramm in 7 veranschaulicht die Schritte, die mit
dem Senden einer strukturierten Nachricht an einen Empfänger verbunden
sind, wobei während
einer Interaktion des Empfängers
mit der strukturierten Nachricht Information, wie beispielsweise
eine zweite strukturierte Nachricht, von einem in der Nachricht
angegebenen Bestimmungsort abgerufen wird, um eine weitere Interaktion
zwischen dem Empfänger
und der Information zu ermöglichen,
die von diesem Bestimmungsort abgerufen wird. Die Schritte 701, 702 und 703 sind
identisch den Schritten 201, 202 beziehungsweise 203,
die oben in Verbindung mit dem Flussdiagramm der 2 beschrieben wurden und die um der Kürze willen
hier nicht wiederholt werden. Bei Schritt 704 interpretiert
das Nachrichtenübermittlungssystem
die Struktur der Nachricht aufgrund der eingebetteten Anweisungen
und spielt für
den Empfänger
eine Nachricht ab, die zumindest einen eingebetteten Zink zu einem
Bestimmungsort aufweist, an dem eine zweite strukturierte Nachricht
gespeichert ist. Während
des Abspielens der ersten Nachricht wird eine Eingabe von dem Empfänger angefordert,
einen bestimmten Link auszuwählen.
Bei Schritt 705 wählt
der Empfänger
einen Zink zu diesem Bestimmungsort. Bei Schritt 706 ruft
das Nachrichtenübermittlungssystem
die zweite strukturierte Nachricht von dem Linkbestimmungsort ab.
Bei Schritt 707 interpretiert das Nachrichtenübermittlungssystem
die Struktur der abgerufenen zweiten strukturierten Nachricht aufgrund
ihrer eingebetteten Anweisungen und spielt für den Empfänger die zweite Nachricht ab, die
an speziellen Stellen während
des Abspielens dieser Nachricht vom Empfänger Eingaben anfordern kann. Bei
Schritt 708 liefert der Empfänger dem Nachrichtenübermittlungssystem
die an jenen speziellen Stellen während des Abspielens der zweiten
Nachricht angeforderten Eingaben. Bei Schritt 709 leitet
das Nachrichtenübermittlungssystem
die während
des Abspielens der zweiten strukturierten Nachricht gesammelten
Informationen an einen in der zweiten Nachricht angegebenen Bestimmungsort.
Die Antwort darauf kann eine (nicht gezeigte) weitere strukturierte
Nachricht sein oder bei Schritt 710 die Fortsetzung der
Mailboxsitzung des Empfängers,
bei der der Empfänger
die ursprüngliche
Nachricht löschen
oder von neuem abspielen, eine weitere gespeicherte Nachricht abrufen
oder seine Mailboxsitzung beenden kann.
-
Die verschiedenen, oben beschriebenen
Arten von Substrukturen können
auf verschiedene Weise kombiniert werden. Beispielsweise kann eine
strukturierte Nachricht (oder eine Folge derartiger Nachrichten) koordinierte
Daten- und Telefonaktionen bewirken. In diesem Beispiel sammelt
das Nachrichtenübermittlungssystem 104 Eingaben
von dem Empfänger
am Telefonapparat 106, übermittelt
Daten zu einem Server und tätigt
dann einen Telefonanruf über
das PSTN bei einer Telefonnummer, die mit dem Bestimmungsort der
Daten verknüpft
ist. Bei Antwort auf den Anruf werden DTMF-Signale (oder ein anderes Signalisierungsverfahren) verwendet,
um ausreichende Informationen zu übertragen (z. B. eine Referenz-ID),
um es dem den Telefonanruf empfangenden System zu gestatten, auf
die Formulardaten zuzugreifen, die separat gesendet wurden. Das
empfangende System kann dann diese Daten dazu verwenden, die Handhabung
des Telefonanrufs auf verschiedene Weisen zu verbessern, wie beispielsweise
seine Weiterleitung zu einem geeigneten Berater und/oder das Bereitstellen
einer Bildschirmdarstellung der eingereichten Formulardaten und
der abgerufenen Daten auf dem Endgerät des Beraters. Alternativ
könnte
ein IP-Telefonanruf bei einer IP-Telefonnummer getätigt werden,
die mit dem Bestimmungsort der Daten verknüpft ist.
-
Als Beispiel wird angenommen, dass
der Registrierungsvorgang eine Interaktion mit einem menschlichen
Berater erfordert, es aber erwünscht
ist, Daten von dem Registrierenden automatisch anstatt durch Interaktion
von Mensch zu Mensch zu sammeln. Das Nachrichtenübermittlungssystem 104 kann
dazu verwendet werden, die Informationen zu sammeln, wodurch es
im Grunde Teil eines verteilten Callcenters wird. Diese Informationen
können
gesammelt werden, bevor irgendein Telefonanruf bei dem menschlichen
Registrierungsberater ausgeführt
wird, was eine erhebliche Reduktion der Belastung der Telefonleitungen
zu dem Callcenter der Registrierungsabteilung im Vergleich zu andererseits
einem herkömmlichen
Callcenter darstellt, das ein eigenes Sprachausgabesystem unterhalten
müsste.
-
Eine Art und Weise, um eine Koordination
zwischen der Formulareinreichung und dem Anruf zu erzielen, kann
an dem folgenden Beispiel demonstriert werden, wenn die Antwort
auf die Formulareinreichung mit der Kursregistrierungsinformation
keine einfache Bestätigungsnachricht
ist, sondern eine Antwort, die angibt, dass ein Anruf getätigt werden
sollte. Die Information für
den Anruf wird vorzugsweise eine Sitzungs-ID oder eine andere Identifikation
angeben, die das den Anruf empfangende System interpretiert, um
die zugehörigen Daten
abzurufen. Tabelle 8 veranschaulicht ein Beispiel einer Antwortseite
für die
Registrierung.
-
-
Dies weicht von dem vorhergehenden
Beispiel ab, bei dem nach der Registrierung nur die Bestätigungsnachricht
von Tabelle 7 für
den Empfänger
abgespielt wird. In diesem Fall setzt sich der Anruf wegen dem IMMEDIATE-Attribut des LINK
ohne die Initiierung durch den Empfänger fort. Daher ist die Interaktion
wie folgt
"Danke
für die
Registrierung. Dies bestätigt,
dass Peter Mataga für
den Kurs UM301: Fortgeschrittene vereinheitlichte Nachrichtenübermittlung
registriert ist, der am 26. Januar 1999 von 15:00 bis 17:00 angesetzt
ist."
"Es wird ein Anruf
bei einem Kundenberater unter der Telefonnummer 630-555-4444 getätigt. Drücken Sie
die Raute-Taste, um den Anruf abzubrechen."
(Das Nachrichtenübermittlungssystem
wählt 630-555-4444 [die Telefonnummer,
die mit dem Callcenter 125 des Registrierungssystems in 1 verknüpft ist), wartet auf Antwort,
sendet den DTMF-Ton 3, pausiert, sendet dann Ton 2, pausiert, sendet
dann 98765, schaltet den Sprachpostnutzer zu, wartet dann auf die
Anrufbeendigung)
(Die Sitzungs-ID 98765 wird von dem empfangenden
System verwendet, um den Anruf an einen geeigneten Berater am Telefon 126 weiterzuleiten
und eine Bildschirmdarstellung der abgegebenen Registrierungsinformation
auf dem Client-Endgerät 127 des
Beraters anzuzeigen.)
-
Beim obigen Mechanismus wird angenommen,
das der angerufene Dienst die spezielle Funktionalität aufweist,
die es ermöglicht,
dass die Interaktion stattfindet. Da der Diensteeigner wahrscheinlich
der Absender der Nachricht ist, wäre der Diensteeigner so konfiguriert.
Wie in vorhergehenden Beispielen wird die Vorbereitung der Registrierungsdaten
abgeschlossen, bevor der Telefonanruf hergestellt wird, wodurch
die Belastung des Callcenters reduziert wird.
-
Das Flussdiagramm in 8 veranschaulicht die Schritte, die mit
dem Senden einer strukturierten Nachricht an einen Empfänger verbunden
sind, wobei während
einer Interaktion des Empfängers
mit der strukturierten Nachricht Informationen von dem Empfänger gesammelt
und an einen angegebenen Bestimmungsort gesendet werden, und von
dem Nachrichtenübermittlungssystem
ein separater Anruf (Telefon über
PSTN, IP-Telefon über
ein Datennetz oder irgendeine andere Art von Anruf) zu einer Nummer
hergestellt wird, die mit dem angegebenen Bestimmungsort verknüpft ist.
Die Schritte 801, 802 und 803 sind identisch
den Schritten 201, 202 beziehungsweise 203,
die oben in Verbindung mit dem Flussdiagramm der 2 beschrieben wurden und werden um der
Kürze willen
hier nicht wiederholt. Bei Schritt 804 interpretiert das
Nachrichtenübermittlungssystem
die Struktur der Nachricht aufgrund der eingebetteten Anweisungen
und spielt die Nachricht für
den Empfänger
ab, wobei sie an verschiedenen Stellen während des Abspielens eine Eingabe
von dem Empfänger
anfordert. Bei Schritt 805 stellt der Empfänger an
den erforderlichen Stellen während
der Nachrichtenwiedergabe Audio- und/oder Tastatureingaben bereit.
Falls der Empfänger
eine Audioeingabe bereitstellt, konvertiert eine ASR-Schaltung in
dem Nachrichtenübermittlungssystem
bei Schritt 806 die Audioeingabe in geeignete Text- oder
Zahleninformation. Bei Schritt 807 sendet das Nachrichtenübermittlungssystem
die von dem Empfänger
eingeholte Information zu einem Bestimmungsort, der in der strukturierten
Nachricht angegeben ist. Bei Schritt 808 wird parallel
zur gleichen Zeit oder später,
nach dem Empfangen einer weiteren strukturierten Nachricht vom Bestimmungsort,
ein separater Anruf (wie beispielsweise ein Telefonanruf über das PSTN
oder ein IP-Telefonanruf über
das Datennetz). bei dem Bestimmungsort oder bei einem zweiten Bestimmungsort
ausgeführt,
von dem die eingeholten Informationen abgerufen werden können. Bei
Schritt 809 liefert das Nachrichtenübermittlungssystem Informationen
an den ersten oder zweiten Bestimmungsort, die auf gewisse Weise
die eingeholten Informationen identifizieren. Bei Schritt 810 interagiert
der Empfänger über den Anruf
mit einem Berater an dem ersten oder zweiten Bestimmungsort, dem die
eingeholte Information zur Verfügung
steht. Falls der Anruf an dem ersten oder zweiten Bestimmungsort
keinen Transfer des Empfängers
zu einem derartigen Bestimmungsort bewirkt hat, kann der Empfänger bei
Schritt 811 nach Beendigung des Anrufs seine Mailboxsitzung
fortsetzen.
-
Es wird nun Bezug auf 9 genommen, in der ein Blockdiagramm
eines integrierten Nachrichtenübermittlungssystems 104 gezeigt
ist. Das Nachrichtenübermittlungssystem 104 umfasst
Systemsoftware 901, die das Betriebssystem und die zugehörige Software
für Hardwareschnittstellen
bereitstellt, um die Kommunikation mit einzelnen Hardwarekomponenten
zu ermöglichen.
Die Systemsoftware führt
außerdem
die herkömmlichen
Nachrichtenübermittlungsfunktionen
aus, wie die Kontrolle des Empfangs von herkömmlichen Audionachrichten,
von herkömmlichen
Emailnachrichten und Nachrichten der strukturierten Art, wie sie
oben beschrieben sind, der Speicherung derartiger Nachrichten in
einer Nachrichtenspeicherdatenbank 902 für jeden Empfänger, des
Löschens
derartiger Nachrichten vom Speicher als Reaktion auf die Anweisung
eines Empfängers,
etc. Zusätzlich
der Systemsoftware 901 läuft ein Interpreter für strukturierte
Nachrichten (SMI) 903, der, wenn eine Nachricht der strukturierten
Art von einem Empfänger
aus dem Nachrichtenspeicher 902 abgerufen wird, die eingebetteten
Anweisungen (die Markup's
in der oben beschriebenen Ausführungsform)
interpretiert und das strukturierte Nachrichtendokument in eine
Audioausgabe zur Präsentation
für den
Empfänger konvertiert,
mit der der Empfänger
durch Audiomittel interagieren kann, wenn sie so strukturiert ist.
Der SMI 903 steuert außerdem
zu passenden Zeitpunkten, die in der strukturierten Nachricht definiert
sind, das Abspielen von Audiodateien, die mit der Nachricht verbunden
sind und die an die Nachricht angehängt sein können oder die von anderswo
abgerufen werden können.
Das Funktionieren der Systemsoftware 901 und des SMI 903 wird
durch eine zentrale Prozessoreinheit 904 und einen zugehörigen RAM/ROM-Speicher 905 beeinflusst.
In dem Nachrichtenübermittlungssystem 104 sind
auch verschiedene andere Module enthalten, die als Hardware, Software
und/oder eine Kombination aus Hardware und Software implementiert
sein können.
Außerdem
können
einige der Module eine Verarbeitung in der CPU 904 anstatt
in dem Modul selbst bewirken.
-
Ein erstes Netzschnittstellenmodul
ist die Datennetzschnittstelle (DNI) 906, an der das IP-Netz 105 endet.
Die DNI 906 empfängt
somit die Übersendung
einer strukturierten Nachricht, die von einem Absender über das
Netz gesendet wird und die sie dann zu dem Nachrichtenspeicher 902 zum
späteren
Abruf durch den vorgesehenen Empfänger weiterleitet. Wenn wie
oben beschrieben während
des Abrufs einer interaktiven Nachricht von einem Empfänger Information
gesammelt wird, gibt die DNI 906 außerdem diese Information zur Übertragung
an einen Bestimmungsort aus, der mit dem IP-Netz 105 verbunden
ist, falls dies so in der strukturierten Nachricht angegeben ist.
Ein zweites Netzschnittstellenmodul ist eine Telefonnetzschnittstelle
(TNI) 907, an der Telefonleitungen enden, wie beispielsweise
analoge Tip/Klingel-Schnittstellen oder T1-Digitalleitungen. Der
PSTN-Telefonanruf eines Empfängers
beim Nachrichtenübermittlungssystem 104 zum
Abrufen seiner Nachrichten endet somit an der TNI 907.
Die TNI 907 gibt somit auch die Wiedergabe einer abgerufenen strukturierten
Nachricht gemäß den in
der Nachricht eingebetteten Anweisungen aus, die durch den SMI 903 interpretiert
werden. Außerdem
werden die Tastatur- oder Audioeingaben, die von dem Empfänger während einer
Wiedergabe der Nachricht als Navigationsauswahl oder als Eingabe
erbetener Information eingegeben werden, durch die TNI 907 eingegeben.
Die TNI 907 und die DNI 906 sind beide mit einem
Systembus 908 verbunden, wie dies auch die anderen in 9 gezeigten Module sind:
das Audio-Wiedergabe/Aufzeichnungs(P/R)-Modul 909,
das Text-zu-Sprache(TTS)-Modul 910,
das automatische Spracherkennungs(ASR)-Modul 911 und das
Doppelton-Mehrfrequenz(DTMF)-Detektormodul 912.
-
Das Audio-P/R-Modul 909 beinhaltet
die Hardware und/oder Software zum Abspielen des aufgezeichneten
Audiomaterials, das als Datei gespeichert wurde und an eine Nachricht
angehängt
war. Diese Nachricht kann eine herkömmliche Emailnachricht mit
einer angehängten
.WAV-Datei oder
eine strukturierte Nachricht der oben erläuterten Art sein, wobei aufgezeichnete
Audionachrichtenelemente und Nachrichtenfragmente wie zuvor beschrieben
als Dateien an die strukturierte Nachricht angehängt sind oder von einer angegebenen Quelle
abgerufen werden. Das Audio-P/R-Modul 909 kann auch die
akustische Antworteingabe eines Empfängers in einer strukturierten
Eingabe konvertieren, die dann in eine Datei konvertiert werden
kann und über
die DNI 906 als angehängte
Datei zur Übertragung
zu einem angegebenen Bestimmungsort auf dem IP-Netz 105 ausgegeben
werden kann.
-
Das Text-zu-Sprache(TTS)-Modul 910,
das als Hardware, Software oder als Kombination aus Hardware und
Software implementiert werden kann, beinhaltet einen digitalen Signalprozessor,
der in dem Modul selbst oder auf der CPU 904 implementiert
sein kann. Das TTS-Modul 910 konvertiert die Textfragmente
in der strukturierten Nachricht während des Abspielens der Nachricht
für den
Empfänger
in Sprache. Das automatische Spracherkennungs(ASR)-Modul 911,
das ebenso als Hardware, Software oder als Kombination aus Hardware
und Software implementiert sein kann, überwacht die Audioeingabe des
Empfängers,
wobei es die Äußerungen
des Empfängers
erkennt. Diese Empfängereingaben
werden, abhängig
davon, wann sie während des
Abspielens der Nachricht empfangen werden, in Kommandos konvertiert
oder als Eingaben erkannt. Das Doppelton-Mehrfrequenz(DTMF)-Modul 912,
das ebenso als Hardware, Software oder als Kombination aus Hardware
und Software implementiert sein kann, erkennt die Tastatureingaben
des Empfängers.
Diese Tastatureingaben können
ebenso abhängig
von der Nachrichtenstruktur Kommandos oder Eingaben sein, wobei
der Empfänger
beispielsweise während
des Abspielens der Nachricht eine Tastatureingabe vornehmen kann,
um einen Link auszuwählen,
oder eine Tastatureingabe als eine Eingabe als Teil eines Informationssammelvorgangs
vornehmen kann.
-
Wie oben beschrieben, kann eine strukturierte
Nachricht von einem Absender durch einen Editor erzeugt werden,
der auf einem Client-Endgerät
läuft.
Ein Beispiel einer GUI 103 eines Editors, die von einem Absender
dazu verwendet werden kann, eine strukturierte Nachricht zu erzeugen,
ist in 10 gezeigt. Man erkennt,
dass die GUI 103 eine Vielzahl von vorbestimmten Textfragmenten
oder zuvor aufgezeichneten Audiofragmenten umfasst, die gespeichert
sind und auf die durch die Tasten T1–TN beziehungsweise A1–AN zugegriffen wird. Diese vorbestimmten Fragmente
stehen dem Absender zur Verfügung,
um eine Nachricht zu formulieren. Durch Aktivieren eines Audioaufzeichnungsgeräts durch
die Taste 1010 kann der Absender unter Verwendung eines
mit dem Client-Endgerät
verbundenen Mikrofons einen oder mehrere Audioclips aufzeichnen,
die in die Nachricht integriert und als Audiodateien an die Nachricht
angehängt
werden können.
Auf ähnliche
Weise kann der Absender durch Eingabe von Text über das Texteingabefenster 1011 Textfragmente
erzeugen, die als Teil der Nachricht einzugliedern sind und die,
wenn sie von dem Nachrichtenübermittlungssystem
empfangen und von dem Empfänger
abgerufen werden, von Text in Sprache konvertiert werden. Die strukturierte
Nachricht wird von dem Absender erzeugt, indem er aus diesen vorbestimmten
Textfragmenten, die unter T1–TN verfügbar
sind, aus den Audiofragmenten, die unter A1–AN verfügbar
sind, und aus kundenspezifisch eingegebenen Audiofragmenten und
Textfragmenten auswählt
und sie unter Verwendung der Maus in die Nachrichtenbox 1012 zieht,
um eine erwünschte
Nachrichtenstruktur zu erzeugen. Die ausgewählten Audiofragmente 1013, 1014 und 1015 werden
mit den ausgewählten
Textfragmenten 1016, 1017 und 1018 so
wie vom Absender beabsichtigt und in einem von dem Absender ausgewählten strukturierten
Format kombiniert. Durch Anwahl einer "Erzeuge Menü"-Taste 1019 erzeugt der Absender
eine Navigationsverschachtelung von Optionen, die dem endgültigen Empfänger einschließlich beispielsweise
dem Audiofragment 1013 und den Textfragmenten 1016 und 1017 präsentiert
werden. Nach Anwahl der "Erzeuge
Menü"-Taste 1019 kann der Absender
danach befragt werden, welche Aufforderungen dem Empfänger zu
präsentieren
sind, welche Titel mit jeder Auswahlmöglichkeit zu verbinden sind
und welche Nachrichtenelemente in das Menü zu integrieren sind. Die Nachricht
kann außerdem
Links 1020 und 1021 beinhalten, die von dem Absender
aus einer vorbestimmten Zahl aufgezeichneter und gespeicherter Links
L1–LP ausgewählt
oder vom Absender über
das Fenster 1025 eingegeben werden können. Wenn die Nachricht vom
Absender formuliert worden ist und ein Bestimmungsort in das Bestimmungsortfenster 1026 eingegeben
worden ist, wählt
der Absender die Sendetaste 1027 und der Editor erzeugt
eine PML-formatierte
Version der strukturierten Nachricht mit angehängten Datendarstellungen der
enthaltenen Audiodateien, die zum Empfänger an den angegebenen Bestimmungsort
gesendet wird
-
Die strukturierte Nachricht könnte auch "von Hand" mit einem Texteditor
und einer Audiodateiaufnahmeeinrichtung erzeugt werden.
-
Auch wenn die vorliegende Erfindung
hinsichtlich Audionachrichtenübermittlung
beschrieben wurde, versteht es sich für den Fachmann, dass die vorliegende
Erfindung ebenso bei der Multimedia-Nachrichtenübermittlung Anwendung finden
kann, bei der eine strukturierte Multimedianachricht eine Vielzahl
von Nachrichtenelementen enthalten würde, die Videofragmente umfassen
können,
die von dem Nachrichtenübermittlungssystem
gemäß den in
der strukturierten Nachricht enthaltenen eingebetteten Anweisungen
zusammengestellt werden. Eine strukturierte Multimedianachricht
könnte
daher einem Empfänger
die Navigationsoptionen bereitstellen, die oben in Verbindung mit
den Audionachrichten beschrieben wurden, wie auch die Fähigkeit
beinhalten, zu einem anderen Bestimmungsort zu verbinden, sowie
die anderen zuvor für
Audionachrichtenübermittlung
beschriebenen Aspekte der strukturierten Nachrichtenübermittlung.
-
Obschon die oben beschriebene Ausführungsform
eine Telefon-Markup-Sprache als Methode zum Einbetten von Anweisungen
beinhaltet, die die Struktur der Nachricht definieren und die von
dem Interpreter im Nachrichtenübermittlungssystem
dazu verwendet werden, die Nachricht abzuspielen und dem Empfänger Navigationswahlmöglichkeiten
anzubieten, gibt es andere Wege, auf die derartige Anweisungen in
die Nachricht eingebettet werden könnten, die keine Markup-Sprache
verwenden. So könnte
die Nachricht zum Beispiel unter Verwendung eines Elektronischen
Datenaustauschs (EDI) oder einer anderer Art eines zuvor abgestimmten
Austauschformats zwischen Absendern und dem Interpreter formuliert
werden, die auf dem Nachrichtenübermittlungssystem
laufen und die es dem Nachrichtenübermittlungssystem gestatten,
die Nachrichtenstruktur zu interpretieren und dem Empfänger die
strukturierte Nachricht diesen Anweisungen gemäß zu präsentieren.
-
Das Vorstehende veranschaulicht nur
die Prinzipien der Erfindung. Es versteht sich daher, dass Fachleute
verschiedene Anordnungen entwerfen können, die, auch wenn sie hier
nicht explizit beschrieben sind, die Erfindung verkörpern, wie
sie durch die Ansprüche
definiert sind. Außerdem
sollen alle Beispiele und alles als Bedingung Formulierte, das hier
zitiert wurde, ausdrücklich
nur zu pädagogischen
Zwecken dienen, um dem Leser das Verständnis der Prinzipien der Erfindung
und der Konzepte zu fördern,
die durch die Erfinder beigetragen wurden, um den Stand der Technik
zu fördern;
es soll nicht als Einschränkung
auf die speziellen zitierten Beispiele und Bedingungen verstanden
werden. Zudem sollen alle Aussagen hierin, die Prinzipien, Aspekte
oder Ausführungsformen
der Erfindung sowie spezielle Beispiele davon zitieren, sowohl bauliche
als auch funktionale Äquivalente
davon umfassen. Zusätzlich
sollen alle derartigen Äquivalente
sowohl derzeit bekannte als auch zukünftig entwickelte Äquivalente
umfassen, d. h. jegliche entwickelten Elemente, die unabhängig von
der Bauform die gleiche Funktion ausführen.
-
So versteht es sich für Fachleute,
dass die Blockdiagramme hier Konzeptansichten von veranschaulichenden
Schaltungen sind, die die Prinzipien der Erfindung verkörpern. Ähnlich versteht
es sich, dass jegliche Ablaufschaubilder, Flussdiagramme, jeglicher
Pseudokode und dergleichen verschiedene Prozesse repräsentieren,
die im Wesentlichen in einem computerlesbaren Medium dargestellt
sein können
und so von einem Computer oder Prozessor ausgeführt werden können, gleichgültig ob
nun ein solcher Computer oder Prozessor explizit gezeigt ist oder
nicht.
-
Die Funktionen der verschiedenen
in den FIG. gezeigten Elemente, einschließlich der mit "Prozessor" oder "Server" bezeichneten Blöcke, können durch
Verwendung dezidierter Hardware bereitgestellt werden, sowie von
Hardware, die in der Lage ist, Software auszuführen, in Verbindung mit geeigneter
Software. Wenn sie von einem Prozessor, Server oder Computer bereitgestellt
werden, können
die Funktionen von einem einzelnen dezidierten Prozessor, von einem
einzelnen gemeinsam benutzten Prozessor oder von einer Vielzahl
einzelner Prozessoren bereitgestellt werden, von denen einige gemeinsam
benutzt werden können.
Zudem sollte die explizite Verwendung des Begriffs "Prozessor", "Server" oder "Computer" nicht so verstanden
werden, dass ausschließlich
auf Hardware Bezug genommen wird, die in der Lage ist, Software
auszuführen;
die Verwendung kann implizit digitale Signalprozessor(DSP)- Hardware, Nur-Lese-Speicher
(ROM) zum Speichern von Software, Direktzugriffsspeicher (RAM) und
nichtflüchtige
Speicher umfassen, ohne hierauf beschränkt zu sein. Andere Hardware,
herkömmliche
und/oder kundenspezifische, kann ebenso beinhaltet sein.
-
In den Ansprüchen hiervon soll jedes Element,
das als ein Mittel zum Durchführen
einer speziellen Funktion bezeichnet ist, jede Art und Weise der
Durchführung
dieser Funktion umfassen, einschließlich beispielsweise a) eine
Kombination von Schaltungselementen, die diese Funktion durchführen oder
b) Software beliebiger Form, daher einschließlich Firmware, Mikrokode oder
dergleichen, kombiniert mit geeigneten Schaltungen zur Ausführung dieser
Software, um die Funktion durchzuführen. Die durch derartige Ansprüche definierte
Erfindung besteht darin, dass die von den verschiedenen erwähnten Mitteln
bereitgestellten Funktionalitäten
auf die von den Ansprüchen
erforderte Weise kombiniert und zusammengeführt werden. Die Anmelderin betrachtet
daher alle Mittel, die diese Funktionalitäten bereitstellen können, als äquivalent
zu den hierin vorgestellten.