Zum Hauptinhalt springen

Vom XML-Topic zur Sprachausgabe – Wie Sie CCMS-Inhalte für Chatbots nutzen

Lara Krägel 5 Min.


In unserem Blogbeitrag "Ein Klick und alles ist drin – Chatbots automatisiert befüllen dank Prozessoptimierung" haben wir Ihnen gezeigt, wie Sie Dokumentationsinhalte automatisiert für eine Chatbot-Ausgabe verwenden. Damit das reibungslos funktioniert und Ihre Kunden die vom Chatbot vermittelten Informationen auch verstehen, müssen die Inhalte gewisse Voraussetzungen und Anforderungen erfüllen. Wir erklären Ihnen, wie Sie Ihre Inhalte für die Verwendung im Sprachassistenten fit machen.
Damit die Informationen regelbasiert von einer Maschine, dem Sprachassistenten, behandelt sowie vom Hörer gut rezipiert und verstanden werden können, muss den Daten eine gewisse Informationsarchitektur zugrunde liegen. Diese gibt vor, welche Art von Informationen wie strukturiert, klassifiziert und formuliert wird. Genauer gesagt, sprechen wir hier von der XML-Struktur einzelner Topics, von der Auszeichnung der Topics anhand von Metadaten sowie von Formulierungsregeln, die für eine Chatbot-konforme Ausgabe sorgen.

Informationen regelbasiert strukturieren

Der Sprachassistent muss bestmöglich als weiteres Ausgabemedium, neben z. B. PDF oder HTML, in die bestehende Content Strategy bzw. das Informationsportfolio eines Unternehmens eingebunden werden. Dazu müssen Sie eine Informationsarchitektur entwickeln und überarbeiten, die Regeln zur Strukturierung der Inhalte festlegt. Viele Unternehmen folgen bei der Content-Verwaltung bereits einer solchen Informationsarchitektur.

Durch die Einbindung dieses innovativen Ausgabeformats kann es jedoch sein, dass Anpassungen oder Verfeinerungen der Architektur notwendig werden. Versuchen Sie, die Inhalte und deren Klassifizierung weitestgehend nach der bereits bestehenden Architektur zu behandeln, um den entsprechenden Änderungsaufwand so gering wie möglich zu halten. Manche Änderungen, Erweiterungen oder auch Anpassungen lassen sich jedoch nicht vermeiden.

Auf bewährten Standards aufbauen

Für die Konzeption eines Informationsmodells empfiehlt sich, auf einen Standard zurückzugreifen, den Sie auf die unternehmensspezifischen Bedürfnisse anpassen. Methodisch bieten sich zum Beispiel die Funktionsdesign-Methode, das Information Mapping oder die Klassenkonzepttechnik an.

Besonders das Topic-orientierte Schreiben nach Klassenkonzepttechnik ist hilfreich für die Verwendung der Inhalte für Sprachassistenten. Es setzt voraus, dass ein Topic, also eine Informationseinheit oder auch ein Modul im CCMS, genau eine Frage beantwortet – nicht mehr und nicht weniger. Der Sprachassistent analysiert die Intention der Nutzeranfrage und sucht nach der passenden Antwort auf die gestellte Frage. Wenn mehrere Module existieren, die die Nutzerfrage beantworten, so kommt der Sprachassistent bei Abfrage nicht zu einem eindeutigen Ergebnis und kann somit die Nutzerfrage womöglich gar nicht oder nicht zufriedenstellend beantworten. Gleiches gilt, wenn mehrere Fragen in einem Modul beantwortet werden: Hierbei werden zu viele Informationen ausgegeben und zwar teilweise solche, nach der die Nutzer gar nicht fragen.

Für die innere Strukturierung verschiedener Topic-Klassen, also Informationsarten, bieten sich ebenfalls Standards an. Diese Standards geben vor, welche XML-Elemente an welchen Stellen verwendet und wie ineinander verschachtelt werden dürfen. Ein gängiger Standard ist die Darwin Information Typing Architecture, kurz DITA. Die meisten Redaktionssysteme geben aber auch ein gewisses Informationsmodell vor, das als Basis dienen kann.

Informationen anhand von Metadaten auffinden

Über Metadaten, mit denen die Inhalte versehen werden, kann die Technologie des Sprachassistenten die richtigen Inhalte finden, zuordnen und somit die Inhalte als Antwort auf Fragen vorlesen. Der Sprachassistent analysiert die Nutzerfrage und leitet daraus Merkmale ab. Die Merkmale definieren die Frage eindeutig und ordnen sie dem hinterlegten Content zu. Diese Merkmale finden sich am Content in Form von Metadaten wieder.

Jedes Unternehmen hat sein eigenes, ganz spezifisches Metadatenmodell. Die meisten basieren jedoch auf etablierten Standards wie PI oder iiRDS. Eine gute Grundvoraussetzung ist, wenn der Content anhand eines Metadatenmodells ausgezeichnet ist, das auf einem dieser Standards basiert. Damit die Inhalte vom Sprachassistenten gefunden und ausgegeben werden können, sind zwei weitere Aspekte hinsichtlich des Metadatenmodells zu berücksichtigen. Diese können das bestehende Modell erweitern:

Inhalte eineindeutig klassifizieren

Der wichtigste Aspekt bei der Klassifizierung von Inhalten mittels Metadaten bzw. bei Entwicklung oder Anpassung des Konzepts ist, dass die Inhalte eineindeutig auffindbar sind. Im System dürfen keine Module existieren, die exakt gleich klassifiziert werden. Das führt dazu, dass eine Nutzerfrage existiert, die vom Sprachassistenten so interpretiert wird, dass er darauf zwei potenzielle Antworten findet. Das wiederum ruft eine falsche oder unzufriedenstellende oder gar keine Beantwortung der Frage herbei.
Nach dem PI- oder iiRDS-Basismodell kann dieser Fall, je nach Produkt- und Informationslandschaft, eintreten. Dann müssen Metadaten ergänzt werden, die das Topic weiter eingrenzen und eineindeutig identifizieren.

Metadatenwert für das Ausgabeformat

Um ein angemessenes Variantenmanagement zu betreiben, muss es einen Metadatenwert für das Metadatum Ausgabeformat oder ein ähnliches Metadatum geben. Das ermöglicht, Inhalte gezielt für Sprachassistenten auszugeben sowie andere Inhalte rauszufiltern und den Content für das Ausgabemedium Chatbot einzuschränken.

Informationen fürs Hören formulieren

Die Einhaltung der allgemein geltenden Regeln für Texte der Technischen Dokumentation ist auch für Sprachassistenten sinnvoll. Regeln wie "Schachtelsätze vermeiden" oder "Modalverben vermeiden", "Konsistent formulieren", "Einheitliche Terminologie verwenden" usw. sorgen für gut erfassbare und verständliche Texte. Eine umfangreiche Zusammenstellung solcher Regeln bietet unter anderem die Leitlinie "Regelbasiertes Schreiben – Deutsch für die Technische Kommunikation".

Um mit einem Sprachassistenten Inhalte rezipientengerecht ausgeben zu können, müssen die Texte fürs Hören optimiert formuliert werden. Somit müssen bereits bestehende Inhalte für das Rezipieren durch Hören statt durch Lesen aufbereitet werden und neue Inhalte dementsprechend erstellt werden.

Die meisten der Formulierungsregeln für Sprachassistenten lassen sich einfach mit den üblichen Schreibregeln der Technischen Redaktion vereinbaren, z. B. der Verbalstil oder die direkte Anrede. Eine der wichtigsten Regeln der Technischen Redaktion ist die sprachliche Konsistenz. Diese lässt sich insofern einhalten, als dass die Formulierungsregeln für sprachassistentengerechte Texte direkt mit in den Redaktionsleitfaden fließen.

Ressourcen, Kosten und Nutzen abwägen

Angenommen, Ihr Unternehmen hat bereits einen Redaktionsleitfaden, der die Informationsausgabe mit Sprachassistenten und die oben genannten Schreibregeln noch nicht inkludiert oder ihnen sogar widerspricht. Ihre Daten sind aber bereits anhand dieses Leitfadens erstellt.

Dann müssen Sie genau abwägen, ob ein entsprechender Aufwand vertretbar ist. Wenn es sich um kleine Datenmengen handelt, so können Sie den Redaktionsleitfaden entsprechend anpassen und die Inhalte einheitlich umformulieren. Ab sofort werden dann neue Inhalte nach den neuen Regeln formuliert. Sind es jedoch riesige Datenmengen, von denen nur wenige per Sprachassistent ausgegeben werden können, so können Sie stattdessen ein Variantenmanagement erwägen. Das heißt, nur die betroffenen Inhalte werden als neue Variante angelegt und sprachassistentenkonform formuliert. Jedoch widerspricht das dem Single-Sourcing-Prinzip und auch der generellen konsistenten Formulierung.

Abhilfe schaffen durch automatisches Rephrasing

Eine weitere Möglichkeit ist die automatisierte Transformation der Formulierungen. Denkbar ist hierfür ein Programm, welches grammatische Strukturen erkennt, analysiert und umbaut und so beispielsweise einen imperativischen Infinitiv: "Den Stecker einstecken." in einen Aufforderungssatz mit direkter Anrede: "Stecken Sie den Stecker ein." umformt. Jedoch ist die Entwicklung eines solchen Programms ebenfalls mit viel Erstaufwand verbunden und muss zudem, im Hinblick auf Mehrsprachigkeit, für jede Sprache eigens entwickelt werden.

Daten aufbereiten – lohnt sich das?

Die Entscheidung, welche dieser Lösungsansätze umgesetzt wird, ist eine wirtschaftliche. Sie müssen stets analysieren und abwägen, ob der Nutzen dem Aufwand gerecht wird und ob genügend Ressourcen für eine entsprechende Neuorientierung verfügbar sind. Dazu gehört auch, verschiedene Ausgabemedien zu priorisieren und dementsprechend den sprachlichen Fokus zu setzen.

Wenn Sie sich beispielsweise dafür entscheiden, Ihre Informationen hauptsächlich per Sprachausgabe zu vermitteln, so müssen Sie mehr Aufwand in die saubere Datenaufbereitung für Vermittlung per Sprache stecken. Liegt der Hauptfokus jedoch auf gedruckter Dokumentation, so hat dieses Format höchste Priorität und die Sprachausgabe wird zweit- oder drittrangig. In diesem Fall ist auch eine Vernachlässigung der Umformulierung akzeptabel. Wenn Sie die Umformulierung vernachlässigen, können auch automatisiert erzeugte Alternativen helfen, die ungeeigneten Formulierungen abzuschwächen.

Fragen Sie sich, was in Ihrem Fall ratsam und welcher Aufwand nötig ist, um Ihre Daten für einen Chatbot zu nutzen? Dann kontaktieren Sie uns gern und wir analysieren gemeinsam Ihren Kontext.

Referenzen

Gesellschaft Für Technische Kommunikation - Tekom Deutschland e.V. (2013): "Regelbasiertes Schreiben : Deutsch für die Technische Kommunikation". 2., erweiterte Auflage. Stuttgart : tekom.