KONVERSATIONS-KI UND SPRACHERKENNUNG

Beide Begriffe gehören zu den aktuellsten Tech-Begriffen, die man auf LinkedIn und Twitter entdecken kann. Vielleicht haben Sie auch schon unsere Blogposts über Diktieren und Spracherkennung gelesen. Lassen Sie uns in die Tiefe gehen und verstehen, was diese Begriffe im Zusammenhang mit dem Arbeitsplatz bedeuten, denn diese Technologien sind die Zukunft des Arbeitsplatzes. In diesem Blogpost zeigen wir, was diese beiden Begriffe bedeuten, wie die Kombination von beiden aussieht und wie sie sich auf den Arbeitsablauf in einem Büro auswirken könnte.
Was ist Konversations-KI?
IBM oder ADA CX erklären künstliche Intelligenz für Konversationen einfach als Kombination von natürlicher Sprachverarbeitung (Englisch: Natural Language Processing oder NLP) mit Software wie etwa virtuellen Agenten und Sprachassistenten, mit denen Benutzer sprechen können. Die Verarbeitung natürlicher Sprache (NLP) ist ein Zweig der Informatik, der sich damit beschäftigt, Computern die Fähigkeit zu verleihen, Texte und gesprochene Worte wie Menschen zu Verstehen – inklusive dem Verstehen von Bedeutungen über den wörtlichen Satz hinaus. Denken Sie an Ihren Sprachassistenten zu Hause, wenn Sie zum Beispiel eine Folgefrage stellen: Kannst du mir mehr sagen? Oder: Warum ist das so? Er weiß, dass Sie eine Folgefrage stellen wollen, und nimmt den Satz nicht einfach als solchen.
Ein weiteres wichtiges Merkmal der KI ist die Komponente des maschinellen Lernens. Durch interagieren mit der künstlichen Intelligenz und wiederholte Interaktionen lernt der Computer mehr über das Kommunikationsverhalten. Man kann sich das so vorstellen, wie ein Kind zu kommunizieren lernt und schließlich als Erwachsener kommunizieren kann, nachdem es jahrelang mit Menschen aus unterschiedlichsten Herkünften gesprochen hat.
Was ist Spracherkennung?
Da Konversations-KI ebenfalls eine gesprochene Komponente hat, kann sie nur dann gut sein, wenn der Computer unsere Sprache verstehen kann. Spracherkennung, wie sie IBM definiert, ist ein Programm, welches menschliche Sprache in ein schriftliches Format umwandelt. Nicht selten wird die Stimmerkennung mit der Spracherkennung verwechselt. Von Stimmerkennung spricht man, wenn der Computer zwischen den Stimmen der einzelnen Personen unterscheiden kann, um Verwechslungen auszuschließen.
Spracherkennung kommt zum Beispiel auch bei VoIP-Anrufen zum Einsatz, wenn die KI die Sprachnachrichten eines Anrufers in Text umwandeln kann oder wenn man in Google Translate diktiert, um nach der Erkennung eine Übersetzung in eine andere Sprache zu erhalten. Je mehr wir mit unseren Maschinen interagieren, desto besser können sie uns verstehen und unsere Arbeit erleichtern.
Wie geschaffen für das Büro
Diese beiden Technologien gibt es zwar schon seit einiger Zeit, aber inwieweit können sie die tägliche Arbeit in einer Büroumgebung unterstützen? Die Spracherkennung ist in bestimmten Berufen bereits weit verbreitet und wird durch den Einsatz von Smartphones und integrierten Sprache-zu-Text-Funktionen immer häufiger eingesetzt. Ihre größte Einschränkung besteht jedoch, wenn mehr als eine Person spricht und sie den Kontext nicht verstehen kann. Genau hier kommt die Konversations-KI ins Spiel.
Durch eine Aufnahmetechnologie mit künstlicher Intelligenz, können verschiedene Sprecher erkannt werden und deren Gesprochenes zugeordnet und in Text umgewandelt werden. In Kombination mit NLP könnte die Software dann z. B. nach einer Besprechung die bestmögliche Vorgehensweise vorschlagen oder zumindest die Satzteile ergänzen, die nicht ausdrücklich genannt wurden, Aufgaben herausfiltern oder sogar Stimmungen der Sprecher erfassen.
Wir befinden uns erst am Anfang der Zusammenführung vieler Technologien, die heute noch separat existieren. Schritt für Schritt gehen wir voran, um den Büroalltag vom Tippen weg in Richtung Sprechen zu bringen.
Speech Processing Solutions investiert in die Entwicklung modernster Sprachtechnologien, die neue Arbeitsweisen ermöglichen. Welche Kombination von Technologien sehen Sie als Treiber für das moderne Büro? Verraten Sie es uns in den Kommentaren!
Pingback: HÄUFIGE MYTHEN RUND UM LEGAL TECH – WIR RÄUMEN AUF! | Speech Blog