Die Unterschiede in der Spracherkennungssoftware

Sie fragen sich, welche Art von Spracherkennungssoftware für Sie am besten geeignet ist? Was als Einstiegssoftware und was als professionelle Software betrachtet wird? Wie funktioniert das alles? In diesem Blog Post werden die Spracherkennungsoptionen dargestellt, die mit den unterschiedlichen Philips Sprache-zu-Text-Produkten und -Lösungen kompatibel sind.


Vielleicht sind sie ein Student, ein Journalist oder Sie müssen gelegentlich Notizen machen, die dann in ein schriftliches Dokument übertragen werden müssen. Haben Sie genug vom Tippen? Der Philips Digital VoiceTracer (DVT) mit Spracherkennungssoftware ist das richtige Gerät für den Einstieg.

Spracherkennung für Einsteiger

Die Philips Digital VoiceTracer Spracherkennungssoftware (DVT2805) funktioniert ausschließlich mit der Philips Digital VoiceTracer Audiorecorder-Serie. Sie ist im Bundle mit dem DVT2810 und dem neuen DVT1115 enthalten oder kann auch separat als Zusatz zu allen anderen Philips-Digital- VoiceTracer-Modellen erworben werden. Die Software wird durch die Nuance Dragon Spracherkennung unterstützt und wandelt Ihre Aufnahmen automatisch in ein Textdokument um. Schließen Sie Ihr DVT einfach über USB an Ihren PC an und laden Sie Ihre Audioaufnahmen in die Software hoch. Durch Spracherkennung wird ein Notizdokument erstellt, und der transkribierte Text kann dann zur Bearbeitung und Formatierung in ein Word-Dokument oder ein anderes Programm übertragen werden.

Allerdings ist zu beachten, dass diese Art von Backend-Spracherkennung für Einsteiger (d. h. die Software erledigt die Aufgabe im Hintergrund) möglicherweise nicht die höchste Spracherkennungsgenauigkeit erbringen kann. Denn es gibt viele Faktoren, die Einfluss darauf haben, wie gut eine Maschine das Gesprochene erkennen kann, z. B. wie weit die Stimme von der Aufnahme entfernt ist oder ob Hintergrundgeräusche im Spiel sind. Außerdem funktioniert die Spracherkennung nur dann optimal, wenn es nur einen einzigen Sprecher in einer Audioaufnahme zu hören ist.


Sie diktieren und erstellen regelmäßig Dokumente? Haben Sie viel mit vertraulichen Informationen zu tun oder schicken Sie Ihre Aufzeichnungen an einen Assistenten zur Transkription? Oder wollen Sie Gesprochenes automatisch in Text umwandeln? Dann ist eine professionelle Software genau das Richtige für Sie.

Professionelle Spracherkennung

Es gibt viele Möglichkeiten zur professionellen Spracherkennung, aber in Zeiten von Remote-Arbeitsplätzen und sich schnell ändernden Anforderungen suchen die meisten Menschen, die häufig und genau dokumentieren müssen, nach einfachen, flexiblen und jederzeit einsatzfähigen Sprache-zu-Text-Lösungen.

Philips SpeechLive ist eine cloudbasierte Diktier- und Transkriptionslösung auf Abobasis, die es den Usern ermöglicht, sowohl am Arbeitsplatz als auch unterwegs Sprache in Text umzuwandeln. Es bietet zwei Eingabemöglichkeiten, die auf Sprache basieren – Diktat und Spracherkennung. Sie können also entscheiden, ob Sie ein klassisches Diktat erstellen möchten, sodass Sie nur eine Audiodatei haben, oder die Spracherkennung nutzen möchten, die das Gesprochene in Echtzeit transkribiert. Am Ende erhalten Sie in beiden Fällen eine Audiodatei. Der Unterschied ist, dass Sie bei der Spracherkennung sofort Zugriff auf eine Transkription haben.

Die Diktate können mit Ihrem Smartphone über eine App oder ein professionelles Diktiergerät aufgenommen werden. Die Aufnahmen werden dann sicher von der App gesendet oder vom Aufnahmegerät in SpeechLive hochgeladen und an die Transkriptionsoption Ihrer Wahl gesendet.

Die erste Eingabemöglichkeit ist das Diktieren. Hierbei haben Sie die Möglichkeit, zwischen drei Optionen zu wählen. Sie können Ihr Diktat mit Spracherkennung im Hintergrund transkribieren lassen und erhalten auf diese Weise auch eine schriftliche Version Ihres Diktats. Sie können Ihr Diktat auch an einen Mitarbeiter oder eine Schreibkraft in Ihrem Büro schicken, die es sich anhören und niederschreiben können.  Oder Sie entscheiden sich für die externe Transkription, wobei Sie das Diktat an einen professionellen Transkriptionsdienst senden und es als Text zurückbekommen.

Die zweite Möglichkeit ist die Spracherkennung. Hier überspringen Sie die oben genannten Schritte, da Ihre Stimme von der Software in Echtzeit transkribiert wird und sofort als fertiges Transkript zur Verfügung steht. Daher ist dieser Prozess besonders schnell und intuitiv.

SpeechLive eignet sich perfekt für den professionellen Einsatz, da es Autoren- und Transkriptionsrollen ermöglicht, die Verschlüsselung von Sprachdateien für maximale Sicherheit gewährleistet und über Zapier mit anderen Workflow-Apps integriert werden kann. Die Software deckt viele Anwendungsbereiche ab – egal ob groß oder klein – und Sie können sich jederzeit wieder abmelden. Am besten gleich ausprobieren!

Zsuzsanna Hegedüs
Zsuzsanna Hegedüs

Zsuzsanna Hegedüs studierte Internationale Kommunikation und Entwicklung in London und hat mehrjährige Erfahrung in Marketing mit Schwerpunkt Social Media Marketing & Kommunikation. Verantwortlich für den DACH- und internationalen Raum als Marketing Manager bei Philips Speech, dem globalen Marktführer für professionelle Sprache-zu-Text Lösungen aus Wien.

Leave a Reply