Sprachsoftware: Ein Überblick

„Hallo Google, wo sind meine Schlüssel?“, „Siri, wo ist die nächste Tankstelle?“ oder „Alexa, mach die Musik an!“ – wer kennt sie nicht? Unsere digitalen Alltagshelferlein, die sich langsam aber sicher immer mehr (in vielen Haushalten) etablieren. Die auf Sprachsoftware aufgebauten persönliche Assistenten erledigen durch eine Sprachanweisung Dinge auf unserer häufig endlos langen To-do-Liste. Damit erleichtern sie uns einen großen Teil unseres Lebens und haben für (fast) jedes Problem eine Lösung, so scheint es. Ein Überblick zur Sprachsoftware!

Sprachsoftware: Unsere neuen, persönlichen Assistenten für jeden Tag 

 Kleiner Überblick gefällig? Hier beginnt die Welt der Sprachsoftware.

Sprachsoftware im Überblick (c)istockphoto.com/Karneg

Unsere Welt wird immer digitaler. Das zeigt sich beispielsweise auch durch die Nutzung von Sprachsoftware. Hier folgt ein Überblick, was es für Anbieter gibt, welche Produkte diese stellen und wie diese in der Anwendung funktionieren. Zu den bekannten Unternehmen gehören Apple (Siri), Amazon (Echo/ Alexa), Google (z. B. Google Home) oder Microsoft (Cortana) – diese sind schon weitestgehend in unserem Alltag integriert. Neu hinzugekommen sind Lyrebird und Adobe VoCo. Ob informieren, helfen oder bestellen – viele der genannten Geräte können das und regeln somit schon jetzt einen großen Teil unseres Alltags.

Siri, Alexa und Co. – ein Überblick

Hier werden nun zwei unterschiedliche Typen der Sprachsoftwares vorgestellt. Zum einen gibt es Softwares, die vor Funktionen nur so strotzen und einem persönlichen Assistenten ähneln. Zum anderen gibt es Sprachsoftwares, mit denen man künstliche Stimmaufnahmen erstellen kann, die vom Nutzer selbst nur minimale Informationen zu Ton und Aussprache enthalten.

Typ 1: Persönliche Assistenten 

Typ 1 der Sprachsoftware im Überblick: Der persönliche Assistent.

Die Sprachsoftware, mein persönlicher Assistent (c)istockphoto.com/Daisy-Daisy

Sie beantworten Fragen, führen Kommandos aus und funktionieren allein über Sprache – verbunden mit Internet (WLAN) oder Bluetooth natürlich. Bestimmte Aktivierungsaufforderungen reichen, schon stehen sie zu Diensten. Durch integrierte Lautsprecher und Mikrofone entgeht ihnen auch so gut wie nichts.

  • Da gibt es beispielsweise Alexa oder auch Amazon Echo genannt: Ein persönlicher Assistent, der mit verschiedenen externen Kooperationspartnern vernetzt werden kann. Zudem kann er auch Autos ab-/aufschließen, Lichter an-/ausmachen oder auch Bestellungen aufnehmen beziehungsweise abschicken und vieles mehr.
  • Auch Google Assistant kann auf Inhalt und Zusammenhang vergangener Fragen zugreifen und weiterführende Fragen beantworten. Google Home als persönlicher Assistent enthält Funktionen des Google Assistant und fällt in die Kategorie Smart-Home-Lautsprecher, der ähnlich wie Alexa alles aus dem Umfeld aufnimmt – vorausgesetzt, er wird aktiviert.
  • Cortana ist eine Software von Microsoft. Sie ist für Windows (Computer) und andere Systeme verfügbar und empfängt, erkennt und verarbeitet Sprachbefehle.
  • Zu guter Letzt gibt es Siri, den persönlichen Sprachassistent von Apple. Allseits bekannt, wird natürlich auch dieses Produkt immer weiterentwickelt.

Typ 2: Audio-Editors 

  • Seit diesem Jahr ist eine öffentlich nutzbare Testversion der Sprachsoftware Lyrebird auf dem Markt. Lyrebird ist noch relativ neu unter den Sprachsoftware-Programmen. Das kanadische Startup mit gleichem Namen kann in kürzester Zeit synthetische Stimmen basteln, die den wirklichen Stimmen erschreckend ähnlich ist. Wie? Zu Beginn übermittelt man dem Programm Daten im Sinne von Stimmaufnahmen. Diese werden dann verarbeitet und in eine technische Stimme umgewandelt.
  • Adobe VoCo funktioniert ähnlich wie Lyrebird. Mit der Software kann Sprache aufgezeichnet und im Nachhinein innerhalb eines Textfelds bearbeitet beziehungsweise verändert werden (Audio Editor).
Typ 2 der Sprachsoftware im Überblick: Die Audio Editors.

Sprachsoftware wird ein Teil unseres Lebens werden (c)istockphoto.com/metamorworks

Sprachsoftware: Ein Produkt der Zukunft? 

Was ist ihr Nutzen auf lange Sicht? Die Geräte weisen eine Menge Vorteile auf – wie kurz im Überblick angerissen – wenn es aber um Themen wie Datenschutz, Lizenzen oder Rechte generell geht, sind die aktuellen Programme der Artikel noch sehr schwammig: Bei vielen Geräten werden die Sprachbefehle und Botschaften (teilweise) gespeichert – und durch die Mikrofone viel mehr aufgenommen, als einem vielleicht lieb ist. Halten wir also fest: Es steht noch eine spannende Entwicklung der Sprachsoftware bevor, die in positive wie auch negative Richtungen gehen kann.

Kommentieren

Kommentar hinzufügen