ifun.de — Apple News seit 2001. 34 300 Artikel

Mit 21 Sprachen führend

Bericht: So lernt Siri neue Sprachen

29 Kommentare 29

Die Nachrichtenagentur Reuters hat mit Apples Alex Acero gesprochen und sich erklären lassen, wie Apple seiner Sprachassistentin Siri neue Sprachen beibringt.

Sirigif

Anlass ist der Ausbau des Siri-Repertoires, der aktuell um „Shanghainese“ erweitert wird. Ein chinesischer Dialekt, der rund um die 15 Millionen Einwohner starke Industriestadt Shanghai gesprochen wird.

Wertet man diesen als eigenständige Sprache – Apple macht dies bekanntermaßen auch mit Kölsch – dann versteht sich Apples Sprachassistentin demnächst auf 22 unterschiedliche Sprachen und fürht das Feld der Assistenz-Systeme damit deutlich an.

Aktuell kann Siri mit 21 Sprachen umgehen, die für den Einsatz in 36 Ländern angepasst wurden. Microsofts Cortana versteht sich hingegen nur auf 13 Länder, Googles Assistant spricht vier Sprachen und Amazons Alexa kennt nur Deutsch und Englisch.

Doch trotz der polyglotten Grundausstattung, dies schreibt Reuters unter Verweis auf einen Experten, habe Siri seinen Vorsprung vergeudet. Apples Assistentin versteht zwar viele Wörter, hat aber oft Probleme mit ganzen Sätzen, der Auswertung von Fragen und dem Liefern passender Antworten.

Dennoch ist der Reuters-Artikel lesenswert, werden doch hier erstmals die Schritte beschrieben, die es braucht, um Siri auf die Unterstützung neuer Sprachen vorzubereiten. Ein Auszug:

[…] Wenn Apple damit anfängt an einer neuen Sprache zu arbeiten, setzt das Unternehmen zuerst auf Menschen. Diese lesen in unterschiedlichen Akzenten und Dialekten Texte vor, die dann von Hand transkribiert werden, so dass der Computer eine genaue Darstellung des gesprochenen Textes hat, so Alex Acero , Leiter der Sprachen-Abteilung bei Apple. Apple sichert zudem auch eine Reihe von Tönen in einer Vielzahl von Stimmen. Auf dieser Basis wird ein Sprachmodell gebaut, das versucht Wortsequenzen vorherzusagen.

Anschließend rollt Apple dann seinen „Diktiermodus“ aus, einen Text-to-Speech-Übersetzer in der neuen Sprache. Wenn Kunden den Diktiermodus verwenden, erfasst Apple einen kleinen Prozentsatz der Audioaufnahmen und anonymisiert diese. Die Aufnahmen werden dann, komplett mit Stör- und Hintergrundgeräuschen, erneut von Menschen transkribiert. Ein Prozess, der dabei hilft, die Fehlerrate der Spracherkennung zu halbieren. […]

Dieser Artikel enthält Affiliate-Links. Wer darüber einkauft unterstützt uns mit einem Teil des unveränderten Kaufpreises. Was ist das?
09. Mrz 2017 um 17:40 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    29 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
    Abonnieren
    Benachrichtige mich bei
    29 Comments
    Älteste Kommentare
    Neuste Kommentare Meiste Stimmen
    Inline Feedbacks
    View all comments
    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 34300 Artikel in den vergangenen 7606 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2022 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven