{"id":258151,"date":"2025-07-04T15:03:18","date_gmt":"2025-07-04T13:03:18","guid":{"rendered":"https:\/\/www.ifun.de\/?p=258151"},"modified":"2025-07-11T08:28:36","modified_gmt":"2025-07-11T06:28:36","slug":"apples-neue-spracherkennung-schnell-aber-weniger-praezise","status":"publish","type":"post","link":"https:\/\/www.ifun.de\/apples-neue-spracherkennung-schnell-aber-weniger-praezise-258151\/","title":{"rendered":"Apples neue Spracherkennung: Schnell, aber weniger pr\u00e4zise"},"content":{"rendered":"<p>Mit den Testversionen von macOS Tahoe, iOS 26 und iPadOS 26 hat Apple <a href=\"https:\/\/developer.apple.com\/documentation\/speech\">neue Programmierschnittstellen<\/a> zur Sprachtranskription eingef\u00fchrt, die im Vergleich zu bestehenden L\u00f6sungen wie dem Whisper-Modell von OpenAI deutlich schneller arbeiten sollen.<\/p>\n<p><a href=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/yap.gif\"><img decoding=\"async\" class=\"aligncenter size-full wp-image-258153\" src=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/yap.gif\" alt=\"Yap\" width=\"500\" \/><\/a><\/p>\n<h6><a href=\"https:\/\/github.com\/finnvoor\/yap\">Das Terminal-Tool &#8222;yap&#8220; kann Apples neue Spracherkennung bereits nutzen<\/a><\/h6>\n<h2>Whisper liefert zuverl\u00e4ssigere Ergebnisse<\/h2>\n<p>Die neuen Funktionen basieren auf einer \u00fcberarbeiteten Infrastruktur, in der nun Klassen wie \u201e<a href=\"https:\/\/developer.apple.com\/documentation\/speech\/speechanalyzer\">SpeechAnalyzer<\/a>\u201c und Module wie \u201e<a href=\"https:\/\/developer.apple.com\/documentation\/speech\/speechtranscriber\">SpeechTranscriber<\/a>\u201c zentrale Aufgaben \u00fcbernehmen. Entwicklern stehen damit zuk\u00fcnftig Werkzeuge zur Verf\u00fcgung, die auf den gleichen nativen Sprachframeworks basieren, die Apple auch f\u00fcr eigene Anwendungen wie Notizen, Sprachnachrichten oder die geplante Anruftranskription verwendet.<\/p>\n<p><a href=\"https:\/\/www.macstories.net\/stories\/hands-on-how-apples-new-speech-apis-outpace-whisper-for-lightning-fast-transcription\/\">In ersten Tests<\/a> zeigte sich die Effizienz der neuen Systeme besonders bei gr\u00f6\u00dferen Dateien. Ein 34-min\u00fctiges Video mit einer Gr\u00f6\u00dfe von 7 Gigabyte konnte mit Apples neuen Werkzeugen in nur 45 Sekunden verschriftlichen werden. Der Vergleich mit der Whisper-Integration in der Mac-Anwendung MacWhisper zeigt eine deutliche Differenz. Dort dauerte derselbe Vorgang 1 Minute und 41 Sekunden. Apple verarbeitet solche Aufgaben damit rund 55 Prozent schneller.<\/p>\n<p><a href=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink.png\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-258154\" src=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink-700x579.png\" alt=\"Voiceink\" width=\"700\" height=\"579\" srcset=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink-700x579.png 700w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink-500x413.png 500w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink-768x635.png 768w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink-1536x1270.png 1536w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/voiceink-2048x1694.png 2048w\" sizes=\"auto, (max-width: 700px) 100vw, 700px\" \/><\/a><\/p>\n<h2>Genauigkeit bleibt zentrale Schwachstelle<\/h2>\n<p>Trotz der hohen Geschwindigkeit liegt Apple bei der Texterkennung weiterhin hinter anderen L\u00f6sungen zur\u00fcck. Prakash Joshi Pax, Entwickler <a href=\"https:\/\/www.ifun.de\/textdiktate-am-mac-voiceink-bietet-lokale-transkription-250373\/\">der Mac-Applikation VoiceInk<\/a>, testete die neuen Apple-Werkzeuge in Kombination mit zwei Alternativen: dem Whisper-Modell &#8222;Large V3 Turbo&#8220; von OpenAI und &#8222;Scribe v1&#8220; von ElevenLabs. Die Grundlage des Vergleichs bildeten 15 englischsprachige Audiobeispiele mit einer Dauer zwischen 15 Sekunden und zwei Minuten.<\/p>\n<p>Die Ergebnisse der Wortfehlerrate (WER) sprechen <a href=\"https:\/\/prakashjoshipax.com\/apple-new-transcription-api-accuracy\/\">eine klare Sprache<\/a>. W\u00e4hrend ElevenLabs mit einer WER von 3,42\u202fProzent den pr\u00e4zisesten Text erzeugte, lag Whisper bei 3,95\u202fProzent. Apple kam auf einen Wert von 7,63\u202fProzent und verfehlte damit deutlich die Genauigkeit der beiden Mitbewerber.<\/p>\n<p><a href=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/fehlerraten.png\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-258152\" src=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/fehlerraten-700x237.png\" alt=\"Fehlerraten\" width=\"700\" height=\"237\" srcset=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/fehlerraten-700x237.png 700w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/fehlerraten-500x169.png 500w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/fehlerraten-768x260.png 768w, https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/fehlerraten.png 1424w\" sizes=\"auto, (max-width: 700px) 100vw, 700px\" \/><\/a><\/p>\n<p>Zwar war die Transkription nahezu in Echtzeit m\u00f6glich, doch bei der inhaltlichen Treffsicherheit zeigen sich noch Schw\u00e4chen.<\/p>\n<p>Apple setzt in iPadOS 26, iOS 26 und macOS Tahoe derzeit also vor allem auf eine maximal effiziente Verarbeitung. F\u00fcr Anwendungen, bei denen Geschwindigkeit entscheidend ist, kann dies von Vorteil sein. In Szenarien mit hohen Anspr\u00fcchen an die Textqualit\u00e4t d\u00fcrfte Whisper jedoch <a href=\"https:\/\/www.ifun.de\/macwhisper-12-automatische-sprechererkennung-jetzt-verfuegbar-250931\/\">weiterhin die bevorzugte L\u00f6sung<\/a> bleiben.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/vg06.met.vgwort.de\/na\/39fed1dddc11429ab980c550c7b4b633\" width=\"1\" height=\"1\"  no-lazy class=\"tracking\"><\/p>\n","protected":false},"excerpt":{"rendered":"<a href=\"https:\/\/www.ifun.de\/apples-neue-spracherkennung-schnell-aber-weniger-praezise-258151\/\"><img width=\"150\" height=\"150\" src=\"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/macos26-spracherkennung-150x150.jpg\" class=\"alignright tfe wp-post-image\" alt=\"Macos26 Spracherkennung\" decoding=\"async\" loading=\"lazy\" \/><\/a><p>Mit den Testversionen von macOS Tahoe, iOS 26 und iPadOS 26 hat Apple neue Programmierschnittstellen zur Sprachtranskription eingef\u00fchrt, die im Vergleich zu bestehenden L\u00f6sungen wie dem Whisper-Modell von OpenAI deutlich schneller arbeiten sollen. Das Terminal-Tool &#8222;yap&#8220; kann Apples neue Spracherkennung bereits nutzen Whisper liefert zuverl\u00e4ssigere Ergebnisse Die neuen Funktionen basieren auf einer \u00fcberarbeiteten Infrastruktur, in [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":258155,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[5,1783],"tags":[4738,6832,1079,5359],"class_list":["post-258151","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-apps","category-feature","tag-entwickler","tag-macos-tahoe","tag-spracherkennung","tag-transkription"],"acf":[],"aioseo_notices":[],"featured_image":["https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/macos26-spracherkennung.jpg"],"subheadline":["Genauigkeit bleibt zentrale Schwachstelle"],"rest_api_enabler":{"featured_image":"https:\/\/images.ifun.de\/wp-content\/uploads\/2025\/07\/macos26-spracherkennung.jpg","subheadline":"Genauigkeit bleibt zentrale Schwachstelle"},"_links":{"self":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts\/258151","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/comments?post=258151"}],"version-history":[{"count":4,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts\/258151\/revisions"}],"predecessor-version":[{"id":258163,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/posts\/258151\/revisions\/258163"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/media\/258155"}],"wp:attachment":[{"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/media?parent=258151"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/categories?post=258151"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.ifun.de\/apiv2\/wp\/v2\/tags?post=258151"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}