Kostenlos und lokal
Dial8: Open-Source-Spracherkennung als Alternative zu Wispr Flow
Dial8 ist eine neue, quelloffene Spracherkennungssoftware für den Mac, mit deren Hilfe sich Spracheingaben direkt auf dem Computer in Text umwandeln lassen. Die Software setzt einen Mac mit Apple-Prozessor für die Nutzung voraus und versteht sich als kostenlose Alternative zu der Abo-Anwendung Wispr Flow.
Als zentralen Unterschied zu vielen anderen Spracherkennungsdiensten hebt der Entwickler die Möglichkeit zur Offline-Nutzung von Dial8 hervor. Das benötigte Sprachmodell wird auf den Mac heruntergeladen und die Umwandlung von Sprache in Text erfolgt vollständig lokal auf dem Gerät. Die Tatsache, dass keine Audioinhalte an externe Rechenzentren übermittelt werden, stellt einen eindeutigen Vorteil in Bezug auf Datenschutz und Sicherheit dar.
Dial8 findet seinen Platz in der Menüleiste des Mac und arbeitet nach seiner Einrichtung eigentlich komplett im Hintergrund. Die Spracherkennung lässt sich durch ein frei definierbares Tastenkürzel aktivieren und der Entwickler bietet hier zwei verschiedene Funktionsweisen an. Entweder wird die Eingabe vollständig zwischengespeichert und am Ende als vollständiger Textblock ausgegeben oder man aktiviert den sogenannten Stream-Modus, bei dem der Text quasi in Echtzeit und schrittweise in das aktuelle Dokument übernommen wird.
Textüberarbeitung kommt mit macOS 26
Die bereits in die App integrierte Funktion „AI Rewrite“ lässt sich zwar ebenfalls über die Einstellungen der App aktivieren, zeigt allerdings nur unter macOS 26 Wirkung. Hier hat man dann die Möglichkeit, den transkribierten Text direkt zu überarbeiten und mit Blick auf die Grammatik und Satzstrukturen verbessern zu lassen. Dabei hat man die Möglichkeit, zwischen zahlreichen verschiedenen Schreibstilen zu wählen, darunter auch spezielle Varianten, vom Stil eines Verschwörungstheoretikers bis hin zu Nachrichtensprechern oder Sportkommentatoren.
Die Basis hierfür schafft das in Verbindung mit den kommenden Betriebssystemen für Mac und iOS-Geräte von Apple für Entwickler bereitgestellte Foundation Models Framework. Dieses zentrale Sprachmodell lässt sich zur gemeinsamen Nutzung in alle Apps integrieren, sodass diese nicht auf separat geladene und speicherintensive Alternativen zugreifen müssen.
Alternative zur Alternative:
Mac Whisper ( Pro )
In der Pro Variante zwar nicht kostenlos, aber Lifetime für 59$
Sicher für den ein oder anderen auch nicht schlecht.
Würde mich tatsächlich ein intensiverer Test interessieren. Insb. wie es sich mit der Sprechererkennung verhält.
Hat die schon jemand ausprobiert? Ich seit 10 Minuten und ich bin schon richtig wütend.
Welchen Hotkey nehme ich denn, der nichts anderes behindert?
Ich will auch nicht die ganze Zeit gedrückt halten, der Standardvorschlag ist die Option-Taste, die brauche ich aber für viele andere Dinge, z. B. in Texten navigieren.
Wenn ich ausgefallenere Komibinationen nehme, dann kommt der Systemsound für „blöde Eingabe“ und die Transkription beginnt mit „*klicken*“ hahaha.
Hat jemand mehr Erfolg?