Sprache zu Text, vollständig offline
Geheimtipp „Handy“: Freie, lokale Schnelldiktate statt Tastatureingaben
Die Mac-Anwendung Handy richtet sich an Nutzer, die Sprache direkt in Text umwandeln möchten, ohne dabei auf Cloud-Dienste angewiesen zu sein. Die Anwendung ist kostenlos, quelloffen und nicht nur für macOS sondern auch für Windows und Linux verfügbar.
Das Open-Source-Projekt bewirbt sich als einfache und datenschutzorientierte Alternative zu Apples werksseitig vorinstallierter Spracherkennung, die jedoch schnell und fehlerfreier arbeitet.
Lokale Transkription ohne Cloud-Anbindung
Im Alltag funktioniert Handy über eine frei wählbare Tastenkombination. Wird diese gedrückt, startet die Aufnahme über das Mikrofon. Nach dem Loslassen oder erneuten Drücken verarbeitet die Anwendung das Gesprochene und fügt den Text direkt in das aktuell aktive Eingabefeld ein. Eine separate Benutzeroberfläche ist dafür nicht erforderlich. Die gesamte Verarbeitung findet lokal auf dem Rechner statt. Audiodaten werden weder gespeichert noch an externe Server übertragen.
Zur technischen Umsetzung nutzt Handy eine Spracherkennung auf Basis von Whisper-Modellen, die je nach System auch mit GPU-Beschleunigung arbeiten können. Alternativ steht mit Parakeet V3 ein auf Apple-Prozessoren optimiertes Modell zur Verfügung, das automatisch die gesprochene Sprache erkennt. Eine integrierte Stimmerkennung filtert dabei Pausen und Hintergrundgeräusche heraus, um die Transkription zu vereinfachen.
Offenes Konzept mit Fokus auf Erweiterbarkeit
Die Entwickler verstehen Handy weniger als fertiges Produkt, sondern als Grundlage für eigene Anpassungen. Der offene Quellcode erlaubt es, Funktionen zu verändern, neue Modelle einzubinden oder das Verhalten der Anwendung an spezielle Anforderungen anzupassen. Damit richtet sich das Projekt auch an Entwickler und technisch interessierte Nutzer, die eigene Erweiterungen umsetzen oder zum Projekt beitragen möchten.
Nach der Installation müssen lediglich die notwendigen Systemrechte für Mikrofon und Bedienungshilfen vergeben werden. Anschließend lassen sich Tastenkürzel und Aufnahmemodi in den Einstellungen der App anpassen. Handy verzichtet bewusst auf Zusatzfunktionen und konzentriert sich auf die reine Spracherkennung. Der Ansatz folgt der Idee, ein einzelnes Werkzeug bereitzustellen, das zuverlässig Text aus Sprache erzeugt und dabei die Kontrolle über die eigenen Daten vollständig beim Nutzer belässt. Handy ist vollständig kostenlos und wartet hier auf euch.
Ähnlich aufgebaut, kostenpflichtig und dafür auch deutlich funktionsreicher ist MacWhisper.



Danke für den Tipp!
Läuft es in dieselbe Probleme wie MacWhisper? Ich finde die Diktierfunktion da sehr durchwachsen, manchmal kommt da großer Murks bei heraus.
Beispiel gefällig? Den nächsten Satz hatte ich auf Deutsch diktiert, aber MacWhisper hat daraus mal wieder eine englische Übersetzung gemacht ohne ersichtlichen Grund:
„The yellow squirrel scampered up the wall and nibbled a massive cherry from the marshmallow cake before catapulting the ball directly into the zoo. During the process, it emitted a triple ribbeting call and landed gracefully on the ice. „
:DDDDD
Ich kann da uneingeschränkt VoiceInk empfehlen. Fairer Einmalkauf, toller Entwickler der schnell reagiert und auf Wünsche eingeht. Man kann alles offline machen, aber kann auch alle erdenklichen Online Modelle einbinden und daraus ein sehr mächtiges Tool bauen, dass auch bei Programmen unterschiedlich reagiert. Das Tool hat bei mir weitestgehend die Tastatur ersetzt. Kann man glaube ich auch zwei Wochen for free testen.