Die kostenfreie, für macOS entwickelte OCR-Anwendung TRex ist in Version 1.9 erschienen und bietet nun eine deutlich erweiterte Spracherkennung an. Möglich macht dies die Integration der freien Texterkennungsbibliothek Tesseract, die mehr als 100 Sprachen unterstützt.

Zuvor war die Anwendung ausschließlich auf Apples Vision-Framework angewiesen, das zuletzt lediglich 26 Sprachen unterstützte. Dazu zählten unter anderem Deutsch, Englisch, Französisch, Spanisch und vereinfachtes Chinesisch.

Mit Tesseract lassen sich nun auch komplexere Schriftsysteme wie Arabisch, Hebräisch oder Thailändisch verarbeiten. Die benötigten Sprachpakete können direkt in der App nachgeladen werden. Das OCR-Ergebnis wird systemweit als bearbeitbarer Text verfügbar gemacht und kann beispielsweise in Notizen oder E-Mails eingefügt werden.

Automatische Engine-Auswahl

TRex kombiniert die beiden OCR-Engines und entscheidet abhängig von der gewählten Sprache automatisch, ob Apple Vision oder Tesseract zum Einsatz kommt. Nutzer müssen diese Auswahl nicht manuell vornehmen. Auch bei der Kompatibilität mit neueren Systemversionen wurde nachgebessert. Die App unterstützt weiterhin Intel- und Apple-Prozessoren ab macOS 13.5 und ist nun auch an die jüngsten Versionen von macOS angepasst.

Ergänzt wurde außerdem ein automatisches Update-System auf Basis von Sparkle. Damit kann die App neue Versionen selbstständig erkennen und auf Wunsch direkt installieren. Wer frühzeitig neue Funktionen testen möchte, kann über die Einstellungen auch auf einen Beta-Kanal wechseln.

TRex wird als quelloffenes Projekt von Alex Mazanov entwickelt und über die Plattform GitHub bereitgestellt. Die Anwendung eignet sich vor allem für Nutzer, die regelmäßig Inhalte aus gescannten Dokumenten, Screenshots oder Fotos extrahieren und in Textform weiterverwenden möchten. Wer das Projekt finanziell unterstützen möchte, kann die Applikation optional auch für 9 Euro über den Mac App Store beziehen.