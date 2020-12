Die auf annoying.technology ausgesprochene Warnung will unverzüglich weitergegeben werden. Ist die hier notierte Eigenart von macOS Big Sur doch in der Lage unbemerkten Schaden in der eigenen Dokumentensammlung anzurichten, der häufig erst dann auffällt, wenn es schon zu spät ist.

Eingescannter und markierter Text.

Manuel Grabowski hat einen unsichtbaren Fehler des auch unter macOS Big Sur vorinstallierten Dokumenten-Betrachters „Vorschau“ dokumentiert. Die Apple-Anwendung kann ORC-Layer in PDF-Dokumenten unwiederbringlich zerstören, wenn diese für eine einfache Manipulationen in den Dateien genutzt wird – etwa das Entfernen einer leeren Seite.

PDF-Dokumente mit OCR-Layer

Manuel beschreibt den reproduzierbaren Fehler Schritt für Schritt: Der Anfang ist immer gleich und soweit recht unspektakulär. Ein neues Dokument wird mit dem beliebten ScanSnap-Dokumentenscanner iX500 eingelesen, die Texterkennung wird dann anschließend von der populären Mac-Software ABBYY FineReader übernommen. Bis hier hin tauchen keine Probleme auf.

Vor dem Einsatz von Vorschau.app…

Öffnet man das so generierte PDF nun jedoch in Vorschau.app, entfernt eine leere Seite aus dem eingescannten Dokument und schließt das PDF wieder, sind alle von der Texterkennung erfassten Abschnitte verloren beziehungsweise wurden durch unlesbaren Buchstaben-Salat ersetzt.

Fehler erst beim Schließen der Dokumente

Interessant ist hier: Der erkannte Text geht nicht schon nach dem Editieren und Speichern des offenen Dokumentes verloren, sondern erst wenn die Datei einmal komplett geschlossen wurde.

Zwar muss angemerkt werden, dass ABBYY FineReader das aktuelle Big Sur-Betriebssystem offiziell noch nicht unterstützt, dass dieser Umstand Apples Vorschau-Anwendung keinen Freibrief geben sollte, mit FineReader erstellte PDF-Dokumente heimlich zu editieren, versteht sich jedoch von allein.

…und danach.

Vergleichbare Fehlerserie schon 2016

Wer jetzt ein Déjà vu hat, muss sich nicht entschuldigen. Bereits 2016 entfernten Bugs in macOS El Capitan und macOS Sierra den OCR-Text-Layer aus eingescannten Dokumenten.