ifun.de — Apple News seit 2001. 31 671 Artikel

Vorschau entfernt OCR-Layer

macOS Big Sur zerstört Texte in PDF-Dokumenten

77 Kommentare 77

Die auf annoying.technology ausgesprochene Warnung will unverzüglich weitergegeben werden. Ist die hier notierte Eigenart von macOS Big Sur doch in der Lage unbemerkten Schaden in der eigenen Dokumentensammlung anzurichten, der häufig erst dann auffällt, wenn es schon zu spät ist.

Eingescannt

Eingescannter und markierter Text.

Manuel Grabowski hat einen unsichtbaren Fehler des auch unter macOS Big Sur vorinstallierten Dokumenten-Betrachters „Vorschau“ dokumentiert. Die Apple-Anwendung kann ORC-Layer in PDF-Dokumenten unwiederbringlich zerstören, wenn diese für eine einfache Manipulationen in den Dateien genutzt wird – etwa das Entfernen einer leeren Seite.

PDF-Dokumente mit OCR-Layer

Manuel beschreibt den reproduzierbaren Fehler Schritt für Schritt: Der Anfang ist immer gleich und soweit recht unspektakulär. Ein neues Dokument wird mit dem beliebten ScanSnap-Dokumentenscanner iX500 eingelesen, die Texterkennung wird dann anschließend von der populären Mac-Software ABBYY FineReader übernommen. Bis hier hin tauchen keine Probleme auf.

Ocr Vorher

Vor dem Einsatz von Vorschau.app…

Öffnet man das so generierte PDF nun jedoch in Vorschau.app, entfernt eine leere Seite aus dem eingescannten Dokument und schließt das PDF wieder, sind alle von der Texterkennung erfassten Abschnitte verloren beziehungsweise wurden durch unlesbaren Buchstaben-Salat ersetzt.

Fehler erst beim Schließen der Dokumente

Interessant ist hier: Der erkannte Text geht nicht schon nach dem Editieren und Speichern des offenen Dokumentes verloren, sondern erst wenn die Datei einmal komplett geschlossen wurde.

Zwar muss angemerkt werden, dass ABBYY FineReader das aktuelle Big Sur-Betriebssystem offiziell noch nicht unterstützt, dass dieser Umstand Apples Vorschau-Anwendung keinen Freibrief geben sollte, mit FineReader erstellte PDF-Dokumente heimlich zu editieren, versteht sich jedoch von allein.

Ocr Nachher

…und danach.

Vergleichbare Fehlerserie schon 2016

Wer jetzt ein Déjà vu hat, muss sich nicht entschuldigen. Bereits 2016 entfernten Bugs in macOS El Capitan und macOS Sierra den OCR-Text-Layer aus eingescannten Dokumenten.

Dieser Artikel enthält Affiliate-Links. Wer darüber einkauft unterstützt uns mit einem Teil des unveränderten Kaufpreises. Was ist das?
18. Dez 2020 um 10:41 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    77 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
    Abonnieren
    Benachrichtige mich bei
    77 Comments
    Älteste Kommentare
    Neuste Kommentare Meiste Stimmen
    Inline Feedbacks
    View all comments
    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 31671 Artikel in den vergangenen 7342 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2021 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven