ifun.de — Apple News seit 2001. 39 178 Artikel

Vorschau entfernt OCR-Layer

macOS Big Sur zerstört Texte in PDF-Dokumenten

Artikel auf Mastodon teilen.
77 Kommentare 77

Die auf annoying.technology ausgesprochene Warnung will unverzüglich weitergegeben werden. Ist die hier notierte Eigenart von macOS Big Sur doch in der Lage unbemerkten Schaden in der eigenen Dokumentensammlung anzurichten, der häufig erst dann auffällt, wenn es schon zu spät ist.

Eingescannt

Eingescannter und markierter Text.

Manuel Grabowski hat einen unsichtbaren Fehler des auch unter macOS Big Sur vorinstallierten Dokumenten-Betrachters „Vorschau“ dokumentiert. Die Apple-Anwendung kann ORC-Layer in PDF-Dokumenten unwiederbringlich zerstören, wenn diese für eine einfache Manipulationen in den Dateien genutzt wird – etwa das Entfernen einer leeren Seite.

PDF-Dokumente mit OCR-Layer

Manuel beschreibt den reproduzierbaren Fehler Schritt für Schritt: Der Anfang ist immer gleich und soweit recht unspektakulär. Ein neues Dokument wird mit dem beliebten ScanSnap-Dokumentenscanner iX500 eingelesen, die Texterkennung wird dann anschließend von der populären Mac-Software ABBYY FineReader übernommen. Bis hier hin tauchen keine Probleme auf.

Ocr Vorher

Vor dem Einsatz von Vorschau.app…

Öffnet man das so generierte PDF nun jedoch in Vorschau.app, entfernt eine leere Seite aus dem eingescannten Dokument und schließt das PDF wieder, sind alle von der Texterkennung erfassten Abschnitte verloren beziehungsweise wurden durch unlesbaren Buchstaben-Salat ersetzt.

Fehler erst beim Schließen der Dokumente

Interessant ist hier: Der erkannte Text geht nicht schon nach dem Editieren und Speichern des offenen Dokumentes verloren, sondern erst wenn die Datei einmal komplett geschlossen wurde.

Zwar muss angemerkt werden, dass ABBYY FineReader das aktuelle Big Sur-Betriebssystem offiziell noch nicht unterstützt, dass dieser Umstand Apples Vorschau-Anwendung keinen Freibrief geben sollte, mit FineReader erstellte PDF-Dokumente heimlich zu editieren, versteht sich jedoch von allein.

Ocr Nachher

…und danach.

Vergleichbare Fehlerserie schon 2016

Wer jetzt ein Déjà vu hat, muss sich nicht entschuldigen. Bereits 2016 entfernten Bugs in macOS El Capitan und macOS Sierra den OCR-Text-Layer aus eingescannten Dokumenten.

Dieser Artikel enthält Affiliate-Links. Wer darüber einkauft unterstützt uns mit einem Teil des unveränderten Kaufpreises. Was ist das?
18. Dez 2020 um 10:41 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    77 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Vorschau hat früher perfekt funktioniert. Irgendwann hat Apple das Programm neu geschrieben und seitdem ist es kac*e.
    Ich hatte mir gefreut, dass Vorschau in Big Sur endlich nicht mehr automatisch zur ersten Seite eines Dokuments springt nachdem eine Seite aus dem PDF herausgelöscht wird, dass dabei jedoch das ganze OCR Layer zerschossen wird hätte ich nicht erwartet – auch wenn es mich nicht so richtig überrascht.

  • So langsam schäme ich mich für Apple. Es ist einfach nur peinlich was von der Softwareschmiede abgeliefert wird.

      • Er hat doch das Recht offensichtliche Fehler und Unzulänglichkeiten anzuprangern.

        Catalina war ewig lang eine Dauerbaustelle, zum Schluss gerade mal ok.
        Jetzt ist Big Sur die Baustelle…

        Seit Mojave (eins der stabilsten Systeme ever) leider trauriger Apple Alltag.

      • Wieso? Ich nutze Big Sur ja nicht. Darf man sich nicht mal mehr fremdschämend ohne alles wegzuwerfen? Oder schmeißt du auch deinen VW weg, weil er falsch beworben falsche Abgaswerte ausspuckt?
        Wieso kommen eigentlich immer so beschränkte Kommentare wie „wechsle doch“, „geh doch zu Android (nicht Netto)“?!

      • Weil HelgeHelge nicht mit Kritik umgehen kann. So kommt es zumindest bei mir an. Absolutistische Denkweise…

      • Vermisse die Zeiten von Mavericks wo einfach mal alles funktioniert hat. Und man nicht hinter jedem Türchen eine neue Überraschung hatte.

      • Naja wir wissen aus welchem Lager HelgeHelge, KatroX & Co kommen. Ich kann dem nur beipflichten. Letztens habe ich in Catalina versucht eine Pdf aus Bildschirmfotos zu erzeugen. Ich weiss nicht wieviele Anläufe ich brauchte aber ich war am Ende ziemlich desillusioniert da es nicht wie gewohnt vor Jahren /Monate funktionierte (weiß nicht wann ich es zuletzt nutzte). Erst musste man dran denken alle in Vorschau geöffneten Bilder zu markieren (obwohl die schon gruppiert in Vorschau offen waren). Dann klappte wieder was anderes nicht. Dann klappte es aber die Vorschau hat trotzdem nur die erste Seite angezeigt, während auf dem iPad dann doch alle Seiten angezeigt wurde. Aber das Drama nahm seinen Anfang schon auf dem iPad, wo ich die Screenshots erstellte im Safari. Nach jedem 5.-10. Screenshot stürzte das iPad ab (Ladekreis -> Sperrbildschirm). Als ich es dann geschafft hatte ging der Albtraum mit der Airdrop Übertragung weiter, erst nicht gefunden, dann doch, dann hat er mittendrin abgebrochen, also hab ich dann immer max 5 Screenshots übertragen. Was ein Ritt. War gefühlt mal besser bei Apple. Mit Homekit ärgere ich mich nun auch schon seit Wochen täglich. Bereits alles neu aufgesetzt ohne merkliche Besserung. Jetzt steige ich Stück für Stück auf Raspi um, bin noch am Vergleichen zwischen iObroker, Homebridge, FHEM usw. Hat da jemand Erfahrungen?

      • Kevin: Wieso kommen eigentlich immer so beschränkte Kommentare#
        Ach deiner scheint besser zu sein ? Klasse ! Dann schäme dich halt weiter. :P

      • @o.k. Ja KaroX ist mit auch schon sehr häufig mit ihrem/seinem extrem einseitigen Tunnelblick aufgefallen. Vielleicht arbeitet diese Person aber auch direkt für Apple und hat den Job als verdeckte Pressesprecher*in unsinnige Ansichten zu verbreiten. „You’re holding it wrong“ ;)

    • Was hier wieder abgeht…
      Kritik ist ja wohl berechtigt- soviel ist klar…solche Sätze wie: “ jetzt schäme ich mich für Apple“ oder „fremdschämen“ etc. Kann ich aber irgendwie nicht so ganz nachvollziehen…es ist ja nicht so als ob man mit solchen Fehlern ein Verbrechen an der Menschlichkeit vorgenommen hat…es ist entgegen halt wirklich ein bekanntes Problem das Apple scheinbar häufig Entwickler rotieren lässt, diese scheinbar keine Übergabe bekommen und eine Dokumentation entsprechend nicht besteht (Stichwort: Coding-guideline) ebenfalls scheint ein Code-Review nur oberflächlich vorgenommen zu werden. Man kann Fehler nie zu 100% vermeiden… ich finde es aber erstaunlich, dass es solche Fehler echt immer in finale Versionen schaffen…
      Apple, Microsoft, android hin oder her…

    • Du täuscht dich aber einfach nur selber. Als jemand der schon sehr lange in der Apple Welt lebt und arbeitet, kann ich dir sagen das es früher auch schon mehr als genug Fehler gab. Damals waren sie nur nicht so verbreitet, was viele Gründe hatte. Unter anderem kein so großes digitale Aufmerksamkeit,da keine so große Massen Kunde.
      Schau dich doch mal um. Wir leben nun mal in einer Welt die nicht perfekt ist und in der es Fehler gibt. Von großen Unternehmen bis zum kleinen Kevin machen wir alle Fehler.

  • Big Sur ist ein Griff ins Klo. Sieht total kacke aus, die Oberfläche ist kaum mehr zu bedienen und bringt viele Fehler mit. Big Sur ist das Windows 8 von Apple.

  • Zum Glück konnte ich es aufgrund von Platzmangel noch nicht installieren. Trotz über 30GB freiem Platz meckert der Installer das zu wenig Platz vorhanden wäre. Anscheinend muss ich mit der Installation noch warten.

    • Das war ein Witz, ganz ehrlich. Als ich BigSur installieren wollte, war es unfassbar kompliziert. Ich hab ein einfache MacBook Air 2019 mit 128GB SSD. BigSur war geladen, aber angeblich fehlten 34GB zur Installation. Mehr als 60GB waren aber frei. Also habe ich auch System Apps gelöscht, bis wirklich nichts mehr gelöscht werden konnte. Immer wieder die Anzeige, es wäre noch nicht genug Speicher frei. Am Ende habe ich tatsächlich um 1-2GB gekämpft, lächerlich. Das Gerät wird kaum benutzt und hatte keine Daten weiter drauf, ich habe sogar Videos und Fotos aus der sch… iCloud gelöscht. Irgend wann ging es. Am nächsten Tag melde ich mich an, etwas passiert, MacBook startet neu und macht einen Bootloop. Sobald ich mich anmelde, Neustart. Wahnsinn… wirklich eine Woche um… ha, dank eines weiteren Gerätes, auf dem ich im Netz nachlesen konnte, wie man die Fehler behebt.. nur um mich mit MacOS rumzuärgern. Als letztes dann mit so etwas simplen wie dem erstellen von schnellzugriffen auf Websites wie Netflix und Co, weil es ja keine Apps gibt. Man sowas ist doch wirklich Basis bei einem OS. Und immer wieder Schnellzugriffe, also Tastenkombies notwendig… Leute ich bin neu mit MacOS unterwegs… woher soll man die verdammt noch mal kennen? Sicher verbessern sie das Workflow, erschweren aber massiv den Umstieg oder Einstieg.

    • Bitte bitte bitte, tue uns allen einen Gefallen und installiere das erst, wenn nach Big Sur das nächste Betriebssystem von Apple released wird!! BITTE BITTE BITTE

  • Das ist ja wirklich übelst. Für den professionellen Rechtsverkehr muss man derzeit von Apple leider abraten.

  • Das Problem, das alte längst gelöste Fehler in neuen Systemen wieder auftauschen, kenne ich jetzt seit vielen Jahren.

    Ich vermute, es liegt daran, daß die Entwicklung des jeweils nächsten Systems viel zu früh geforkt wird. Und dann nicht alle Korrekturen in den neuen Fork übernommen werden. Apple sollte am besten erst nach einem Jahr Bug-Fixes Den Datenstand als Grundlage für das nächste System benutzen. Dann gäbe es halt nur noch alle 2 Jahre ein neues System.

  • Big Sur hat noch sehr viele andere Fehler… ich finde es manchmal schon peinlich, wenn ein Multi-Milliarden Dollar Unternehmen es einfach nicht gebacken kriegt fehlerfreie Software zu releasen.

    • Manchmal habe ich den Eindruck, dass genau weil es MMD-Konzerne sind vieles falsch läuft. Die Ziele, die gaaaanz oben nach unten durchgedrückt werden, sind nicht selten komplett am Leben vorbei und eines der Ziele heißt oft auch „Ameisen abbauen“. Sprich Fachleute raus, „Manager“ rein.
      Vermutlich lesen alle die gleichen amerikanischen Management-Ratgeber.
      Gruselig

  • Auch diverse Bestellungen können nur noch mit viel Glück abgeschickt werden. (Seit letztem Update)

  • Dann muss man wieder zu Adobe wechseln, wenn Vorschau hier so versagt. Oder gibt es noch andere Alternativen?

  • Jedes Jahr auf’s Neue upgraden die Leute auf gleich bei Release auf die neuste macOS Version und jedes Jahr geht das Geheule los. Ja, ich weiß, dass nach der offiziellen Beta-Phase jedes Jahr gesagt wird, dass es diesmal anders sei und dass es dieses macOS vieeeeeeeel stabiler läuft als der Vorgänger. Aber die Realität sieht dann doch ganz anders aus.

    Es sollte doch mittlerweile bekannt sein, dass Apple’s SW-Qualität stark nachgelassen hat und sie es einfach nicht mehr hinkriegen, ein stabiles und halbwegs fehlerfreies OS zu releasen. Man hat also 2 Möglichkeiten:

    Entweder man installiert es sofort und spielt (unfreiwillig) Beta-Tester für Apple und lebt mit den Bugs und der suboptimalen Performance oder man wartet bis Version .4 mit dem Upgrade. Früher hat noch Version .2 gereicht, aber das war einmal.

    • Stell dir mal vor was passieren würde, wenn alle vernünftigerweise mit dem Update auf .4 warten. Dann gäb’s die Bugs auch für Späteinsteiger, da sie vorher niemand findet ;-)

      • Ich stelle mir vor:
        Wenn alle warten, dann gäbe es keine .4 Version, da keine Fehler gemeldet werden und alles gut ist.
        Dann werden alle kein Upgrade machen.
        Dann wären die Meisten zufrieden.
        Vorstellungsende hier :)

      • Das ist doch längst der Fall / Vergangenheit. Bin bei Catalina zur .5 eingestiegen und hatte jede Menge massiver Bugs. Catalina 10.15.7 im drittem Sub-Release steckt immer noch voller ärgerlicher Bugs, die einen bei der täglichen Arbeit stark behindern.

  • An dieser Stelle ein ernstgemeintes „Dankeschön“ an alle, die sich Big Sur geladen haben und als Tester benutzen. Ich stand ebenfalls gaaaaaaaaanz kurz davor mir das Update zu installieren aber dann kamen die Worte „Never change a Running system ( too early)“ in meine Ohren. Vielleicht irgendwann Mitte nächstens Jahres. Bis dahin sollte alles klappen.

    • Schließe mich dem Dankeschön an. Warte ebenfalls bis Version 11.4.

    • Schon bemerkt, dass diese Ansicht längst überholt ist?

      So hat man bei den Versionen von macOS Catalina auch schon gedacht. Die Fehler wurden allerdings nie behoben. Da nutzt das Abwarten leider überhaupt nichts!

      • Manchmal muss man (wenn es technisch möglich ist*) ein gesamtes OS einfach auslassen.
        So z.B. bei Catalina.

        Mojave läuft rund und stabil und bleibt vorerst auf allen meinen Macs!

        *MBP 16″ kam leider mit Catalina und ein downgrade war nicht möglich

    • Hätt ich auch gern. Aber die Catalina-Bugs (war nach wie vor auf Mojave, hab mit nem neuen Mac aber zwangsweise ein nicht downgradbares Catalina verpasst bekommen) waren für mich so schlimm, dass es unter Big Sur nicht schlimmer kommen konnte und ich das Update auf iener meiner Maschinen gewagt habe. Es wurde zumindest nicht noch schlimmer…
      Gemessen an Catalina ist Big Sur definitiv ne Verbesserung. Gemessen an Mojave sind wir da noch gewaltig von nem rund laufenden System weg.

  • Bei mir funktioniert die Nummerierung der Seiten nicht mehr.

    Beispiel: Ein PDF hat 2 Seiten und ich ziehe 3 Seiten aus einem anderen PDF in das vorhandene PDF. Abschließend speichere ich das vorhandene PDF.

    Was macht Vorschau?

    Seite 1 Seite 2 Seite 1 Seite 2 Seite 3

    Es werden also beim Speichern die Seitenzahlen nicht aktualisiert. Allerdings hat das früher sehr wohl funktioniert.

    Erst nach Schließen und Öffnen des PDF ist es richtig:

    Seite 1 Seite 2 Seite 3 Seite 4 Seite 5

    Ist das nicht mehr als peinlich, wenn dieser Fehler nicht auffällt bzw. behoben wird? Unfassbar inkompetent …

    • Bei mir ist es andersrum. Ich bin froh, dass nach dem neuen Öffnen die Nummerierung jetzt stimmt. Zeitweise hat es diese im Dokument falsch gespeichert, sodass auch Adobe es falsch angezeigt hat.

    • Sag mal, dass du Schließen und Öffnen musst, das soll der Fehler sein?

      • Genau. Bereitet dir offensichtlich größere Probleme das zu verstehen. Wie geschrieben wurden in früheren Versionen die Seitenzahlen beim Speichern aktualisiert, ohne dass man Schließen und Öffnen muss. Ziemlich sinnlos, oder? Wenn die Entwickler bei Apple so denken, dann muss man sich nicht wundern – und es wird noch schlimmer kommen …

  • Andreas Marco Klusch

    Bei mir erscheinen die Einstellungen für den Scanner von HP nicht mehr. Eine Neuinstallation der HP-Drucker brachte keine Abhilfe.

  • Was Kompatibilität mit neuen OS-Versionen angeht, ist der Fujitsu-Scan- und OCR-Prozess seit vielen Jahren immer das größte Problem für mich. Wenn das fehlerfrei läuft, kann ich auf das neue OS updaten. Vorher nicht. Und das déja vu hatte ich auch, hätte aber nicht gedacht, dass das schon 2016 war.

  • Herr Kaffeetrinken

    Works as designed. Das ist der neue Verschlüsselungsmechnismus von Vorschau. ;-)

  • Diese Geschichte bezieht sich nur auf OCR-Layer, die mit ABBYY FineReader, einer seit 5 Jahren nicht mehr aktualisierten Software, angelegt wurden.
    Vorschau.app hat KEIN generelles Problem mit OCR-Ebenen. Ich habe das selbst getestet mit einem HP Scanner, OCR-Erfassung mit Prizmo, das Resultat als PDF mit OCR-Layer gespeichert. Das Dokument ließ sich problemlos in Vorschau.app öffnen, der Text auswählen und kopieren, eine Kopie des Dokumentes wiederum als PDF (mit OCR-Layer) speichern. — Die ausgesprochene Warnung ist nur für ABBYY-Benutzer relevant.

    • Dem kann ich nur zustimmen. Ich bin dazu übergegangen die von der ScanSnap integrierte OCR-Funktion zu verwenden und zumindest auf den „ABBY-FineReader for ScanSnap“ zu verzichten. Ich habe den auch direkt deinstalliert.
      Interressanterweise erzeugt der „FineReader for Mac“ (Version 12.1.14) einwandfreie PDF-Dateien, die auch mit der Vorschau editiert werden können.

    • Zudem sind die Daten nicht unwiderruflich weg, man sieht das in beiden Texten die Leerzeichen zwischen den Buchstaben an der selben Stelle sind und Wörter die Wörter, welche mehrfach im Text vorkommen sind im kryptischen Text auch Identisch falsche. Hier handelt es sich somit eher um ein versehentliches drehen von Zeichensätzen, als ein Verlust von Daten. Und soweit ich informiert bin ist der ABBY Fine Reader ja auch nicht für Big Sur als kompatibel zertifiziert.

    • So ist es wohl, ich habe auch keine Probleme. Aber schön, dass alle wieder das komplette System bemängeln.. bescheuert

  • Hab es jetzt mal mit einem Dokument getestet welches OCR direkt von HP Easy Scan bekommt.

    Dort konnte ich das Problem nicht reproduzieren. Auch nach dem Löschen einer Seite, Speichern und einem Programm Neustart ist alles noch da wo es hin gehört.

    Immerhin eine gute Nachricht.

  • Hast du den Ablauf mit dem gleichen Dokument auch mit ABBYY gemacht?
    Wie war das Resultat dann?

  • Man könnte jetzt darauf kommen, dass bei Apple nur noch Idioten für die Software zuständig sind, ignoriert dabei aber gekonnt, dass man sich bei Apple einfach auf die wirklich essentiellen Dinge konzentriert. Wir können einen Kothaufen animieren und als Emojicon nutzen, wen interessiert denn da schon so ein poppeliges PDF?

  • Kann jemand erklären, warum die PDF-Vorschau die Zeitstempel von PDFs bereits bei bloßem ANSEHEN verändert? Und das schon bei Catalina?

  • Bei jedem Problem das aufpopt genau das gleiche, die Fanboys welche nicht in der Lage sind Fehler zu finden und um den rechten Knöchel eine Schnur haben mit der man sie wieder bei Apple aus dem Hintern ziehen kann wettern gegen die welche Fehler finden und anprangern und gegen die welche das Frecherweise auch noch unterstützen.

    Totaler Apple-Koller?

    Egal was hier steht. An alle die in der Lage sind Fehler finden die irgend welche Kinder bei Apple zusammenprogrammieren, das absoluten Mist finden und sich gar nicht erst auf die Stufe von Fanboys stellen wollt, spart Euch doch diesen Exzess und beschreibt das „Produktfeedback“ bei Apple voll.

    Irgend einer von den Traubentretern bei Apple muss das lesen.

    https://www.apple.com/feedback/

    Lasst Euch nicht jeden bescheuerten Anfängerfehler von einem Hersteller gefallen der von sich selbst behautet einer der besten von den besten zu sein!

  • Hihi, alle Welt empört sich wieder auf äusserste und die drei die es wirklich getestet haben sagen, funktioniert doch. Kein Fehler festgestellt.
    Ich werde es die Tage auch mal testen, mit meiner OCR Software natürlich. Benutze schon ewig kein Abby mehr und dann weiß ich ob mich das überhaupt betrifft.
    Und wer bitte ist den der Herr Grabowski? Muss man den kennen?
    Ach stimmt ja, er hat es auf Twitter geschrieben, na dann muss das ja auch richtig sein und alle Welt betreffen ;-)

  • Danke für die Info iFun. So gut das es Euch gibt! Danke und weiter so im neuen Jahr!

  • Ich kann mich dem Kommentar von KJM nur anschließen. Habe den Effekt auch in der Kombination aus Finereader und Vorschau beobachtet (und deswegen schon ziemlich lange nach Kommentaren dazu im Internet gesucht), hat nichts mit Big Sur zu tun. Ich arbeite noch mit Systemen von High Sierra bis Catalina. War schon manchmal nicht sicher ob es sich um einen Bug oder ein Feature von Finereader handelt, da auf diese Weise sicher gestellt wird, dass ein mit Finereader bearbeitetes Dokument nicht nachträglich nochmals verändert werden kann. Dadurch wird quasi einfaches Paste und Copy aus potenzielle manipulierten Dokumenten erschwert. Meine These würde aber im Umkehrschluss bedeuten, dass mit Finereader eingelesene Dokumente in anderen Programmen, welche dem Programm Vorschau ähnlich sind, den selben Effekt zeigen. Hatte bisher nicht die Gelegenheit und die Lust , hier weiter nach zu forschen.

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 39178 Artikel in den vergangenen 8413 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2024 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven