ifun.de — Apple News seit 2001. 24 629 Artikel
Für das papierlose Büro

PDF Archiver: Open-Source-Projekt zur Langzeit-Archivierung

Artikel auf Google Plus teilen.
38 Kommentare 38

ifun.de-Leser Julian hat uns auf sein Open-Source-Projekt PDF Archiver aufmerksam gemacht, das sowohl im Mac App Store geladen werden kann als auch in Quelltext-Form auf dem Code-Portal Github zum freien Zugriff bereitsteht.

Pdf Archiv

Die Anwendung soll beim Organisieren der eigenen PDF-Ablage zur Hand gehen und setzt dafür weder auf eine proprietäre Cloud-Lösung noch auf ein Datenbank-Format, dass in wenigen Jahren vielleicht schon nicht mehr unterstützt wird.

Der PDF Archiver setzt auf eine eigene Dateinamen-Konvention, die Schlagwörter, Daten und Beschreibungen einfach im Dateinamen der Dokumente notiert und so weitgehend unabhängig von Betriebssystem, Cloud-Anbieter und Mac- bzw. PC-Anwendung eingesetzt werden kann. Das Format ist dabei relativ übersichtlich:

  • Datum: yyyy-mm-dd (Datum des Dokumentes)
  • Beschreibung: –ikea-tradfri-gateway (eine kurze Inhaltsangabe)
  • Tags: __bill_ikea_iot (Schlagwörter die beim Wiederfinden helfen sollen)

Archiv

Julian erklärt:

[…] Freunde von mir und ich haben von dem Projekt fileee.com gehört und fanden die Idee prinzipiell super. Dort wird der Workflow Dokumente zu digitalisieren und zu sortieren vereinfacht. Allerdings waren wir sehr skeptisch unsere gesamten Dokumente diesem einen Unternehmen anzuvertrauen. […]

Somit war klar: wir wollten ein Konzept haben, bei dem man seine Dokumente weiterhin selbst kontrolliert und entscheidet, wo diese gespeichert werden sollen. Außerdem war eine langfristig Speicherung (auch >10 Jahre) gefordert. Wir kamen zu der Lösung, dass möglichst viele Informationen über das Dokument im Dateinamen stehen sollten und der Dateiname trotzdem so aufgebaut ist, dass man problemlos das Betriebssystem/Dateisystem auf dem die Daten gespeichert werden, wechseln kann.

Pdf Archiv

So besitzt die Mac-Anwendung derzeit eigentlich nur die Aufgabe, vorhandene Dokumente schnell zu verschlagworten. Durchsucht werden die Dokumente anschließend auf Dateisystem-Ebene bzw. mit Hilfe des Finders.

Julian hat die Idee hinter dem PDF Archiver in diesem Blogeintrag ausführlich formuliert und würde sich über Ideen und Anregungen freuen.

Noch ist die Mac-App keine Download-Empfehlung, sobald die Applikation jedoch auch in der Lage ist, schon vorhandene Archive anzuzeigen, zu durchsuchen und beim nachträglichen Sortieren zur Hand zu gehen, könnte sich der PDF Archiver durchaus zu einer EagleFiler-Alternatove Mausern. Wir halten euch auf dem Laufenden.

Finder

Dienstag, 06. Mrz 2018, 14:36 Uhr — Nicolas
38 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
Rede mit!
  • So etwas für MacOS und Windows, perfekt

  • Gute Idee!
    Aber auch PDF ist doch nicht so sicher und Langzeitarchivierungstauglich? Ich erinnere nur mal an Apple Preview…. was wenn man irgendwann bemerkt, dass die PDFs zwar existieren, dank Preview aber nur noch aus leeren, weißen PDFs bestehen?

    Langzeitarchivierung ist wirklich nichts einfaches, vermutlich müsste man fast alte Systeme im Keller sammeln, damit man ggf. auf diese zurückgreifen kann.

    • Es gibt auch ein PDF Format speziell für die Langzeitarchivierung: https://de.wikipedia.org/wiki/PDF/A

      Am sichersten wäre aber wohl ein JPEG/PNG/TIFF und eine einfache Textdatei mit dem OCR Text.
      Dass die Formate mal nicht mehr gelesen werden können ist doch recht unwahrscheinlich.

    • Dafür wurde extra das PDF/A Format entwickelt. Es ist wird auf x Jahre (genaue Dauer habe ich nicht im Kopf) von allen Acrobat Readern unterstützt und ist öffentlich dokumentiert.

      • Unterstützen das auch andere Programme und ist garantiert, dass Apple das nicht wieder mit irgendeiner tollen Idee zerstören kann?

        Danke für den Hinweis!

  • Spannend, aber ich würde die Sachen eher mit OCR scannen. Dann such ich einfach nach IKEA und krieg alles wo IKEA drin ist. Und kann auch nach Sachen suchen, die ich nicht als Schlagwort genutzt habe.

    • Genau so mache ich es auch. Nur habe ich noch keinen anständigen Scanner der auch duplex scan beherrscht.

      Hat da jemand einen Tipp?

      • Ich nutze Scanbot. Läd auch gleich in die iCloud hoch. ;)

      • Fujitsu IX500
        Nutze ich schon ziemlich lange und bin total begeistert

      • ScanSnap ix500. Duplex Scan mit OCR. Und sehr schnell.

      • Zuhause: Fujitsu Scansnap iX500. Funktioniert sowohl zuhause am Mac als auch auf Windows im Büro wunderbar (inkl. Duplex). Möcht‘ ich nicht mehr missen.

        Unterwegs: Scanbot, aber dazwischen liegen (wie zu erwarten) Welten…

      • Ich. bin extrem happy mit dem BROTHER ADS-2600.
        Ich schiebe ein Papier rein, drücke auf dem Display z.B. auf den Softbutton „Rechnung, doppelseitig“.
        Es läuft durch und wird vom Scanner an meine Gmail-Adresse geschickt ind dort als Rechnung einsortiert.
        Mit dem passenden Google Script wird die Rechnung dann in mein Google Drive geladen und am Mac von „Receipts“ einsortiert. Besser geht es kaum :)

      • Ich habe einen aktuellen größeren hp-drucker mit duplex druck und duplex scan. Bei größeren Dokumenten, also ab 5 Seiten, habe ich damit aber regelmäßig probleme. Ein Scansnap ist hierbei schlicht eine ganz andere Leistungsklasse, kostet aber auch etwas mehr.
        Für meine Dokumente benutzte ich übrigens Paperless, was öfters mal im Angebot ist, oder in bundles. Das funktioniert für mich auch ganz gut.

      • Ich nutze Epson WF 7610. druckt zwar nicht besonders gut, aber scannt super. Duplex bis DIN A4 und zusätzlich Auflagenglas DIN A3, scannt dann auch die langen IKEA Quittungen. druckt auch bis DIN A3 randlos

      • fujitsu snapscan. Jeder Brief in meinem Briefkasten wird gescannt, PDF durchsuchbar, und dann mit der obigen Dateinamenkonvention (verwende ich seit mehr als 10 Jahren) abgelegt.
        Dann über eine Automator Aktion in den richtigen Ordner abgelegt.
        Daher ist die Applikation für mich nutzlos.

  • Open Source und dann 3,5 Tacken im App Store???

  • versucht doch mal ecoDMS. Läuft unt Mac, Win, Qnap, Synology. Hab es getestet und fand es hervorragend. Einfach, für den Privateinsatz in einem vernünftigen Umfang kostenfrei und durchaus mit einer schnellen und guten OCR.
    Leider musste ich wieder was anderes nutzen, da ich schon über 5.000 Dokumente in einem ELO Archiv habe, welche man nicht so einfach und kostenneutral migrieren kann. Bin wohl auf ewig da gefangen:(

    • Das ist zu mächtig und auf Synology benötigt es Docker

    • Ich habe mir auch ecoDMS angeschaut. Läuft in einer ContainerStation auf meiner QNAP. Das ist wirklich ein sehr mächtiges Tool ich denke abr das es sehr vernüftig ist. Am Anfang ist glaube ich sehr viel nötig damit es läuft, aber ich denke es ist ein Super Management tool. Schauen wir mal :)

  • Das Programm Doo war mal gut, wurde aber eingestellt und läuft unter High Sierra nicht mehr richtig. Schade.

    • Doo ist bei mir immer abgestürzt. Egal, ob ich es unter SnowLeopard, MountainLion oder Sierra benutzt habe.
      Die Idee dahinter war aber schon cool. Schade, das es nicht mehr weiter entwickelt wird.

      Paperless von Mariner Software ist wie itunes für Dokumente, versteckt aber alles in einer Datenbank. Da ist ein späterer Wechsel von Betriebssystem oder Verwaltungssoftware fast unmöglich.

  • Könnt Ihr einen iOS-PDF-Scanner empfehlen, der möglichst kleine PDFs erzeugt?
    Geht nur um das Einscannen von Rechnungen: s/w und komprimiert bekomme ich pro DIN A4-Seite mit Scanner Pro von Readdle auf PDFs zwischen 300-400kb.

    • Finescanner Pro macht die kleinsten PDFs. Man muss dafür die OCR-Funktion benutzen. Größe ist dann ungefähr ein Zehntel des Üblichen (und der erkannte Text ist inklusive).

  • Danke für den Tipp. Das Programm steht zwar noch komplett am Anfang seiner Entwicklung, aber das Konzept der Ablage einfach im Filesystem ist für mich jedoch genau der richtige Ansatz. Für mich ist dieses Grund genug warum ich mich jetzt ernsthaft damit beschäftige eine elektronische Dokumentenablage zu erwägen.

    • Dem schließe ich mich an.
      Als ich die Beschreibung las, dachte ich, genau was ich schon lange suche.
      Bin begeistert wie einfach das Programm zu bedienen ist. Genial finde ich die Verschlagwortung im Dateinamen und Übernahme als Finder-Tags.
      Mein Workflow:
      Scannen mit dem ScanSnap ix100 als durchsuchbare PDF direkt ins „untagged“ Verzeichnis, mit PDF Archiver einlesen und bearbeiten, sichern. Die PDF wird danach direkt ins Archiv-Verzeichnis verschoben. Fertig.

  • Danke für den Tip. Generell bin ich an Paperless-Themen hier sehr interesseiert. Seit 2010 scanne ich meine Dokumente, seit 2016 mit dem iX500. Dazu lasse ich mir von der Software Hazel helfen, die auch Tags und Dateinamen jonglieren kann. Auch eine Ordnerstruktur lässt sich damit aufbauen. Bei diesem pdf-Archiver sehe ich etwas die Gefahr, dass die Anzahl der Tags ausufern könnte. Desweiteren habe Tags eigentlich am meinsten Sinn, wenn sie Zusatzinformation bieten, die nicht im Dateinamen stehen oder im Dokumenteninhalt.

  • Danke für den Tip. Generell bin ich an Paperless-Themen hier sehr interesseiert. Seit 2010 scanne ich meine Dokumente, seit 2016 mit dem iX500. Dazu lasse ich mir von der Software Hazel helfen, die auch Tags und Dateinamen jonglieren kann. Auch eine Ordnerstruktur lässt sich damit aufbauen. Bei diesem pdf-Archiver sehe ich etwas die Gefahr, dass die Anzahl der Tags ausufern könnte. Desweiteren habe Tags eigentlich am meinsten Sinn, wenn sie Zusatzinformation bieten, die nicht im Dateinamen stehen oder im Dokumenteninhalt.

  • Mac Nutzer müssen sich für plain Text Aufgaben eben eine App schreiben…

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 24629 Artikel in den vergangenen 6236 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2018 aketo GmbH   ·   Impressum   ·   Datenschutz   ·   Auf dieser Seite werben aketo GmbH Powered by SysEleven