FürthWiki:Bücher digitalisieren

Aus FürthWiki

Das FürthWiki verfügt seit 7. Mai 2021 über Werkzeuge zur Digitalisierung von Büchern. Die Erweiterung "ProofreadPage" ermöglicht die "Seite an Seite"-Darstellung eines Textes mit einem Bild oder PDF, welches abgeschrieben oder Korrektur gelesen werden soll. Des weiteren wird durch diese Erweiterung auch ein komfortables Navigieren im Dokument ermöglicht und eine Übersicht des Digitalisierungsstatus der einzelnen Seiten erstellt.

Buch scannen und hochladen

  • Ein Buch oder eine Broschüre wird zunächst mit einem geeigneten Scanner in Bilddateien umgewandelt.
  • Bei mehrseitigen Schriftstücken ist die Erstellung eines PDFs dringend angeraten, um die Darstellung zu vereinfachen und den Zugriff auf die Daten zu gewährleisten.
  • Das PDF wird anschließend über "Datei hochladen" in das Fürth Wiki hochgeladen.
    ACHTUNG: Besonders bei zu digitalisierenden Schriftstücken ist penibel auf den Namen der Datei zu achten, da dieser nur noch schwer zu ändern ist nachdem die ersten Seiten angelegt und mit Text versehen sind!

PDF einrichten und indizieren

  • Wenn die Datei als PDF hochgeladen ist, klickt man auf der Bildbeschreibungsseite im linken oberen Eck "Link zur Indexseite", was auf eine leere Index: Seite führt.
  • Auf der noch leeren Index: Seite ist der Reiter "Erstellen" zu betätigen, womit man in ein Formular kommt, welches diverse Daten zum Buch anfragt. Anmerkung: Das ist zwar momentan redundant zur Vorlage {{Bild}}, dafür wird aber noch eine Idee gesucht.
  • Bei einem PDF kann man in das Feld "Seiten" einfach <pagelist /> eintragen, wenn man einzelne Dateien hat (jpg, png, etc.) dann muss man jede einzelne Seite per Hand eintragen wie etwa: [[Seite:Buch01.png]][[Seite:Buch02.png]].
  • Nachdem gespeichert wurde erscheint ein Seitenindex, welcher den Bearbeitungsstatus jeder Seite anzeigt. Ein Klick auf die Seitennummer öffnet für die gewählte Seite die Arbeitsumgebung mit "Seite an Seite"-Ansicht. Hier einmal Seite speichern, damit die Seiteninhalte auch bei der Suche gefunden werden.

Bearbeitung und Korrektur

  • Auf der linken Seite kann der Text eingetragen werden, welcher auf der Bildansicht der Buchseite auf der rechten Bildschirmseite angezeigt wird.
  • Unterhalb des Editors sind vier bunte Auswahlfelder, welche den Bearbeitungsstatus der Seite im Index beeinflussen. Schließlich können größere Projekte nicht von einer Person an einem Tag bewerkstelligt werden.

OCR-Software

  • Texterkennung erleichtert die Angelegenheit immens. Ein kostenloses, wenn auch eher mittelmäßiges OCR-Programm ist FreeOCR von www.paperfile.net. Eine Alternative ist auch OCR [img2txt]. Im FürthWiki-Laden wird der kostenpflichtige ABBYY FineReader benutzt.