FürthWiki:Bücher digitalisieren: Unterschied zwischen den Versionen

Aktuelle Version vom 27. September 2024, 10:03 Uhr

Das FürthWiki verfügt seit 7. Mai 2021 über Werkzeuge zur Digitalisierung von Büchern. Die Erweiterung "ProofreadPage" ermöglicht die "Seite an Seite"-Darstellung eines Textes mit einem Bild oder PDF, welches abgeschrieben oder Korrektur gelesen werden soll. Des weiteren wird durch diese Erweiterung auch ein komfortables Navigieren im Dokument ermöglicht und eine Übersicht des Digitalisierungsstatus der einzelnen Seiten erstellt.

Buch scannen und hochladen

Ein Buch oder eine Broschüre wird zunächst mit einem geeigneten Scanner in Bilddateien umgewandelt.
Bei mehrseitigen Schriftstücken ist die Erstellung eines PDFs dringend angeraten, um die Darstellung zu vereinfachen und den Zugriff auf die Daten zu gewährleisten.
Das PDF wird anschließend über "Datei hochladen" in das Fürth Wiki hochgeladen.
ACHTUNG: Besonders bei zu digitalisierenden Schriftstücken ist penibel auf den Namen der Datei zu achten, da dieser nur noch schwer zu ändern ist nachdem die ersten Seiten angelegt und mit Text versehen sind!

PDF einrichten und indizieren

Wenn die Datei als PDF hochgeladen ist, klickt man auf der Bildbeschreibungsseite im linken oberen Eck "Link zur Indexseite", was auf eine leere Index: Seite führt.
Auf der noch leeren Index: Seite ist der Reiter "Erstellen" zu betätigen, womit man in ein Formular kommt, welches diverse Daten zum Buch anfragt. Anmerkung: Das ist zwar momentan redundant zur Vorlage {{Bild}}, dafür wird aber noch eine Idee gesucht.
Bei einem PDF kann man in das Feld "Seiten" einfach <pagelist /> eintragen, wenn man einzelne Dateien hat (jpg, png, etc.) dann muss man jede einzelne Seite per Hand eintragen wie etwa: [[Seite:Buch01.png]][[Seite:Buch02.png]].
Nachdem gespeichert wurde erscheint ein Seitenindex, welcher den Bearbeitungsstatus jeder Seite anzeigt. Ein Klick auf die Seitennummer öffnet für die gewählte Seite die Arbeitsumgebung mit "Seite an Seite"-Ansicht. Hier einmal Seite speichern, damit die Seiteninhalte auch bei der Suche gefunden werden.

Bearbeitung und Korrektur

Auf der linken Seite kann der Text eingetragen werden, welcher auf der Bildansicht der Buchseite auf der rechten Bildschirmseite angezeigt wird.
Unterhalb des Editors sind vier bunte Auswahlfelder, welche den Bearbeitungsstatus der Seite im Index beeinflussen. Schließlich können größere Projekte nicht von einer Person an einem Tag bewerkstelligt werden.

OCR-Software

Texterkennung erleichtert die Angelegenheit immens. Ein kostenloses, wenn auch eher mittelmäßiges OCR-Programm ist FreeOCR von www.paperfile.net. Eine Alternative ist auch OCR [img2txt]. Im FürthWiki-Laden wird der kostenpflichtige ABBYY FineReader benutzt.

@@ Zeile 1: / Zeile 1: @@
-Das FürthWiki verfügt seit [[7. Mai]] [[2021]] über Werkzeuge zur Digitalisierung von Büchern. Die Erweiterung "ProofreadPage" ermöglicht die "Seite an Seite" Darstellung eines Textes mit einem Bild oder PDF, welches abgeschrieben oder korrektur gelesen werden soll. Desweiteren wird durch diese Erweiterung auch ein komfortables navigieren im Dokument ermöglicht und eine Übersicht des Digitalisierungsstatus der einzelnen Seiten erstellt.
+Das FürthWiki verfügt seit [[7. Mai]] [[2021]] über Werkzeuge zur Digitalisierung von Büchern. Die Erweiterung "ProofreadPage" ermöglicht die "Seite an Seite"-Darstellung eines Textes mit einem Bild oder PDF, welches abgeschrieben oder Korrektur gelesen werden soll. Des weiteren wird durch diese Erweiterung auch ein komfortables Navigieren im Dokument ermöglicht und eine Übersicht des Digitalisierungsstatus der einzelnen Seiten erstellt.
 ==Buch scannen und hochladen==
-* Ein Buch oder eine Broschüre sollte zunächst mit einem geeigneten Scanner in Bilddateien umgewandelt werden.
+* Ein Buch oder eine Broschüre wird zunächst mit einem geeigneten Scanner in Bilddateien umgewandelt.
-* Bei mehrseitigen Schriftstücken ist die Erstellung eines PDFs dringend angeraten, um die Darstellung und Händelbarkeit der Daten zu gewärleisten.
+* Bei mehrseitigen Schriftstücken ist die Erstellung eines PDFs dringend angeraten, um die Darstellung zu vereinfachen und den Zugriff auf die Daten zu gewährleisten.
-* Das PDF sollte nun über "Datei hochladen" in das FürthWiki hochgeladen werden.<br>'''ACHTUNG:''' Besonders bei zu digitalisierenden Schriftstücken ist penibel auf den Namen der Datei zu achten, da dieser nur noch schwer zu ändern ist nachdem die ersten Seiten angelegt und mit Text versehen sind!
+* Das PDF wird anschließend über "Datei hochladen" in das Fürth Wiki hochgeladen.<br>'''ACHTUNG:''' Besonders bei zu digitalisierenden Schriftstücken ist penibel auf den Namen der Datei zu achten, da dieser nur noch schwer zu ändern ist nachdem die ersten Seiten angelegt und mit Text versehen sind!
-==Erstellung der Arbeitsumgebung==
+==PDF einrichten und indizieren==
-* Wenn die Datei als PDF hochgeladen ist, kann man auf der Bildbeschreibungsseite im linken oberen Eck "Link zur Indexseite" klicken, was auf eine leere Index: Seite führt.
+* Wenn die Datei als PDF hochgeladen ist, klickt man auf der Bildbeschreibungsseite im linken oberen Eck "Link zur Indexseite", was auf eine leere ''Index: Seite'' führt.
-* Auf der noch leeren Index: Seite ist der Reiter "Erstellen" zu betätigen, womit man in ein Formular kommt, welches diverse Daten zum Buch anfragt. ''Anmerkung: Das ist zwar momentan redundant zur Vorlage <nowiki>{{Bild}}</nowiki>, dafür hab ich aber noch keine Idee''.
+* Auf der noch leeren ''Index: Seite'' ist der Reiter "Erstellen" zu betätigen, womit man in ein Formular kommt, welches diverse Daten zum Buch anfragt. ''Anmerkung: Das ist zwar momentan redundant zur Vorlage <nowiki>{{Bild}}</nowiki>, dafür wird aber noch eine Idee gesucht''.
 * Bei einem PDF kann man in das Feld "Seiten" einfach <code><nowiki><pagelist /></nowiki></code> eintragen, wenn man einzelne Dateien hat (jpg, png, etc.) dann muss man jede einzelne Seite per Hand eintragen wie etwa: <code><nowiki>[[Seite:Buch01.png]][[Seite:Buch02.png]]</nowiki></code>.
-* Nachdem gespeichert wurde erscheint ein Seitenindex, welcher den Bearbeitungsstatus jeder Seite anzeigt. Ein Klick auf die Seitennummer öffnet für die gewählte Seite die Arbeitsumgebung mit "Seite an Seite" Ansicht.
+* Nachdem gespeichert wurde erscheint ein Seitenindex, welcher den Bearbeitungsstatus jeder Seite anzeigt. Ein Klick auf die Seitennummer öffnet für die gewählte Seite die Arbeitsumgebung mit "Seite an Seite"-Ansicht. Hier einmal ''Seite speichern'', damit die Seiteninhalte auch bei der Suche gefunden werden.
 ==Bearbeitung und Korrektur==
@@ Zeile 16: / Zeile 16: @@
 * Unterhalb des Editors sind vier bunte Auswahlfelder, welche den Bearbeitungsstatus der Seite im Index beeinflussen. Schließlich können größere Projekte nicht von einer Person an einem Tag bewerkstelligt werden.
-==Kostenlose OCR-Software==
+==OCR-Software==
-* Texterkennung erleichtert die Angelegenheit immens. Ein kostenloses, wenn auch eher mittelmässiges OCR-Programm ist [http://www.paperfile.net/ FreeOCR von www.paperfile.net]
+* Texterkennung erleichtert die Angelegenheit immens. Ein kostenloses, wenn auch eher mittelmäßiges OCR-Programm ist [http://www.paperfile.net/ FreeOCR von www.paperfile.net]. Eine Alternative ist auch ''OCR [img2txt]''. Im FürthWiki-Laden wird der kostenpflichtige ABBYY FineReader benutzt.
+[[Kategorie:FürthWiki]]