Hilfe:Erstellen einer DjVu-Datei

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Creating a DjVu file and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Help:Creating a DjVu file and have to be approved by a translation administrator.

Auf dieser Seite wird erklärt, wie du eine DjVu-Datei erstellst. Das Format kann wie jedes unterstützte Bildformat in Galerien oder Kategorien verwendet werden und reduziert die Größe und Anzahl der Dateien, die kopiert werden müssen.

Wenn du Schwierigkeiten hast, kannst du im Commons:Help desk um Hilfe bitten.

Beispiel: [[File:Alice in Wonderland.djvu|thumb|Alice im Wunderland, Seite 9|page=9]].

Alice im Wunderland, Seite 9

Einführung

Ziel ist es, aus im Internet gefundenen oder eingescannten Bitmap-Versionen (jpg, tif, etc.) eine DjVu-Datei zu erstellen. Dies ist vorteilhaft, weil:

  • alle Seiten eines Buches in einer einzigen Datei vorhanden sind
  • alle Seiten von der Dateiseite der DjVu-Datei aus gesehen werden können
  • jede Seite auf Seiten verwendet werden kann
  • DjVu-Dateien klein sind
  • nur eine einzige Datei kopiert werden muss, im Vergleich zu Hunderten von Seiten im Bitmap-Format.
  • das Erstellen einer DjVu-Datei schneller ist als das Hochladen von Hunderten von Bitmap-Dateien.

Nachteile:

  • Die Nummerierung der Seiten scheint nicht frei konfigurierbar zu sein
  • Es können Qualitätsverluste auftreten

Innerhalb von MediaWiki-Projekten

Durch die Seiten von DjVu-Dateien kann in Mediawiki-Installationen, die die ProofreadPage-Erweiterung installiert haben, navigiert werden. Dies ist bei allen Sprachversionen von Wikisource der Fall.

Sobald eine Datei auf Commons hochgeladen ist, muss eine Indexseite erstellt werden. Die Navigation erfolgt über den Namen der Datei mit vorangestelltem „page:“, gefolgt von „/X“, wobei „X“ die Seitennummer ist.

Seitennummerierung

Das DjVu-Format hat eine Standardseitennummerierung erstellt, die in einem Dropdown-Menü angezeigt wird (siehe Image:Wind in the Willows.djvu). Es ist ratsam, die Seitennummerierung mit der des Originalbuchs übereinstimmen zu lassen, um die Benutzung zu erleichtern. Dies kann problematisch sein, wenn einige Seiten (wie z.B. in der Einleitung) in römischen Zahlen nummeriert sind. In diesem Fall besteht eine Lösung darin, eine zweite DjVu-Datei für diese Seiten zu erstellen.

Konvertieren einer PDF-Datei

Siehe Help:Converting PDF to DjVu

Andere Formate

Tiff-Dateien aus Gallica können in FineReader geöffnet werden (auch nach Ablauf der Testphase). Durch den Export der Seiten in tiff (gleiches Format) ist es möglich, die Ränder mit XnView zu beschneiden, und die Seiten in DjVu Solo zu laden. Die Seitennummerierung erfolgt automatisch.

MS Windows

Konvertierung durch DjVu Solo

jVu Solo ist ein sehr einfaches und effektives Werkzeug. Diese Software wird nicht mehr aktualisiert, ist aber stabil. Es ist auch möglich, LizardTech Virtual Printer zu verwenden, das kostenlos erhältlich ist und Dokumente durch einen Druckvorgang konvertieren kann. Die Vorgehensweise ist bei allen Konvertierungsprogrammen mehr oder weniger gleich: Lade die Bitmap-Dateien in das Programm, überprüfen deren Reihenfolge und starte den Konvertierungsprozess.

Standardmäßig ist DjVu Solo so eingestellt, dass es Seiten mit einer Auflösung von 300 dpi konvertiert. Dies ist normalerweise ein guter Wert.

Konvertierung durch DjVuLibre

DjVuLibre hat keine grafische Benutzeroberfläche für die Konvertierung von Dateien, aber mit einem geeigneten Skript kannst du es fast ohne Benutzereingabe machen. Siehe Skripte zum Erstellen einer einzelnen, zusammengestellten DjVu-Datei.

Mac OS X

Über MacPorts kann man eine Reihe von DjVu-Programmen für den Einsatz auf Macintosh-Computern installieren:

# port list '*djvu*'
djvu2pdf                       @0.9.2          graphics/djvu2pdf
djvulibre                      @3.5.25         graphics/djvulibre
minidjvu                       @0.8            graphics/minidjvu
pdf2djvu                       @0.7.18         graphics/pdf2djvu
py-djvubind                    @1.2.1          python/py-djvubind
py31-djvubind                  @1.2.1          python/py-graveyard
py32-djvubind                  @1.2.1          python/py-graveyard
py33-djvubind                  @1.2.1          python/py-djvubind
py34-djvubind                  @1.2.1          python/py-djvubind
zathura-plugin-djvu            @0.2.3          office/zathura-plugin-djvu

Unter Linux, FreeBSD usw.

Du benötigst die Software DjVuLibre, eine Sammlung von Befehlszeilen-Tools zum Erstellen, Ändern und Anzeigen von DjVu-Dateien. Du benötigst wahrscheinlich auch die Software ImageMagick oder GraphicsMagick, wenn du Seiten-Scans aus Bitmap-Formaten konvertieren musst.

Seitenscans konvertieren

Das Tool cjb2 dient zur Erstellung einer DjVu-Datei aus einer PBM- oder TIFF-Datei. Daher musst du deine Scans konvertieren, wenn sie nicht bereits in einem dieser Formate vorliegen. (Die folgenden Beispiele verwenden das Werkzeug convert von ImageMagick, aber sie funktionieren auch mit dem Befehl gm convert von GraphicsMagick).

  • Konvertierung vom PNG-Format ins PBM-Format mit convert:
 convert rig_veda-000.png rig_veda-000.pbm
  • Je nach Qualität der Originalscans kann es sinnvoll sein, diese mit dem Dienstprogramm [https:/www.flameeyes.euprojectsunpaper unpaper] zu verarbeiten, das schwarze Ränder um die Seiten entfernt und den gescannten Text quadratisch auf der Seite ausrichtet. Unpaper ist auch in der Lage, zwei separate Seitenbilder zu extrahieren, wenn gegenüberliegende Seiten eines Buches in ein einziges Bild gescannt wurden.
  • Erstellung einer DjVu-Datei aus einer PBM-Datei
 cjb2 -clean rig_veda-000.pbm rig_veda-000.djvu
  • Hinzufügen der DjVu-Datei zum endgültigen Dokument
 djvm -i rig_veda.djvu rig_veda-000.djvu

Du musst diese Schritte mit einem Skript für jede Seite des Buchs wiederholen. Beispiel:

#!/bin/bash
for n in `seq 1 9`
do
        i="rig_veda-$n.png"
        j=`basename $i .png`
        convert $i $j.pbm
        cjb2 -clean $j.pbm $j.djvu
        djvm -i rig_veda.djvu $j.djvu
done

Alternativ kannst du auch ein makefile verwenden und parallele Prozesse mit 'make -j' ausführen

UNPAPER_OPTS_COMMON= --mask-scan-threshold 0.01 --dpi 600 --mask-scan-size 100
UNPAPER_OPTS_ST1= --deskew-scan-size 5000 -dv 0.5
UNPAPER_OPTS_ST2= --no-noisefilter --no-blackfilter --no-grayfilter --no-blurfilter --no-deskew -S 3600,5250 --border-align top --border-margin 150
IMGS = $(wildcard *.png)
DJVUS = $(sort ${IMGS:.png=.djvu})
DJVU = __out.djvu

all: ${DJVUS} ${DJVU}

%.raw.pbm: %.png
	convert $< $@

# Schritt 1: Ränder säubern, Filter anwenden, rotieren
%.stage1.pbm: %.raw.pbm
	unpaper --overwrite $(UNPAPER_OPTS_COMMON) $(UNPAPER_OPTS_ST1) $< $@ > $@.log

# Schritt 2: in der Mitte der Seite platzieren, Seitengröße einstellen
%.pbm: %.stage1.pbm
	unpaper --overwrite $(UNPAPER_OPTS_COMMON) $(UNPAPER_OPTS_ST2) $< $@ > $@.log

# Komprimieren zu .djvu
%.djvu: %.pbm
	cjb2 -clean $< $@

# Endgültige djvu-Montage
${DJVU}: ${DJVUS}
        # Dateien, die unpaper nicht gut verarbeitet, können in 
        # einem anderen Verzeichnis abgelegt und im endgültigen djvu zusammengefügt werden
	# cp ./_manfix/*.djvu ./
	djvm -c $(DJVU) ${DJVUS}
        # Mit parallelem make wird es unmöglich zu sagen, welcher Fehler
        # von welcher Datei kommt, also speicher alle Ausgaben in einem großen Protokoll
	cat *.log > _one_big.log


säubern:
	rm -f *.raw.pbm
	rm -f *.pbm
	rm -f *.djvu
	rm -f *.log

Konvertieren von PostScript-Dateien (PDF, PS, EPS)

DjvuLibre enthält djvudigital, ein Werkzeug, das Ghostscript verwendet, um PDF- und andere PostScript-Dateien direkt in das DjVu-Format zu konvertieren. Allerdings muss Ghostscript aus dem Quellcode nachgebaut werden, um einen speziellen Treiber einzubinden, der von djvudigital benötigt wird (er ist Teil der DjvuLibre-Distribution, kann aber wegen widersprüchlicher Open-Source-Lizenzen nicht legal als Binärdatei weitergegeben werden). Einmal gebaut, ist es jedoch ein sehr komfortables Werkzeug; es kann sogar PDF-Dateien von Google Books ohne zusätzliche Arbeit konvertieren. Es ist so einfach wie:

 djvudigital --words some_book.pdf

Die Option --words sollte enthalten sein, um jeden durchsuchbaren Text, der in der PDF-Datei vorhanden ist, in die endgültige DjVu-Datei zu kopieren. Dadurch können auch Wörter bei der Suche hervorgehoben werden. (Um ein wenig Dateigröße zu sparen, könntest du --lines anstelle von --words verwenden, was die Position jeder Zeile anstelle jedes einzelnen Worts aufzeichnen würde; der Text könnte immer noch nach Wörtern durchsucht werden, aber ganze Zeilen würden in den Suchergebnissen anstelle der einzelnen Wörter hervorgehoben werden. Dies spielt wahrscheinlich keine Rolle bei Karten, Illustrationen usw., wo Wörter über die ganze Seite verstreut sind).

Konvertierung durch DjVu Solo

DjVuSolo ist für Linux mit WineHQ verfügbar. Die Installationsprozedur von Wine HQ ist abhängig von der Distribution und wird unter dem obigen Link beschrieben. Wenn WineHQ installiert ist, lade einfach den Installer von DJVU Solo herunter und starte ihn mit Wine. Öffne den Ordner mit dem Installer im Terminal und führe wine djvusolo3.1-noncom.exe aus. Normalerweise sind keine Tricks notwendig. Für den Zugriff auf das Dateisystem verwendedas entsprechende Laufwerk in WineHQ (standardmäßig Z).

Siehe auch

Software

Webseiten