Hilfe:Erstellen einer DjVu-Datei
Auf dieser Seite wird erklärt, wie du eine DjVu-Datei erstellst. Das Format kann wie jedes unterstützte Bildformat in Galerien oder Kategorien verwendet werden und reduziert die Größe und Anzahl der Dateien, die kopiert werden müssen.
Wenn du Schwierigkeiten hast, kannst du im Commons:Help desk um Hilfe bitten.
Beispiel: [[File:Alice in Wonderland.djvu|thumb|Alice im Wunderland, Seite 9|page=9]]
.
Einführung
Ziel ist es, aus im Internet gefundenen oder eingescannten Bitmap-Versionen (jpg, tif, etc.) eine DjVu-Datei zu erstellen. Dies ist vorteilhaft, weil:
- alle Seiten eines Buches in einer einzigen Datei vorhanden sind
- alle Seiten von der Dateiseite der DjVu-Datei aus gesehen werden können
- jede Seite auf Seiten verwendet werden kann
- DjVu-Dateien klein sind
- nur eine einzige Datei kopiert werden muss, im Vergleich zu Hunderten von Seiten im Bitmap-Format.
- das Erstellen einer DjVu-Datei schneller ist als das Hochladen von Hunderten von Bitmap-Dateien.
Nachteile:
- Die Nummerierung der Seiten scheint nicht frei konfigurierbar zu sein
- Es können Qualitätsverluste auftreten
Innerhalb von MediaWiki-Projekten
Durch die Seiten von DjVu-Dateien kann in Mediawiki-Installationen, die die ProofreadPage-Erweiterung installiert haben, navigiert werden. Dies ist bei allen Sprachversionen von Wikisource der Fall.
Sobald eine Datei auf Commons hochgeladen ist, muss eine Indexseite erstellt werden. Die Navigation erfolgt über den Namen der Datei mit vorangestelltem „page:“, gefolgt von „/X“, wobei „X“ die Seitennummer ist.
Seitennummerierung
Das DjVu-Format hat eine Standardseitennummerierung erstellt, die in einem Dropdown-Menü angezeigt wird (siehe Image:Wind in the Willows.djvu). Es ist ratsam, die Seitennummerierung mit der des Originalbuchs übereinstimmen zu lassen, um die Benutzung zu erleichtern. Dies kann problematisch sein, wenn einige Seiten (wie z.B. in der Einleitung) in römischen Zahlen nummeriert sind. In diesem Fall besteht eine Lösung darin, eine zweite DjVu-Datei für diese Seiten zu erstellen.
Konvertieren einer PDF-Datei
Siehe Help:Converting PDF to DjVu
Andere Formate
Tiff-Dateien aus Gallica können in FineReader geöffnet werden (auch nach Ablauf der Testphase). Durch den Export der Seiten in tiff (gleiches Format) ist es möglich, die Ränder mit XnView zu beschneiden, und die Seiten in DjVu Solo zu laden. Die Seitennummerierung erfolgt automatisch.
MS Windows
Konvertierung durch DjVu Solo
jVu Solo ist ein sehr einfaches und effektives Werkzeug. Diese Software wird nicht mehr aktualisiert, ist aber stabil. Es ist auch möglich, LizardTech Virtual Printer zu verwenden, das kostenlos erhältlich ist und Dokumente durch einen Druckvorgang konvertieren kann. Die Vorgehensweise ist bei allen Konvertierungsprogrammen mehr oder weniger gleich: Lade die Bitmap-Dateien in das Programm, überprüfen deren Reihenfolge und starte den Konvertierungsprozess.
Standardmäßig ist DjVu Solo so eingestellt, dass es Seiten mit einer Auflösung von 300 dpi konvertiert. Dies ist normalerweise ein guter Wert.
Konvertierung durch DjVuLibre
DjVuLibre hat keine grafische Benutzeroberfläche für die Konvertierung von Dateien, aber mit einem geeigneten Skript kannst du es fast ohne Benutzereingabe machen. Siehe Skripte zum Erstellen einer einzelnen, zusammengestellten DjVu-Datei.
Mac OS X
Über MacPorts kann man eine Reihe von DjVu-Programmen für den Einsatz auf Macintosh-Computern installieren:
# port list '*djvu*' djvu2pdf @0.9.2 graphics/djvu2pdf djvulibre @3.5.25 graphics/djvulibre minidjvu @0.8 graphics/minidjvu pdf2djvu @0.7.18 graphics/pdf2djvu py-djvubind @1.2.1 python/py-djvubind py31-djvubind @1.2.1 python/py-graveyard py32-djvubind @1.2.1 python/py-graveyard py33-djvubind @1.2.1 python/py-djvubind py34-djvubind @1.2.1 python/py-djvubind zathura-plugin-djvu @0.2.3 office/zathura-plugin-djvu
Unter Linux, FreeBSD usw.
Du benötigst die Software DjVuLibre, eine Sammlung von Befehlszeilen-Tools zum Erstellen, Ändern und Anzeigen von DjVu-Dateien. Du benötigst wahrscheinlich auch die Software ImageMagick oder GraphicsMagick, wenn du Seiten-Scans aus Bitmap-Formaten konvertieren musst.
Seitenscans konvertieren
Das Tool cjb2
dient zur Erstellung einer DjVu-Datei aus einer PBM- oder TIFF-Datei. Daher musst du deine Scans konvertieren, wenn sie nicht bereits in einem dieser Formate vorliegen. (Die folgenden Beispiele verwenden das Werkzeug convert
von ImageMagick, aber sie funktionieren auch mit dem Befehl gm convert
von GraphicsMagick).
- Konvertierung vom PNG-Format ins PBM-Format mit
convert
:
convert rig_veda-000.png rig_veda-000.pbm
- Je nach Qualität der Originalscans kann es sinnvoll sein, diese mit dem Dienstprogramm [https:/www.flameeyes.euprojectsunpaper unpaper] zu verarbeiten, das schwarze Ränder um die Seiten entfernt und den gescannten Text quadratisch auf der Seite ausrichtet. Unpaper ist auch in der Lage, zwei separate Seitenbilder zu extrahieren, wenn gegenüberliegende Seiten eines Buches in ein einziges Bild gescannt wurden.
- Erstellung einer DjVu-Datei aus einer PBM-Datei
cjb2 -clean rig_veda-000.pbm rig_veda-000.djvu
- Hinzufügen der DjVu-Datei zum endgültigen Dokument
djvm -i rig_veda.djvu rig_veda-000.djvu
Du musst diese Schritte mit einem Skript für jede Seite des Buchs wiederholen. Beispiel:
#!/bin/bash
for n in `seq 1 9`
do
i="rig_veda-$n.png"
j=`basename $i .png`
convert $i $j.pbm
cjb2 -clean $j.pbm $j.djvu
djvm -i rig_veda.djvu $j.djvu
done
Alternativ kannst du auch ein makefile verwenden und parallele Prozesse mit 'make -j' ausführen
UNPAPER_OPTS_COMMON= --mask-scan-threshold 0.01 --dpi 600 --mask-scan-size 100
UNPAPER_OPTS_ST1= --deskew-scan-size 5000 -dv 0.5
UNPAPER_OPTS_ST2= --no-noisefilter --no-blackfilter --no-grayfilter --no-blurfilter --no-deskew -S 3600,5250 --border-align top --border-margin 150
IMGS = $(wildcard *.png)
DJVUS = $(sort ${IMGS:.png=.djvu})
DJVU = __out.djvu
all: ${DJVUS} ${DJVU}
%.raw.pbm: %.png
convert $< $@
# Schritt 1: Ränder säubern, Filter anwenden, rotieren
%.stage1.pbm: %.raw.pbm
unpaper --overwrite $(UNPAPER_OPTS_COMMON) $(UNPAPER_OPTS_ST1) $< $@ > $@.log
# Schritt 2: in der Mitte der Seite platzieren, Seitengröße einstellen
%.pbm: %.stage1.pbm
unpaper --overwrite $(UNPAPER_OPTS_COMMON) $(UNPAPER_OPTS_ST2) $< $@ > $@.log
# Komprimieren zu .djvu
%.djvu: %.pbm
cjb2 -clean $< $@
# Endgültige djvu-Montage
${DJVU}: ${DJVUS}
# Dateien, die unpaper nicht gut verarbeitet, können in
# einem anderen Verzeichnis abgelegt und im endgültigen djvu zusammengefügt werden
# cp ./_manfix/*.djvu ./
djvm -c $(DJVU) ${DJVUS}
# Mit parallelem make wird es unmöglich zu sagen, welcher Fehler
# von welcher Datei kommt, also speicher alle Ausgaben in einem großen Protokoll
cat *.log > _one_big.log
säubern:
rm -f *.raw.pbm
rm -f *.pbm
rm -f *.djvu
rm -f *.log
Konvertieren von PostScript-Dateien (PDF, PS, EPS)
DjvuLibre enthält djvudigital
, ein Werkzeug, das Ghostscript verwendet, um PDF- und andere PostScript-Dateien direkt in das DjVu-Format zu konvertieren. Allerdings muss Ghostscript aus dem Quellcode nachgebaut werden, um einen speziellen Treiber einzubinden, der von djvudigital
benötigt wird (er ist Teil der DjvuLibre-Distribution, kann aber wegen widersprüchlicher Open-Source-Lizenzen nicht legal als Binärdatei weitergegeben werden). Einmal gebaut, ist es jedoch ein sehr komfortables Werkzeug; es kann sogar PDF-Dateien von Google Books ohne zusätzliche Arbeit konvertieren. Es ist so einfach wie:
djvudigital --words some_book.pdf
Die Option --words sollte enthalten sein, um jeden durchsuchbaren Text, der in der PDF-Datei vorhanden ist, in die endgültige DjVu-Datei zu kopieren. Dadurch können auch Wörter bei der Suche hervorgehoben werden. (Um ein wenig Dateigröße zu sparen, könntest du --lines anstelle von --words verwenden, was die Position jeder Zeile anstelle jedes einzelnen Worts aufzeichnen würde; der Text könnte immer noch nach Wörtern durchsucht werden, aber ganze Zeilen würden in den Suchergebnissen anstelle der einzelnen Wörter hervorgehoben werden. Dies spielt wahrscheinlich keine Rolle bei Karten, Illustrationen usw., wo Wörter über die ganze Seite verstreut sind).
Konvertierung durch DjVu Solo
DjVuSolo ist für Linux mit WineHQ verfügbar. Die Installationsprozedur von Wine HQ ist abhängig von der Distribution und wird unter dem obigen Link beschrieben. Wenn WineHQ installiert ist, lade einfach den Installer von DJVU Solo herunter und starte ihn mit Wine. Öffne den Ordner mit dem Installer im Terminal und führe wine djvusolo3.1-noncom.exe
aus. Normalerweise sind keine Tricks notwendig. Für den Zugriff auf das Dateisystem verwendedas entsprechende Laufwerk in WineHQ (standardmäßig Z).
Siehe auch
- DjVu-Dateien Hilfe bei Wikisource
- DjVu-Artikel in der englischen Wikipedia
- Help:DjVu
- Category:DjVu files
- Template:DjVu
Externe Links
Software
- DjVuLibre package: Open Source, für Mozilla, Firefox, Konqueror, Netscape, Galeon und Opera, LinuxUnix.
- Lizardtech DjVu Browser Plug-in: für WinMac
- WinDjView und MacDjView Desktop Viewer: Open Source, für WinMac
- DjVuOutline: DjVu-Gliederungseditor (Inhalt, Lesezeichen), Open Source, nur Windows
- STDU Viewer: für Windows
- DjVu Viewer: für Windows
- DjVu Solo 3.1, DjVuVersion Command Line Utility, DjVu ActiveX Control für Microsoft Office 2000 (exe, 1.5 Mb): kann unter [http:/djvu.orgresources djvu.org] gefunden werden
- PDF2DJVU Kommandozeilenprogramm zum Konvertieren von Adobe PDF in DjVu-Dateien, für Windows, Mac und *NIXLinux
- PDF nach DjVu GUI, eine grafische Oberfläche für das PDF2DJVU-Kommandozeilenprogramm, für Windows
- Djvu-Spec Pdf 2 Djvu-Konverter, für Windows
- [1], Spacemacs djvu-layer für LinuxMac (sollte auch unter Windows zum Laufen gebracht werden können).
Webseiten
- Downloads & Ressourcen auf djvu.org
- Any2DjVu: Online DjVu-Komprimierungsserver
- MiniDjVu: Open Source DjVu-Kompressor für LinuxUnix und Windows.
- DjVu-Dateierweiterung File-Extensions.org Bibliothek