Commons:OpenRefine
Über | How-to: Dateien hochladen | How-to: Dateien bearbeiten | Tipps und Tricks für Fortgeschrittene | Schulung | Projekte |
OpenRefine ist ein freies und quelloffenes (FOSS) Werkzeug, mit dem du (stapelweise) Dateien auf Wikimedia Commons bearbeiten und hochladen kannst. OpenRefine fokussiert sich auf das Hinzufügen und Bearbeiten von strukturierten Daten. OpenRefine ist als Cloud-Dienst auf PAWS für Wikimedia-Benutzer verfügbar.
-
Ein typisches Wikimedia-Commons-Projekt in OpenRefine
-
Ein Schema in OpenRefine, mit dem Bearbeitungen auf Wikimedia Commons vorbereitet werden.
Diese Seite sammelt Informationen über OpenRefine für die Community von Wikimedia Commons.
- OpenRefine für Wikidata: Wikidata:Werkzeuge/OpenRefine
- Allgemeine Informationen über OpenRefine für Wikimedianer: OpenRefine
Häufig gestellte Fragen
- Ich habe Probleme mit der Installation / dem Öffnen von OpenRefine auf meinem Computer. Was soll ich tun?
Du kannst die letzte stabile Version von OpenRefine auf ihrer Website herunterladen. Das OpenRefine-Handbuch enthält detaillierte Installationsanweisungen; stelle sicher, diese zu lesen.
- Wenn du Windows nutzt, stelle sicher, dass du das OpenRefine-Kit mit eingebettetem Java installierst.
Einige Nutzer können OpenRefine nicht installieren, beispielsweise wegen Problemen mit ihrer Firewall oder weil ihre Organisation oder ihr Unternehmen ihnen nicht die Installation externer Software erlauben. In diesem Fall kannst du die Wikimedia-Cloud-Version von OpenRefine auf PAWS nutzen, die woanders auf dieser Seite beschrieben wird.
- Erlaubt OpenRefine das Hochladen aller Arten von Dateien, die Wikimedia Commons unterstützt?
OpenRefine unterstützt alle Arten von Medien-Dateien, die auf Wikimedia Commons hochgeladen werden können. Es unterstützt nicht das Hochladen von Daten-Dateien.
Viele Werkzeuge, darunter OpenRefine, haben gelegentlich Probleme mit dem Hochladen von TIFF-Dateien.
Bitte beachte, dass OpenRefine das Hochladen von lokalen Dateien einer Größe von bis zu 100 MB unterstützt, nicht von größeren Dateien. Es ist jedoch möglich, über die URL größere Dateien hochzuladen.
- Was ist die maximale Dateigröße, die mit OpenRefine auf Wikimedia Commons hochgeladen werden kann?
OpenRefine unterstützt (noch) nicht das Hochladen in Blöcken und erlaubt derzeit nur das Hochladen von Dateien von deinem lokalen Gerät mit einer Größe von bis zu 100 MB. Siehe GitHub-Problem (Hilfe bei der Behebung dieses Problems ist sehr willkommen). Das Hochladen größerer Dateien auf Wikimedia Commons ist über URLs aus dem Internet möglich. Wenn dies keine Option für dich ist, nutze bitte Pattypan oder den Hochladeassistenten.
- Wie viele Dateien kann ich in einer Sitzung oder einem Projekt hochladen? Kann ich mehrere 10.000 oder sogar 100.000 Dateien auf einmal hochladen?
OpenRefine kann leicht mit Datensätzen von bis zu mehreren Tausenden (potenziell Hunderttausenden) Zeilen mit Daten umgehen. Der limitierende Faktor ist die Geschwindigkeit des Hochladens von Dateien auf Wikimedia Commons, was über die Wikimedia-Commons-API geregelt wird. Um auf einmal tausende Dateien (oder mehr) hochzuladen, brauchst du Geduld und du musst OpenRefine geöffnet halten.
- Kann OpenRefine eingebettete Metadaten aus Dateien (wie EXIF-Metadaten) abrufen?
Dies ist innerhalb von OpenRefine nicht möglich. Wir empfehlen die Nutzung des EXIF-Werkzeugs https://exiftool.org. Dieses YouTube-Video erklärt den Prozess ziemlich genau.
- Was sind die Vor- und Nachteile davon, OpenRefine lokal auszuführen? Was sind die Vor- und Nachteile der Cloud-Version (PAWS) von OpenRefine?
Wenn du OpenRefine lokal (auf deinem Computer) ausführst:
- Auf deinem eigenen Computer wird es für dich insbesondere einfacher sein, wenn du Dateien auf Wikimedia Commons hochladen möchtest. Du kannst Dateien von deiner eigenen Festplatte hochladen. Dies ist auf PAWS nicht möglich.
- Auf deinem eigenen Computer kannst du verschiedene Aufgaben (insbesondere Datenbereinigung und Vereinigung/Aufteilung von Daten) ohne Internetverbindung ausführen. Du benötigst eine Internetverbindung, sobald du einen Abgleich vornehmen und Daten und Dateien auf Commons und Wikidata hochladen möchtest.
Wenn du OpenRefine in der Cloud (über Wikimedia PAWS) ausführst:
- Die Cloud-Version ist bequem, wenn du nicht einfach neue Software auf deinem Computer installieren kannst.
- Du benötigst hierfür immer eine Live-Internetverbindung.
- Mit dieser PAWS-/Cloud-Version ist es nicht möglich, Bilder von deinem lokalen Computer hochzuladen.
- Allgemeine Links
- Website von OpenRefine: https://www.openrefine.org/
- OpenRefine herunterladen: https://openrefine.org/download.html
- Wikimedia-Commons-Erweiterung für OpenRefine herunterladen und installieren: https://github.com/OpenRefine/CommonsExtension
- Allgemeine Dokumentation zu OpenRefine: https://openrefine.org/docs
- Sprich über OpenRefine mit seiner Community und Wikimedia-Benutzern
- Stelle Fragen im Forum der OpenRefine-Community: https://forum.openrefine.org - Klicke hier, um einen neuen Beitrag im OpenRefine-Forum zu veröffentlichen
- Telegram-Gruppe für Wikimedianer, die OpenRefine nutzen: https://t.me/+Qc23Jlay6f4wOGQ0
- Fehlerberichte und Funktionsanfragen
- Auf GitHub (für OpenRefine allgemein): Veröffentliche eine Funktionsanfrage auf GitHub
- Im Wikimedia-Phabricator (hauptsächlich für den Abgleich mit Wikimedia Commons): Veröffentliche einen Fehlerbericht im Phabricator
426.207 Dateien wurden mit OpenRefine hochgeladen.
- Bearbeitungen auf Wikimedia Commons mit OpenRefine 3.7
- Auf Wikimedia Commons mit OpenRefine hochgeladene Dateien
- Hochgeladene Dateien pro Monat
- Letzte Stapel auf Wikimedia Commons mit OpenRefine (über EditGroups)
- Weitere Metriken
Lerne, OpenRefine für Wikimedia Commons zu nutzen: WikiLearn-Kurs
Dieser Online-Kurs ist für jeden mit einem Wikimedia-Konto jederzeit kostenlos verfügbar. Er kann in der eigenen Geschwindigkeit mit maschinell ausgewerteten Aufgaben bearbeitet werden. Durchschnittlich werden 6 bis 8 Stunden benötigt, um den Kurs zu absolvieren.
Dateien mit OpenRefine (Version 3.7) auf Wikimedia Commons hochladen
Zum Hochladen von Dateien auf Wikimedia Commons benötigst du OpenRefine 3.7. Das Hochladen auf Wikimedia Commons wird in OpenRefine 3.6 und älteren Versionen nicht unterstützt.
Befolge die Schritt-für-Schritt-Anleitung zum Bearbeiten von Dateien auf Wikimedia Commons mit OpenRefine.
Dateien auf Wikimedia Commons mit OpenRefine (Version 3.6 und neuer) bearbeiten
Zum Bearbeiten von Wikimedia Commons benötigst du OpenRefine 3.6 oder neuer. Wikimedia Commons wird in OpenRefine 3.5 und älteren Versionen nicht unterstützt. Es wird sehr empfohlen, auch die Wikimedia-Commons-Erweiterung von OpenRefine zu installieren.
Befolge die Schritt-für-Schritt-Anleitung zum Bearbeiten von Dateien auf Wikimedia Commons mit OpenRefine.
Tipps und Tricks für Fortgeschrittene
Es gibt auch eine Seite mit Tipps und Tricks für Fortgeschrittene, die weitere Anweisungen zum Arbeiten mit Manifesten und zum Abgleichen, zum Abrufen von EXIF, speziellen GREL-Rezepten und mehr enthält. Füge deine eigenen hinzu!
OpenRefine installieren und ausführen
Als lokale Anwendung auf deinem Computer
OpenRefine kann als Anwendung heruntergeladen werden und funktioniert auf Desktop- und Laptop-Computern mit den Betriebssystemen Windows, Mac und Linux. Es führt einen kleinen Server auf deinem Computer aus und du nutzt dann einen Webbrowser um damit zu interagieren. Am besten funktioniert es mit Browsern, die auf Webkit basieren, wie Google Chrome, Chromium, Opera und Microsoft Edge, außerdem wird es auf Firefox unterstützt.
Du kannst OpenRefine hier herunterladen. Installationsanweisungen sind im Benutzerhandbuch von OpenRefine verfügbar.
Wikimedia-Commons-Erweiterung für OpenRefine
Zusätzlich kannst du auch die Wikimedia-Commons-Erweiterung für OpenRefine installieren. Dies ist nicht notwendig, aber hilfreich für die Stapelbearbeitung von Wikimedia Commons. Sie bietet:
- Einen Startbildschirm zum direkten Laden von Dateinamen aus den Kategorien von Wikimedia Commons.
- Vorschaubilder von Commons-Dateien (es werden noch nicht alle Dateiformate unterstützt).
- Mehrere spezielle GREL-Ausdrücke zum Abrufen von Daten aus Wikitext zur weiteren Verarbeitung.
Download- und Installationsanweisungen sind auf https://github.com/OpenRefine/CommonsExtension verfügbar.
In der Cloud (über Wikimedia PAWS)
Wenn du OpenRefine nicht auf deinem Computer installieren kannst oder es sehr langsam läuft, kannst du es auch in der Cloud verwenden (auf wmcloud.org über PAWS). Jeder mit einem Wikimedia-Konto kann hier auf OpenRefine zugreifen. Besuche https://hub-paws.wmcloud.org/, melde dich an und klicke auf das OpenRefine-Logo (blauer Diamant).
Die Wikimedia-Commons-Erweiterung (oben erwähnt) ist in OpenRefine auf PAWS installiert. Bitte beachte: Mit OpenRefine auf PAWS ist es NICHT möglich, Dateien von deinem lokalen Computer auf Wikimedia Commons hochzuladen.
Demo: OpenRefine auf Wikimedia PAWS starten
OpenRefine auf PAWS wird nicht vom OpenRefine-Team verwaltet. Wenn du Fragen oder Kommentare zu diesem Dienst hast, kannst du ein Ticket im PAWS-Projekt im Phabricator einreichen oder auf der Diskussionsseite eine Frage stellen.
Logbuch vergangener Aktivitäten, Präsentationen...
Wann | Aktivität | Links |
---|---|---|
Juli 2023 - Juni 2024 | Schulungs- und Nachhaltigkeitsprojekt zu OpenRefine und Wikimedia Commons (finanziert aus Mitteln der Wikimedia Foundation) | |
13. August 2022 | Tutorial: Stapelweises Hochladen auf Wikimedia Commons mit OpenRefine bei der Wikimania 2022 | Etherpad / Videoaufzeichnung |
9. Juni 2022 | Tutorial OpenRefine und SDC-Bearbeitung, Wikidata Lab XXXIV | Videoaufzeichnung |
19. Mai 2022 | Einstündiges Demo für Anfänger: Stapelbearbeitung von Wikimedia Commons mit OpenRefine (Tutorial von Sandra Fauconnier), während der Bildbeschreibungswoche | |
März – Juni 2022 | Monatliche OpenRefine-Sprechstunden | Keine Notizen/Aufzeichnungen (die Treffen waren informell) |
22. Februar 2022 | Community-Treffen zu OpenRefine mit Demo der Funktionen für Strukturierte Daten auf Commons | Folien und Aufzeichnung des Treffens |
Juli 2021 - Oktober 2022 | Entwicklung von Wikimedia-Commons-Funktionen für OpenRefine (finanziert durch eine Projektförderung der Wikimedia Foundation) |
|