Commons:Samarbete kring innehållsspridning
Den här sidan är ett stöd för GLAM-institutioner som vill tillgängliggöra sitt material, oavsett om de vill göra det genom Wikimediaprojekten eller andra kanaler. Sidan är i första hand tänkt som ett stöd vid en batchuppladdning till Wikimedia Commons och innehåller en genomgång av vad som behöver göras inför, under och efter samt vem som ska göra det. Förbättra och förtydliga gärna sidan där det behövs, och om du har frågor går det jättebra att ställa dem på diskussionssidan.
Bakgrund
[edit]Många GLAM-institutioner vill ha hjälp med att tillgängliggöra material från sina arkiv och samlingar. Det här är en genomgång av hur det går till, vad som behöver göras och vad ni, Wikimedia Sverige och Wikimediagemenskapen kan göra. Denna sida förutsätter att läsaren redan förstår varför material ska tillgängliggöras under icke-restriktiva licenser.
Inför
[edit]Nedan följer en lista punkter som bör gås igenom och kunna besvaras med ett klart JA för att arbetet med att tillgängliggöra materialet ska kunna gå vidare.
Innehåll
[edit]Material som ska spridas till Wikimediaprojekten måste potentiellt sätt kunna uppfylla ett kunskapsspridande syfte:
- kan verket användas för att illustrera, förklara eller på annat sätt vara informativt. (I stort sett allt kurerat innehåll som finns i ett museums samlingar är relevant. För mer detaljer, se Commons:Project scope.)
Upphovsrätt
[edit]Material som ska spridas till Wikimediaprojekten måste ha fri licens. Dessa kräver att:
- verket är fritt att sprida och använda utan begränsningar.
- verket kan fritt bearbetas och användas för att skapa nya verk.
- verket kan utan begränsning användas i kommersiella sammanhang.
För att säkerställa detta behöver materialet uppfylla en av följande:
- Gammalt nog att ha utslocknad upphovsrätt (PD).
- Egenskapat och uttalat att det är under en fri licens.
- Införskaffat eller mottaget under villkor som säkerställt att materialet är fritt eller där ni äger rättigheterna att släppa det under en fri licens.
Metadata
[edit]Material som ska spridas till Wikimediaprojekten måste ackompanjeras av tillräckligt med metadata för att det ska kunna beskrivas och användas.
- Metadata om objekt ska vara strukturerat och helst länkbart.
- Upphovsrätten för metadatat måste tas i beaktande och den måste också vara under fri licens, gärna CC0 för att kunna användas på Wikidata utan problem.
- Material (bilder, textfiler, ljudklipp eller filmer) som har inbäddat data (till exempel EXIF-data) får inte ha motsägelsefulla uppgifter mellan metadatat och det inbäddade datat.
Mängd och kvalitet
[edit]Allt spridande och tillgängliggörande av material är intressant, men större, unikare och högkvalitativa samlingar är intressantare än material som är begränsat på ena eller andra sättet. Det finns inga egentliga begränsningar för hur mycket material, antal och storlek, som får plats på Wikimediaprojekten. Det viktiga är att:
- samlingen stor nog och uniform nog för att det ska vara enklare att automatisera tillgängliggörandet istället för att göra det manuellt.
- det material ni tillgängliggör av högsta tillgängliga kvalitet.
Vem?
[edit]Efter att ni har svarat JA på alla ovanstående frågor återstår att svara på vem som ska utföra tillgängliggörandet. Det korta svaret är att det gör ni, men inte ensamma.
Varför ni?
[edit]- Ni känner ert material bäst. Ni vet vilken metadata som finns och än viktigare vad den betyder.
- Genom att ni själva är direkt involverade lär ni er verktygen och rutinerna på Wikimediaprojekten vilket i sin tur möjliggör fortsatt eller framtida tillgängliggörande av mer material.
Vem kan hjälpa?
[edit]Wikimedia Sverige
[edit]Vi hjälper gärna institutioner, organisationer, företag eller andra aktörer som vill tillgängliggöra material för vilket de ansvarar. Vi har dock begränsat med tid och resurser och kan därför inte alltid själva hjälpa er. Det är troligare att vi kan hjälpa till om:
- institutionen främst behöver träning men avser att genomföra framtida tillgängliggörande själva.
- materialet är högkvalitativt eller unikt. Dvs. inte redan finns tillgängligt i jämförbart eller bättre format.
- samarbetet främjar ökat tillgängliggörande inom sektorn. Dvs. om en ledande aktör gör det så kan andra i "branschen" haka på.
- samarbetet gäller tillgängliggörande av material inom ett nytt område eller sektor. Exempelvis en annorlunda typ av material som görs tillgänglig eller en ny typ av aktör som tillhandahåller materialet.
I övriga fall kan vi dock försöka förmedla kontakter inom Wikimediarörelsen.
Volontärer
[edit]Det finns gott om kunniga och villiga volontärer inom Wikimediarörelsen. För att ett projekt ska bli lyckat krävs det att ni är en aktiv part. Det underlättar ofta om ni hittar en kontaktperson med ett intresse för just ert material. Volontärer hjälper gärna till i mån av tid och lust men har ofta andra projekt på gång samtidigt. Om ni har behov av en mer fokuserad insats kan det vara värt att fundera på om ni hellre vill anlita någon med en bakgrund i Wikimediagemenskapen.
Under
[edit]När ovanstående är avklarat är det dags att gå vidare med nedanstående aktiviteter. Notera att denna delen skiljer sig för tillgängliggörande av faktauppgifter (se vår sida om Wikidata) samt att tillgängliggörandet av "source"-material kan kräva extra avslutande steg.
Identifiera existerande resurser
[edit]Finns materialet redan online?
[edit]Om materialet (eller metadatan) sedan tidigare gjorts tillgängligt online är det av intresse att materialet på Wikimediaprojekten kan länka tillbaka till originalet. För att underlätta denna länkning är det viktigt att förstå hur dessa webbadresser relaterar till persistent id som är inkluderade i er metadata.
Finns det auktoritetsposter/tidigare mappning?
[edit]Om det redan finns en struktur i metadatat där det kopplats mot olika auktoritetsposter, eller om det sedan tidigare finns mappningar mot Wikimediaprojekten, är det viktigt att även ta med dessa kopplingar i exporten av metadatat.
Analys av metadata
[edit]Innan en mappning mot Wikimediaprojekten kan göras av metadata är det viktigt att först analysera all den relevanta metadatan. För detta måste metadatan vara tillgänglig i ett maskinläsbart format.
En analys gör det möjligt att identifiera vilka delar av metadatat som kan mappas maskinellt och vilka delar som är högst prioriterad att mappa manuellt.
Mappning av metadata
[edit]Mappningen bör alltid vara ett samarbete mellan den som tillhandahåller metadata och Wikimediagemenskapen. Detta då respektive part har bäst förståelse för sitt system och data. Tillsammans kan de lära sig av varandra vilket kan leda till att det senare kan skötas av en av parterna.
- Ingående moment i en mappning
- Analysera data för att avgöra vilka kategorier, mallar etc. som är värda att skapa.
- Identifiera vilken mall som bör användas för informationsstrukturen, alternativt skapa en särskild mall för projektet.
- Identifiera om datat kan formateras på ett sätt som gör informationen tillgängligt för en internationell publik.
- Matcha nyckelord mot (engelskspråkiga) kategorier på Wikimedia Commons, skapa vid behov nya kategorier.
- mappa metadatafält mot fält i den valda mallen.
- Hitta existerande mallar för begrepp och personer.
- Skapa en mall vilken genererar en tillbakalänk till originalet utifrån det persistenta id:et (detta gör det enklare att undvika framtida länkröta).
Förbered filerna
[edit]Filformat
[edit]Wikimedia Commons tillåter enbart material i fria filformat. Som ett resultat av detta kan det krävas att materialet först konverteras till ett tillåtet format. De filtyper som i dagsläget accepteras är:
- Bilder: SVG (för vektorgrafik), PNG (förlustfritt format), JPEG (för fotografier), GIF (men PNG föredras), TIFF (förlustfritt format, men PNG föredras), XCF (tillåter lager och text).
- Ljud: Ogg (som använder FLAC, Speex, Opus eller Vorbis kodekar), WebM (som använder Vorbis), MIDI eller MP3.
- Rekommenderat format är Oga Vorbis.
- Notera att Ogg även kan använda filändelsen .oga.
- Video: WebM (VP8 kodek för video och Vorbis för ljud), Ogg Theora (Theora kodek för video och Vorbis för ljud).
- Notera att Ogg även kan använda filändelsen .ogv.
- Animationer: GIF, APNG, Animerad SVG.
- Skannad text: DjVu och PDF.
- Notera att det finns rekommendationer för när dessa två format kan användas.
- 3D objekt: endast formatet STL.
Inbäddad data (t.ex. EXIF)
[edit]Det kan vara värt att även lägga in viss metadata (t.ex. licens/upphovsrättslig information) direkt i filen i exif/iptc och xml (i xmp-format). Detta gör att metadatan går att få fram även om filen skulle bli skild från den information som visas på Wikimediaprojekten.
- Vi rekommenderar att var fil åtminstone innehåller information om skapare, titeln samt upphovsrättsligt skydd.
- Creative Commons har licensverktyg som medger nedladdning av licenser med ifylld data som xmp, som sedan kan integreras i bildfilerna med till exempel ExifTool.
Bygg infrastruktur på Wikimedia Commons
[edit]För att det tillgängliggjorda materialet ska kunna knytas samman och ges ett enhetligt utseende på Wikimedia Commons krävs det att en viss infrastruktur byggs upp. Vanligt förekommande är:
- En projektsida genom vilken man kan hitta information kring materialet samt bakgrundsinformation om tillgängliggörandet.
- En samlingsplats för diskussion kring materialet.
- En mall för att på informationssidan till var fil göra det tydligt att filen ingår i det aktuella tillgängliggörandet.
- En kategori för att samla allt tillgängliggjort material
- En sida för rapportering av felaktigheter i materialet eller metadatan.
- En institutionsmall med information namn, plats, webbsida och annat relevant.
Testuppladdning
[edit]När detta är färdigt sker testuppladdningar av en mindre mängd material. Detta ger andra aktiva användare av Wikimediaprojekten en möjlighet att komma med synpunkter och förslag på förbättring kring metadatats integrering. Denna process är iterativ och pågår tills dess att integrationen av metadatat har accepterats av gemenskapen. Därefter sker uppladdningen av resterande material.
Efter
[edit]Arbetet med tillgängliggörandet upphör inte med att uppladdningen är slutförd. Dels innebär den ökade synligheten av materialet att eventuella felaktigheter lättare upptäcks, dels finns det stora möjligheter att ta tillvara på förbättringar och kompletteringar som införs.
Sakfel och kompletteringar
[edit]Många fel upptäcks och rättas direkt inom Wikimediaprojekten, andra kan innebära en diskussion mellan experter för att identifiera källan till felaktigheten. För det första fallet kan det vara intressant att bevaka materialet för att rättelser ska komma till nytta i det egna metadatat. I det andra fallet krävs en dialog med den som uppmärksammar felet samt att eventuella rättelser införs även på Wikimediaprojekten.
Eventuella felaktigheter i mappningen som upptäcks bör om möjligt åtgärdas i det uppladdade materialet och uppmärksammas inför eventuellt kommande tillgängliggöranden.
Kompletterande information och översättningar införs ofta på materialets beskrivningssidor. Dessa kan vara intressanta att föra tillbaka i det egna metadatat.
Samarbete
[edit]Tillgängliggörande av material väcker nyfikenhet, intresse och vidare användning och spridning. Där är det bra om den tillgängliggörande institutionen är närvarande och aktiva i diskussioner och kan ta tillvara på ny information samt svara på frågor.
Statistik
[edit]Det finns många verktyg byggda av Wikimediagemenskapen för att ta fram statistik för hur materialet används. Se hur ert material kommit till användning!
Övrigt
[edit]- Commons:Varför Commons behöver media i hög upplösning (engelska)
- Commons:Guide to batch uploading
- Commons:Guide to content partnerships
- http://www.ksamsok.se/om-k-samsok/att-leverera-data/
- http://www.ksamsok.se/wp-content/uploads/2012/03/Process-leverans-av-data-till-K-sams%C3%B6k-120301.png
- Kulturskatter på nätet