Commons:Structured data/Computer-aided tagging/nl

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Structured data/Computer-aided tagging and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Structured data/Computer-aided tagging and have to be approved by a translation administrator.
Notice Computer-aided tagging is een nieuwe technologie. Soms zijn de voorgestelde tags verkeerd of ongepast. Dit is een verwacht gedrag.

Het hulpmiddel computer-aided tagging is een functie die wordt ontwikkeld door het team 'Structured Data on Commons' om gemeenschapsleden te helpen bij het identificeren en labelen van Depicts (korte beschrijvingen) voor Commons-bestanden. Er zijn tientallen miljoenen zorgvuldig gecorrigeerde bestanden op Commons, maar dit hulpmiddel is nieuw. Met deze functie kunnen van bestaande bestanden hun inhoud gemakkelijk, snel en - als ze zorgvuldig worden gebruikt - nauwkeurig worden beschreven. Om bij te dragen, hoeven redacteuren niet te weten hoe Wikidata werkt of een bepaalde taal spreken. Deze nieuwe functie vraagt gebruikers met suggesties voor "tags", met behulp van een computervisie model, met een menselijke beoordeling. Commons-gebruikers kunnen een speciale pagina op Commons bezoeken en suggereerde afbeeldingstags zien, die kunnen worden geselecteerd om te worden bevestigd of genegeerd. Er worden nooit automatisch tags toegevoegd zonder menselijke betrokkenheid.

Computer-aided tagging helpt bij het vullen van bestanden met gestructureerde gegevens, op hun beurt kunnen deze bestanden worden gevonden met behulp van algemene zoektermen in Special:MediaSearch op een manier die voorheen niet mogelijk was. Dit helpt gebruikers gemakkelijk media te vinden die anders niet gemakkelijk te vinden zijn met behulp van de oude zoekfunctie, die vaak afhankelijk is van specifieke informatie in bestandsbeschrijvingen of categorieplaatsing om bestanden te vinden. Als specifieke informatie ontbreekt, kan het moeilijk tot onmogelijk zijn om veel media op Commons te vinden via de standaard zoekopdracht. Bijvoorbeeld: Peter_iredale_sunset_edited1.jpg verschijnt in een zoekopdracht naar "beach" met behulp van Special:MediaSearch dankzij de "beach" toont de verklaring die is toegevoegd door computerondersteunde tagging; Het wordt helemaal niet weergegeven in een zoekopdracht naar "beach" met behulp van de reguliere zoekopdracht.

Computer-aided tagging is een stand-alone MediaWiki extensie en is geen kerndeel van Commons zelf en sluit aan bij Commons met behulp van Special:SuggestedTags. Aan de back-end zal het hulpmiddel Google Cloud Vision gebruiken voor afbeeldingen van suggesties. Wikimedia gebruikt al de Google Cloud Vision-service in Wikisource OCR, en dit zal op dezelfde manier werken. Dit hulpmiddel is voor geregistreerde, automatisch bevestigde gebruikers. Het is niet standaard ingeschakeld voor een gebruikersgroep en is niet beschikbaar voor nieuwe en niet geregistreerde gebruikers.

Update over het gebruik van CAT/SuggestedTags, september 2020

Status bijgewerkt tot 14 februari 2022:

  1. In het totaal hebben 5,809 gebruikers bewerkingen uitgevoerd via het hulpmiddel Computer-Aided Tagging
    • 962 van deze gebruikers deden dit via mobiel internet
  2. 341.957 totale bestanden zijn bewerkt via Computer-Aided Tagging #:* 41.563 van die bestanden hebben een Computer-Aided Tagging bewerking gehad op mobiel web
  3. 72% van de bestanden met CAT-bewerkingen hadden met bewerkingen die zijn gedaan door dezelfde gebruiker die het bestand had geüpload
  4. Ongeveer 10.000 bestanden die tot nu toe door CAT zijn bewerkt, waren puur handmatige bewerkingen
  5. We hebben nu gemiddeld ongeveer 20 nieuwe gebruikers per week

Grafieken met deze gegevens worden elke maandag bijgewerkt op de pagina CAT-gebruiksrapportanalyse

CAT-specifiek

We werken aan mogelijke technieken om het hulpmiddel te verbeteren om specifieke elementen van foto's nauwkeurig te identificeren, maar het is belangrijk om te onthouden dat het Google Vision-algoritme al vrij goed werkt.

Volgende aanpassingen aan de wachtrij voor algemene beelden

Hoewel het meeste gebruik van het computer-aided tagging systeem komt van gebruikers die hun eigen uploaden bewerken (72%), is er een aparte wachtrij voor "populaire" beelden. Op basis van recente feedback van de Commons-gemeenschap, onderzoeken we manieren om deze wachtrij anders te prioriteren. We overwegen een systeem dat zich meer richt op bestanden die nog geen categorieën hebben.

Google Cloud Vision

Alle informatie die door Google Cloud Vision gaat, zal ook openbaar zijn. Er zullen volledig anonieme gegevens beschikbaar zijn die het Commons-bestand, de gesuggereerde tags en welke tags zijn geaccepteerd, vermelden. Google Cloud Vision is volledig geïsoleerd van Wikimedia Commons, de functie is gescheiden van de kern van Commons.

Hoewel er open source computervisieplatforms beschikbaar zijn om mee te beginnen, zou elk van deze pakketten middelen of gespecialiseerde expertise vereisen om een industrie-standaard ervaring met computervisie te bieden die de Wikimedia Foundation op dit moment zelf niet kan bieden. Het team erkent dat Google Cloud Vision geen open source software is. Er zal geen vrije of eigendomscode worden geschreven door de Foundation voor dit project; alle bijdragen blijven open source.[clarification needed] Google heeft geen toegang tot persoonlijke, niet-openbare persoonlijke informatie en er is geen directe communicatie tussen gebruikers en de service van Google.

Architectuur en workflow

Ontwerp van de informatieflow in computer-assisted image tagging. De leverancier van "machine vision" aan de rechterkant vraagt en stuurt potentiële tags voor afbeeldingen; er wordt geen persoonlijke informatie uitgewisseld en de leverancier is geïsoleerd van de rest van het systeem en Commons.

Geregistreerde, automatisch bevestigde gebruikers kunnen zich aanmelden via hun voorkeuren of bestanden uploaden. Na een tijdje wordt de gebruiker gecontacteerd via hun meldingen dat hun uploaden klaar zijn voor tagging op Special:SuggestedTags. Gebruikers die zich hebben ingeschreven, kunnen op elk moment Special:SuggestedTags bezoeken om bestanden te bekijken die klaar zijn voor de verwerking van tags. Anonieme gebruikers, nieuwe gebruikers en gebruikers die niet zijn ingeschreven, kunnen geen toegang krijgen tot Special:SuggestedTags.

De concepten die beschikbaar zijn voor het taggen zijn die vertaald worden van Google Knowledge Graph ID's naar Wikidata ID's. De lijst is te lang om hier te catalogiseren, maar is beschikbaar voor download als freebase-Wikidata koppeling.

Ontwikkelingsfase

Alle oorspronkelijk geplande functies voor het hulpmiddel zijn nu in gebruik en beschikbaar. Het ontwikkelteam zal daarna verder werken aan tweaks en mogelijke nieuwe functies.

Aantekeningen invoering en gebruik

  • Geen persoonlijke informatie wordt naar de provider van het computer vision platform verzonden. Bij de lancering zal deze nieuwe functie alleen het Google Cloud Vision-systeem gebruiken, waartoe men toegang krijgt via een middleware-laag die alle gebruikersgegevens verbergt. Commons-afbeeldingen worden naar Google-servers van de Wikimedia Foundation-servers verzonden. Er zal geen directe communicatie tussen de gebruiker en externe diensten zijn. Er worden geen persoonlijke gegevens (IP, gebruikersnaam, enz.) naar Google-servers verzonden. De middleware die contact opneemt met Google-servers is een Wikimedia-project en open source. Geen enkel deel van de dienst of code van Google zal deel uitmaken van de Wikimedia-infrastructuur.
  • De suggesties van de computer vision worden pas toegevoegd aan de gestructureerde data van een afbeeldingsbestand nadat de gebruiker deze heeft geverifieerd: deze dienst wordt aangeboden als een middel om menselijke activiteit te vergroten, niet om die te vervangen. Alle suggesties van de computer vision worden opgeslagen in een aparte, gespecialiseerde database. Aanbevelingen worden niet opgeslagen als gestructureerde data in het Commons-bestand totdat een gebruiker ze bevestigt.
  • Gebruikers kunnen ervoor kiezen om meldingen te ontvangen waarin wordt gewaarschuwd dat hun recente uploaden voorgestelde tags hebben gekregen. In de laatste stap van het UploadWizard-uploadproces hebben gebruikers de mogelijkheid om meldingen in te schakelen die hen informeren wanneer de recent geüploade bestanden de wachttijd hebben overschreden en tags beschikbaar zijn voor bevestiging. Deze optie is ook te vinden in de Voorkeuren van de gebruiker op tabblad Meldingen.
  • Gebruikersbijdragen die de suggereerde afbeeldingen bevestigen, worden als CC0 gelicentieerd. Deze gegevens zijn gelijkwaardig aan het toevoegen van Wikidata aan een afbeelding en moeten als zodanig worden toegevoegd onder dezelfde CC0-licentie die Wikidata gebruikt. In duidelijke licentiemededelingen worden gebruikers ervan op de hoogte gebracht dat alle bijdragen die via het hulpmiddel computer vision worden geleverd, een CC0 licentie krijgen.
  • Analyse van beelden op Commons: De functie zal alleen beelden analyseren en suggereerde "afbeeldingen" tags geven op basis van de inhoud van die beelden.
  • Bepaalde soorten afbeeldingen zullen worden uitgesloten: Sommige soorten afbeeldingen op Commons zijn niet geschikt voor dit type systeem. Kleine beelden (minder dan 100px breed), kunstwerken (geïdentificeerd via het sjabloon Artwork), gescande boekpagina's en andere bestanden zullen niet worden opgenomen.
  • Onlangs geüploade bestanden worden geanalyseerd, maar niet tijdens de upload: Commons-gebruikers volgen voortdurend nieuwe bestanden op vandalisme, auteursrechtelijke schendingen en relevantie voor het project. Bestanden die niet aan de criteria voldoen, worden dan gemarkeerd voor verwijdering. De nieuwe computer vision functie zal nieuwe bestanden alleen analyseren nadat een wachttijd is verstreken en zal geen bestanden analyseren die voor verwijdering zijn gemarkeerd.
  • Alle bevestigingen van tags worden weergegeven als regelmatige gestructureerde gegevensbewerkingen met een tag bewerkingssamenvatting die hun oorsprong identificeert als het hulpmiddel computer vision: Dit maakt alle gebruikelijke herstel- en moderatie acties mogelijk zodat wijzigingen kunnen worden verbeterd, bewerkt of omgedraaid. Het helpt ons ook om de mate van terugdraaien te meten en ervoor te zorgen dat bewerkingen die met CAT worden gemaakt, niet vaker worden omgedraaid dan de gemiddelde bewerking.
  • Problematische tags kunnen worden geblokkeerd om te worden voorgesteld: Er is een blokkeerlijst van tags die niet voorgesteld zullen worden door het hulpmiddelen voor het taggen. De officiële blokkeerlijst bestaat nu in het configuratie-bestand voor Commons en kan niet direct worden bewerkt door de gemeenschap, maar suggesties kunnen worden gedaan op de overlegpagina van de blokkeerlijst.

Gebruikersbox

U kunt deze Gebruikersbox gebruiken op uw gebruikerspagina.

{{User Computer-aided tagging}}
links talk view

This user uses Computer-aided tagging tool for tagging images.

Dit is een mislukt project

Al op 13 februari 2020 klaagden ervaren Commons-gebruikers dat het grootste deel van de tags die met dit hulpmiddel werden toegevoegd, zoals iemand het uitdrukte, "veel te vaag, irrelevant of zelfs schadelijk" waren. Na talloze van dergelijke klachten in de komende jaren, erkende de Sr. Director van de WMF Product-afdeling op 16 juni 2023 [1] dat "We begrijpen dat de nauwkeurigheid en bruikbaarheid van de tags die hiermee worden gegenereerd, in twijfel zijn getrokken." Na wat studie, op 14 september 2023 kondigden ze aan, "zullen we het hulpmiddel op 20 september 2023 deactiveren, na het voltooien van de nodige codewijzigingen."