Wiki labels is zowel de naam voor een softwarepakket als voor een WikiProject. In dit WikiProject produceren we datasets van gelabelde wiki-artefacten en het softwarepakket is erop gericht dat werk te vergemakkelijken. De naam kan in het Engels worden gezien als een zelfstandig naamwoord

We work together on Wikipedia to produce wiki labels for important data.

of als een werkwoord (net als "Wiki loves...")

In order to get the data we need, wiki labels edit quality.

Doel en bereik bewerken

 
Labels logo

Het doel van dit project is het produceren van geëtiketteerde datasets voor dringende behoeften van de Wikipediagemeenschap. Geëtiketteerde datasets kunnen op verschillende manieren worden toegepast, zoals in onderzoek (bijvoorbeeld kwalitatieve analyses van nieuwkomerkwaliteit[1] en interacties tussen redacteurs[2]) en de ontwikkeling van geavanceerde wiki-hulpmiddelen (bijvoorbeeld de modellen gebruikt door ClueBot NG en STiki). Het verzamelen van dergelijke datasets is in het algemeen gesproken moeilijk, omdat het een substantiële investering van tijd en moeite door een kleine groep personen vergt om een voldoende grote dataset te coderen.

Het project heeft betrekking op (1) het identificeren van mogelijkheid om belangrijke, geëtiketteerde datasets te produceren, (2) het zo breed mogelijk verdelen van het werk en (3) het vergemakkelijken en efficiënter maken van het coderen van grote datasets. Zie onze lijst van campagnes om te weten te komen waar we momenteel mee bezig zijn. Als je wilt helpen, voeg je naam dan toe op de deelnemerslijst. Als je een idee hebt voor een geëtiketteerde dataset die je zou willen produceren, informeer dan naar de mogelijkheid op de overlegpagina.

Hoe kan ik meedoen? bewerken

Er zijn een paar manieren waarop je kunt bijdragen aan dit projecten.

Labellen
Dit project draait om het toevoegen van labels aan artefacten op Wikipedia. Voor de meeste campagnes moet een zeer groot aantal observaties geëtiketteerd worden om een toepasbare dataset te verkrijgen. Het effectief verdelen van dit werk is dus een van de doelen van dit project. Als je interesse hebt om bij te dragen, voeg je naam dan toe aan de lijst met deelnemers.
Programmeren
Bugs repareren, nieuwe functies implementeren en systeemprestaties verbeteren. "Pull requests" zijn van harte welkom! Zie de repository
Administratie
Campagnes laden

Partnerprojecten bewerken

Revision scoring as a service bewerken

 
Revision scoring logo

Veel van Wikipedia's krachtigste hulpmiddelen zijn afhankelijk van automatische classificatie van de kwaliteit van bewerkingen. De opzet van dit project is een publiek opvraagbare API van automatisch geclassificeerde scores voor bewerkingen. Wij geloven dat het aanbieden van een dergelijke dienst de bouw van nieuwe, krachtige wiki-tools en uitbreiding van huidige hulpmiddelen naar nieuwe wiki's veel makkelijker maakt. Om zulke krachtige classificatoren te bouwen moeten we beginnen met gelabelde data van hoge kwaliteit. Dat is de taak van Wiki labels. Zie Wikipedia:Labels/Kwaliteit van bewerkingen.

 
ORES logo

Ontwikkelaars van wiki-tools zullen hoofdzakelijk gebruikmaken van dit project middels een restful webservice en scoresysteem dat wij ORES (Objective revision evaluation service) noemen. ORES biedt een webservice die op aanvraag scores genereert voor revisies. Met https://ores.wmflabs.org/scores/enwiki?revids=34854258&models=reverted vraag je bijvoorbeeld om de score van het teruggedraaide model voor revisie #34854258 in de Engelstalige Wikipedia.

Referenties bewerken

  1. Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. summary full paper
  2. m:Grants:IEG/Editor_Interaction_Data_Extraction_and_Visualization