Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Resultaten/KPIs/KPI10/KPI10 10-05-2021: verschil tussen versies
Verwijderde inhoud Toegevoegde inhoud
Nieuwe pagina aangemaakt met '{{meebezig}} {{:Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Tab header}} == Meting KPI 10 door de KB op 19-01-2021 == We meten '''KPI 10''...' |
(geen verschil)
|
Versie van 10 mei 2021 12:55
Mee bezig Aan deze pagina of deze sectie wordt de komende uren of dagen nog druk gewerkt.
Klik op geschiedenis voor de laatste ontwikkelingen. |
Nieuws | Over onze samenwerking met Wikimedia | Projecten | Evenementen & bijeenkomsten | KPIs | Archief (2013-2014) | Alle pagina's |
Meting KPI 10 door de KB op 19-01-2021
We meten KPI 10: Het gebruik van KB-identifiers in Wikidata, en vice versa. Zie aldaar voor uitleg over hoe en waarom we deze KPI meten.
Uitkomsten
Het aantal Wikidata-items dat een NTA-identificatiecode (P1006) heeft
- Absoluut: Wikidata bevat 486.824 items die een link naar de NTA bevatten.
- Procentueel t.o.v. het totaal aantal Wikidata-items over personen: (486.824/8.882.183)*100 = 5,5%
- Afwijkingen: Er zitten in Wikidata op dit moment 84 'Unique value' violations, dus meerdere Wikidata-items die dezelfde NTA-code hebben. Zie daarnaast ook deze lijst met P1006-mismatches
- Initiatief: Het toevoegen van de eerste batch van 350K+ NTA-identificatiecodes aan Wikidata is een actie van de Wikidata-gemeenschap geweest, zonder overleg met of hulp van de KB.
Het aantal links naar Wikidata in de Nederlandse Thesaurus van Auteursnamen (NTA)
- Absoluut: De NTA bevat 385.945 items die een link naar Wikidata bevatten.
- Procentueel t.o.v. het totaal aantal NTA-items: (385.945/2.743.340)*100 = 14,07%
- Afwijkingen: Er zitten in Wikidata op dit moment 1.801 'Single value' violations, waarbij 1 Wikidata-item meerdere NTA-codes heeft. Voorbeeld Marie Curie.
- Initiatief: Omdat de koppeling tussen Wikidata en de NTA al op Wikidata gedaan was, kon de KB daarna heel makkelijk Wikidata-items aan de NTA toevoegen.
Het aantal Wikidata-items dat een DBNL-identificatiecode voor auteurs (P723) heeft
- Absoluut: Wikidata bevat 21.108 items die een link naar de DBNL bevatten.
- Procentueel t.o.v. het totaal aantal Wikidata-items over personen: (21.764/8.882.183)*100 = 0,24%
- Afwijkingen: Er zitten in Wikidata op dit moment 11 'Unique value' violations, dus meerdere Wikidata-items die dezelfde DBNL-auteurscode hebben.
- Initiatief: Er loopt binnen de Wiki-gemeenschap een langdurige campagne om (d.m.v. de zgn. Mix'n'Match-tool) zowel automatisch als handmatig DBNL-auteursidentificatiecodes aan meer Wikidata-items toe te voegen. Hierbij is de KB/DBNL niet actief betrokken.
Het aantal links naar Wikidata in de Thesaurus Auteurs DBNL
- Absoluut: De DBNL-auteursthesaurus bevat 13.306 items die een link naar Wikidata bevatten.
- Procentueel t.o.v. het totaal aantal DBNLauteurs-items: (13.300/101.784)*100 = 13,1%
- Afwijkingen: Er zitten in de DBNL op dit moment 65 'Single value' violations, waarbij 1 Wikidata-item meerdere DBNLauteurscode heeft. Voorbeeld Jan Pieter Heije. Dat kan óf een fout in Wikidata zijn, of zitten er in de DBNL-auteursthesaurus en dus ook in de website daadwerkelijk meerdere pagina's die over dezelfde persoon (lijken te) gaan (bv. heij007 en heye009)
- Initiatief: Het toevoegen van de eerste batch Wikidata-items aan de DBNL-auteursthesuarus is een actie van de KB geweest.
Analyse en aanbevelingen
Kijkend naar bovenstaande cijfers, kunnen we de volgende conclusies trekken en aanbevelingen doen:
- Pak als KB een actieve en leidende rol op Wikidata rondom deze twee thesauri: ondanks dat de NTA en DBNL-thesauri KB-diensten zijn, is tot nu toe het toevoegen van NTA en DBNL-links aan Wikidata geheel door het initiatief en de inzet van de Wikidata-gemeenschap gebeurd. De KB heeft daar tot nu toe geen actieve en sturende rol in gespeeld. Daardoor is er geen kwaliteitsbewaking en zijn er achterstanden in de synchronisatie ontstaan. Zie het volgende punt.
- Synchroniseer de KB-thesuari met Wikidata (en vv.): Er is een verschil van minimaal 7.459 (=393.094-385.635) links tussen de NTA en Wikidata en van 3.708 (=17.014-13.306) links tussen de DBNL en Wikidata.
- Voorzie meer bestaande Wikidata-items van een NTA en/of DBNL-link: Er is zowel absoluut als procentueel nog veel ruimte om de koppeling tussen bestaande Wikidata-items en de NTA/DBNL-personen te vergroten.
- Voor de DNBL is dat relatief eenvoudig: gebruik Mix'n'Match om zoveel mogelijk van de 63.126 nog niet gekopplede DBNL-auteurs aan Wikidata te koppelen en/of de 20.640 voorgestelde koppelingen te controleren.
- Bovendien krijgen jaarlijks tienduizenden personen een eigen (nieuw) Wikidata-item, dus de KB moet periodiek zoveel mogelijk NTA en/of DNBL-links aan nieuwe Wikidata-items toevoegen. Dit geldt ook andersom, dus voorzie meer NTA en/of DBNL-items van een Wikidata-link.
- Verbeter de bestaande afwijkingen: los op Wikidata de Single value violations, de Unique value violations en de mismatches op Property_talk:P1006/Mismatches op. Dit vergt niet alleen werk aan Wikidata, maar waarschijnlijk ook aan de NTA (en dus ook de KB-catalogus) en aan de DBNL-auteursthesaurus (en dus ook de DBNL-website). Dit is geen eenmalige actie, m.a.w. blijf de Wikidata-afwijkingen periodiek monitoren en corrigeren.