Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Resultaten/KPIs/KPI10: verschil tussen versies

:* We gaan er vanuit dat elk DBNLauteurs-item (via de NTA) precies 1 link naar Wikidata heeft. Waar dit niet het geval is, zal de KB zich [[Wikipedia:GLAM/Koninklijke_Bibliotheek_en_Nationaal_Archief/Resultaten/KPIs/KPI10/KPI10_07-02-2020#Analyse_en_aanbevelingen|actief inzetten]] om deze afwijkingen strak te trekken.
:* ''Absoluut'': De DBNL-auteursthesaurus bevat geen directe links naar Wikidata, maar wel naar de NTA (zie [http://data.bibliotheken.nl/sparql?default-graph-uri=&query=select+*+where+%7B%0D%0A+%3Fdbnl_met_nta_id+foaf%3AisPrimaryTopicOf%2Fvoid%3AinDataset+%3Chttp%3A%2F%2Fdata.bibliotheken.nl%2Fid%2Fdataset%2Fdbnla%3E+.%0D%0A+%3Fdbnl_met_nta_id+owl%3AsameAs%2Ffoaf%3AisPrimaryTopicOf%2Fvoid%3AinDataset+%3Chttp%3A%2F%2Fdata.bibliotheken.nl%2Fid%2Fdataset%2Fpersons%3E+.%0D%0A%7D&format=text%2Fhtml&timeout=0&debug=on&run=+Run+Query+ deze sparql-query]). De NTA bevat op zijn beurt dan wel directe links naar Wikidata, zie bij 2). M.a.w., we gebruiken de NTA dus als tussenstap om het aantal DBNL-personen met een (indirecte) Wikidata-link te meten. We voeren daartoe onderstaande query in de [http://data.bibliotheken.nl/sparql SPARQL-zoekinterface] van data.bibliotheken.nl uit:
SELECT count(?nta) as ?aantal WHERE {
?dbnl foafschema:isPrimaryTopicOfmainEntityOfPage/voidschema:inDatasetisPartOf <http://data.bibliotheken.nl/id/dataset/dbnla> .
?dbnl owl:sameAs ?nta .
 
?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> .
?nta schema:sameAs ?wikidata .
FILTER(regex(?wikidata,nta 'schema:sameAs ?wikidata', 'i')).
FILTER(regex(?wikidata, 'wikidata', 'i'))
}
}
:* ''Procentueel'': Het [http://data.bibliotheken.nl/doc/dataset/dbnla actuele totaal aantal DBNLauteurs-items] is ook bekend (kijk onderaan bij ''Inverse relaties --> is void:inDataset van''), dus het procentuele cijfer is ook eenvoudig te bepalen.
:* Om de exacte concordantie tussen DBNL, NTA en Wikidata te zien, doen we de volgende query: (we zien de eerste 1000, haal 'LIMIT 1000' weg om alle resultaten te zien, kan dan wel even duren)