Wikipedia:De kroeg/Archief/20180731


Koppelen van Thesaurus Audiovisuele Archieven en Wikidata bewerken

Dag allen,

(Als berichten over Wikidata hier niet thuishoren: mijn excuses.)

Ik wil jullie graag attenderen op een projectje op Wikidata. Binnen dit project proberen we de thesaurus die (onder andere) Beeld en Geluid gebruikt voor haar catalogusbeschrijvingen te koppelen met Wikidata. Aangezien de thesaurus Nederlands is, zijn deze koppelingen het eenvoudigst te maken door Nederlands-sprekenden. Als je het leuk vindt om een handje te helpen vind je op de projectpagina meer informatie, we hebben ons best gedaan het zo eenvoudig mogelijk te maken. Je kunt trouwens entreekaartjes voor het museum van Beeld en Geluid winnen én een exclusieve rondleiding door het gebouw en de depots van Beeld en Geluid. We hopen op basis van deze koppeling met Wikidata beter in staat te zijn collectie-onderdelen te identificeren die in het publieke domein zijn tbv contentdonaties naar Wikimedia Commons. Ook hopen we in de toekomst de gekoppelde data te kunnen gebruiken om data in ons beheer over Nederlandse mediageschiedenis te kunnen doneren aan Wikidata. Daarnaast biedt de gekoppelde data prachtige mogelijkheden voor onderzoekers die mediageschiedenis in ons archief onderzoeken. Dank voor jullie werk! 85jesse (overleg) 23 jul 2018 16:09 (CEST)[reageren]

Mijn eerste bevinding, het koppelen aan wikidataelementen is moeilijker, dan het lijkt. Twee willekeurige namen uit de lijst 'Jan Carmiggelt' (schrijver, 1909 en 1943) en 'Mauricio Pinilla' (voetballer, 1977 en 1984). Volgens mij zie ik bij GTAA (voorbeeld) alleen maar naam en beroep. Ldhank (overleg) 24 jul 2018 09:29 (CEST)[reageren]
Inderdaad, er ontbreekt heel wat context. Van beeld- en geluidsfragmenten is toch bekend waar en wanneer ze zijn geregistreerd? Die Pinilla is waarschijnlijk de jongere, omdat die een internationale carrière heeft, maar als het om een interview in Bolivia in 2007 gaat, is het vrijwel zeker de oudere. –bdijkstra (overleg) 24 jul 2018 10:00 (CEST)[reageren]
Dag bdijkstra en Ldhank, bedankt voor jullie feedback. In onze catalogus wordt Pinilla inderdaad genoemd in de context van het Chileense nationaal team en Portugese voetbalclubs. Carmiggelt is lastiger, daar ga ik nog even in duiken.

Binnen Mix'n'match hebben we de GTAA, waar mogelijk, uitgebreid met extra termen. De zgn scopenote van de GTAA bevat inderdaad vaak alleen een beroep. De 'extracted terms' die je binnen Mix'n'Match ziet komen uit onze catalogus. Uiteraard is er soms per individueel persoon wel meer informatie te vinden (zoals inderdaad de uitzenddatum van programma's waarin hij/zij voorkomt), maar het is ondoenlijk om voor elk van de 120.000 individuele personen die relevante informatie uit de catalogus te extraheren. Uitzenddata zijn namelijk lang niet altijd relevant voor het maken van onderscheid. We verwachten dan ook dat er een flink aantal termen nog steeds niet te linken zal zijn, maar met de 'extracted terms' hopen we dat aantal verder te beperken. Groet! 85jesse (overleg) 24 jul 2018 10:55 (CEST)[reageren]

Overigens is onze catalogus hier te doorzoeken, voor het geval je extra moeite wilt doen. Anders mag je de items overslaan waarvoor je niet voldoende informatie kunt vinden, dan kijken we later of we die link zelf kunnen leggen of dat we meer context kunnen bieden. Dank!85jesse (overleg) 24 jul 2018 10:58 (CEST)[reageren]

24 jul 2018 11:44 (CEST)