Gebruiker:Nikkivgurp/Kladblok

EuroWordNet

bewerken

EuroWordNet was een driejarig Europees project van 1996 tot 1999 dat een systeem van Semantische netwerken voor acht Europese talen ontwikkelde, gebaseerd op WordNet.

In EuroWordNet vertegenwoordigt elk woordnet in de database een specifieke taalkundige structuur, die voor elke taal anders is. De woordnetten zijn onderling met elkaar verbonden door de zogenoemde Inter-Lingual-Index, waarbij soortgelijke concepten in verschillende talen hetzelfde indexitem moeten delen.

De resultaten van het EuroWordNet project zijn wereldwijd openbaar beschikbaar en kunnen verkregen worden met een licentie.

Toepassingen

bewerken

De database van EuroWordNet maakt het mogelijk om bij verschillende talen de lexicologie en de semantische netwerken te vergelijken. Hiermee kan men verschillende vragen beantwoorden, zoals in hoeverre de lexicale semantische netwerken overeenkomen tussen talen, of er een universele ontologie is binnen de talen of hoeveel informatie er kan worden gedeeld tussen de talen.

Bovendien biedt EuroWordNet ook een hoop praktische behoeftes. Zo kan EuroWordNet een hulpmiddel zijn voor het maken van vertaalmachines, het genereren van talen en het leren van talen.

EuroWordNet begon met de talen Nederlands, Italiaans, Spaans, en Engels. De grootte van deze woordnetten, behalve voor het Engels, is ongeveer 30.000 synsets. Een synset is een reeks synoniemen woordbetekenissen. Deze synsets corresponderen ongeveer met 50.000 woordbetekenissen. In een uitbreiding van het project zijn de talen Duits, Frans, Tsjechisch en Ests toegevoegd. De woordnetten van deze talen hebben tussen de 7.500 en 15.000 synsets.

De woordnetten zijn gelimiteerd tot zelfstandige naamwoorden en werkwoorden, alhoewel bijvoeglijke naamwoorden en bijwoorden zijn opgenomen als ze gerelateerd zijn aan een zelfstandig naamwoord of werkwoord. De vocabulaire van de woordnetten bevatten alle generieke en basiswoorden. Dat wil zeggen dat de woordnetten alle betekenissen en concepten kennen die nodig zijn om meer specifieke betekenissen met elkaar in verband te brengen en dat ze alle woorden kennen die het meest voorkomen in de corpora.

bewerken