Gebruiker:Taka/Categorisatieproblemen
Hier onder een lijstje met problemen van de categorisatie. Vergelijk het met de etalage van Frikimenia. Voeg gerust dingen toe of streep dingen door die inmiddels zijn opgelost.
Zie ook Gebruiker:Taka/Categorie:Internet
Basisproblemen
bewerken- Een belangrijk probleem is dat "alles" op een heleboel verschillende manieren is in te delen: naar kleur, lengte, leeftijd, alfabet, wetenschap, afstand..... In niet alle gevallen is elke indeling even relevant, maar er blijven vrijwel altijd meerdere dimensies over om iets zinvol in te delen. Om soepel met zoveel dimensies om te gaan is een flexibel systeem nodig. Het categorisatiesysteem van de wikipedia is (by design) star.
- De mogelijkheden zijn:
- Categorieën aanmaken die meerdere dimensies in zich hebben. Als (onzinnig maar nuttig) voorbeeld: "Blauwe, lange dingen die ver weg zijn".
- Een artikel in meerdere categorieën plaatsen. Een artikel dat in de hierboven genoemde categorie staat, zou ook in de categorieën categorieën "Blauwe dingen", "Lange dingen" en "Dingen die ver weg zijn" kunnen worden gezet. Of in de categorieën "Blauwe, lange dingen" en "Dingen die ver weg zijn".
- Maar het blijft een mouw die wordt aangepast en geen structurele oplossing. Voor een zinvolle indeling moeten aangemaakte categorieën voldoende onderscheidend zijn, maar ook weer niet zo vergaand dat er per categorie slechts één of twee artikelen zijn. En daarnaast is het ook weer niet de bedoeling dat een artikel in 50 verschillende categorieën wordt gezet - want dat maakt elke categorie op zich nietszeggend en de lijst vermelde categorieën bij een artikel wordt dan ook onoverzichtelijk.
- Alternatieven:
- Het beste zou zijn om te werken met trefwoorden, en de gebruiker de mogelijkheid te bieden te zoeken op elke gewenste combinatie van trefwoorden. Dat kan echter niet - de wikipedia-software biedt daar geen mogelijkheden toe. De wikipedia biedt wel andere mogelijkheden, die ook al worden gebruikt.
- Lijsten. Een alternatief dat al bestond (en gebruikt werd) voor de invoering van categorieën op de wikipedia: aanmaken van lijsten. Het nadeel is dat dat met de hand moet gebeuren, het voordeel is dat elke denkbare doorsnede kan worden gemaakt.
- Portalen, ook met de hand gemaakt en onderhouden, bieden een thematisch overzicht.
- Goede artikelen over brede onderwerpen. Als artikelen over brede onderwerpen goed zijn geschreven, leiden ze de deelonderwerpen in, en verwijzen naar uitgebreidere informatie daarover. De lezer kan lekker doorklikken.
- Sjablonen. Samenhangende onderwerpen krijgen nu al vaak een sjabloon mee, waardoor in elk van die artikelen een lijstje komt te staan van verwante onderwerpen.
- Ok, we moeten het hier doen met de gegeven mogelijkheden. Het punt is dan hoe deze gegeven mogelijkheden het best worden benut. Niet dat daar niet over nagedacht is, er zijn zelfs een aantal voorstellen voor gedaan, zie Wikipedia:Categorisatievoorstel en Overleg Wikipedia:Categorisatievoorstel. Het punt is echter dat deze hele discussie niet tot een besluit heeft geleid. Met als gevolg dat categorieën "vrij" zijn voor eenieder. En ook al zijn er regelmatig overleggen over, er vallen al snel een aantal tekortkomingen op in de huidige categorisatie.
- Een tweede aspect van indeling is het verschijnsel "subcategorie". Bijvoorbeeld bij een indeling volgens "wetenschap" ligt een subverdeling voor de hand. "Ecologie" is een discipline van "Biologie". En "Milieukunde" is een interdisciplinaire wetenschap ("Scheikunde", "Rechten", "Biologie"). Dus het is wenselijk dat de indeling recursief is, dan is deze "subcategorisatie" aan te pakken. Deze mogelijkheid wordt ook geboden in het categorisatiemodel van de wikipedia: een categorie kan als zodanig in een hogere categorie worden gezet. Wat dit betreft heb ik geen aanmerkingen.
Soort problemen
bewerkenEr kunnen verschillende mogelijke problemen met de categorisatie worden onderscheiden:
- Inkonsistente categorieeën. Deze kunnen op verschillende manieren ontstaan, maar kunnen ook het gevolg zijn van een verkeerde keuze van de basiscategorieën (die in mijn zienswijze onafhankelijke dimensies zouden moeten zijn, en elke dimensie zou in eigen basiscategorie moeten hebben).
- Vreemdsoortige categorieën. Categorieën die dusdanig specialistisch zijn dat ze eigenlijk alleen als lijst bestaansrecht hebben. Maar ook categorieën die het artikel rubriceren, en niet het onderwerp van het artikel. Een aantal van artikel, niet onderwerp-categorieën blijken een praktisch nut te hebben, zoals Categorie:Beginnetje.
- Verkeerd gebruik van categorieën. Kan altijd gebeuren, dat een artikel in de verkeerde categorie is ingedeeld. Zolang dat geen patroon is voor een categorie, val ik er niet over.
En dan nog overige problemen, die op verschillende manieren kunnen ontstaan. Hieronder een lijstje met dingen die ik ben tegengekomen.
Inconsistente categorieën
bewerken- Zie Categorie:Alles. Naar mijn idee missen er een aantal basiscategorieën, en dat wreekt zich vervolgens. Dingen zijn bijvoorbeeld in te delen naar wetenschap en naar aard van het beschreven verschijnsel. Deze worden nogal eens verward en gekruist. Er staan bijvoorbeeld categorieën voor Spieren en botten en Hart- en vaatstelsel onder Categorie:Anatomie, waarbij deze laatste categorie duidelijk in de tak van wetenschappen staat. Feitelijk mist er een basiscategorie Categorie:Natuurverschijnsel. Bij gebrek daaraan worden natuurverschijnselen maar onder de wetenschap geplaatst die zich met het verschijnsel bezig houdt.
- Opmerking: dit is niet een algemeen euvel, er zijn bijvoorbeeld wel basiscategorieën voor Categorie:Heelal en Categorie:Techniek. Ik wil hier vooral mee aangeven dat er niet goed is nagedacht over welke dimensies er zijn.
- Categorie:Parasiet. Is een subcategorie van Categorie:Dier naar indeling maar bevat ook planten.
- Categorie:Internet heeft een niet zo logische indeling in subcategorieën. De verschillende subcategorieën zijn ongelijkwaardig. Sommige internetdiensten als Categorie:Nieuwsgroep (Usenet) en Categorie:E-mail hebben een eigen categorie. Maar er is geen categorie Categorie:World Wide Web. Er is wel weer een Categorie:Internetdienst, waar dan artikelen als Internetbankieren en Online dating in staan, maar die ook weer een subcategorie Categorie:Chat heeft. Chatten is een internetdienst op gelijkwaardig niveau als E-mail en Usenet.
- De verwarring heeft ook te maken met de dubbele betekenis van het begrip internetdienst:
- De onderverdeling van internet in e-mail, www, ftp, chat, usenet etc.
- Een niet zo duidelijke gedefinieerde woordsamenstelling die geldig is voor elke dienst die via internet wordt aangeboden.
- Voor velen is het verschil tussen Categorie:Software en Categorie:Softwarepakket onduidelijk. Computerprogramma's worden vrij willekeurig in één van beide categorieën geplaatst.
- De Canarische Eilanden liggen in Afrika. Maar ze horen bestuurlijk bij Spanje. Dus worden ze gecategoriseerd in een subcategorie van Categorie:Europa. Voor andere gebieden is wel een soort van oplossing voor gevonden voor vergelijkbare situaties. Er bestaat een Categorie:Nederlands territorium met o.m. een subcategorie Categorie:Nederlandse Antillen die tegelijkertijd valt onder Categorie:Caraïben. Gebieden moeten eigenlijk (onafhankelijk van elkaar) bestuurlijk en geografisch worden ingedeeld. Maar er is slechts één (geografisch) toplevel voor gebieden: Categorie:Wereld.
- Categorie:Territorium in Afrika toegevoegd aan Categorie:Canarische Eilanden. – gpvos (overleg) 19 jul 2005 09:51 (CEST)
- Overigens: waarom staat de Wereld in Geografie (in de indeling per Wetenschap) en niet in Planeet (als onderdeel van het Heelal). Gezien de verdere (geografische) indeling van de categorie Wereld is zou dat laatste het geval moeten zijn.
- Toegevoegd. Maar de naamgeving blijft gek: je zou de planeet "Aarde" willen noemen, maar de cat bevat ook subcats als Categorie:Imaginaire wereld. – gpvos (overleg) 19 jul 2005 09:51 (CEST)
- De Categorie:Milieu met o.m. artikelen over bodemvervuiling en CO2-opslag is een subcategorie van Categorie:Biologie. De artikelen in de Categorie:Milieu horen niet thuis onder een wetenschap, en dan al zeker niet onder biologie. De milieuproblematiek is een maatschappelijk en geen wetenschappelijk verschijnlijk.
- Overigens zou Milieuproblematiek een betere naam voor de categorie zijn. In tegenstelling tot natuur zijn er met het milieu alleen problemen (en oplossingen daarvoor). Er is geen wetenschap die het milieu als zodanig onderzoekt, Milieukunde houdt zich bezig met milieuproblematiek.
- Categorie:Mens staat in Categorie:Maatschappij. Dat moet andersom. De maatschappij (de samenleving) is het resultaat van menselijk handelen. Een Honingbij hoort toch ook niet gerubriceerd te worden als onderdeel van een bijenkolonie.
- Er is ook de hoofdcategorie Categorie:Persoon, maar die is niet duidelijk te onderscheiden van Categorie:Mens. Het artikel Domineeskind staat in Categorie:Mens (en ook in Categorie:Persoon naar eigenschap), maar de Categorie:Domineeskind staat in een tak van Categorie:Persoon. Het lijkt me een stuk overzichtelijker om de Categorie:Persoon op te doeken en alle subcategorieën daarvan onder Categorie:Mens te zetten.
- Misschien is een categorie:Mens en maatschappij een oplossing voor de verwarring en overlap? Michiel1972 25 apr 2005 21:05 (CEST)
- Lijkt me een goeie oplossing, ik las al dat er een keer zo'n suggestie was gedaan.Taka 25 apr 2005 21:15 (CEST)
- Misschien is een categorie:Mens en maatschappij een oplossing voor de verwarring en overlap? Michiel1972 25 apr 2005 21:05 (CEST)
- Onder Categorie:Militaria valt van alles wat maar enigszins met leger en oorlog te maken heeft, inclusief Categorie:Oorlog, Categorie:Spion etc. Het woord Militaria staat niet in de online vandale, en uit de context op google blijkt dat het woord eigenlijk uitsluitend gebruikt wordt voor dingen die verzameld kunnen worden en die in verband staan met militairen.
Vreemde categorieën
bewerken- Categorie:Pseudoniem. (categoriseert het artikel, en niet het onderwerp). Moeten daar alleen artikelen in waarbij het artikel onder een pseudoniem staat, zoals Multatuli? En niet artikelen waarbij een persoon bekend is onder een pseudoniem, maar het artikel onder de werkelijk naam staat, zoals Willem van den Hout (die vooral bekend staat onder zijn pseudoniem "Willy van der Heide", maar nog een aantal andere pseudoniemen gebruikte). Dit laatste geeft een ander probleem aan: wat te doen met iemand die meerdere pseudoniemen gebruikt.
- Categorie:K.U.Leuven-alumnus. Gaan we van elke universiteit een dergelijke categorie maken? Dit is nou typisch iets voor een lijst, en niet voor een categorie. Hetzelfde geldt voor Categorie:Genocideslachtoffer en Categorie:Terrorismeslachtoffer.
- Met enige verbazing heb ik gekeken naar de indeling van de Categorie:Wetsovertreder.
- Categorie:Hoofdportalen. Afgezien van het feit dat het Categorie:Wikipedia:Hoofdportaal zou moeten zijn (want het gaat over een metaindeling), is dit een goed voorbeeld van te ver doorgeschoten categorisatiedrang. Het streven is kennelijk om elk artikel in categorie onder te brengen. Echter, de Hoofdpagina biedt een veel beter overzicht van de portalen. Om het nog erger te maken zijn er subcategorieën als Categorie:Wikipedia:Portalen archief en Categorie:Wikipedia:Portalen artikel van de week (consequent zou zijn Categorie:Wikipedia:Portaal:Archief en Categorie:Wikipedia:Portaal:Artikel van de week).
- Het is soms interessant om te weten wat het beroep van iemands vader was. Maar een Categorie:Slagerszoon ?? Komt er ook een Categorie:Slagersdochter? Er is al wel een Categorie:Domineeskind. Als de aldus gecategoriseerde personen iets gemeenschappelijk hebben vanwege het beroep van hun vader, dan is het interessant om er een artikel van te maken, met desnoods een lijstje bekende "domineeskinderen" of "slagerszonen". Maar een categorie heeft hier niets te zoeken.
- Nee maar, het is er dan van gekomen, de Categorie:Nog te categoriseren waarin het artikel Probleem wel een heel terechte plek heeft. De categorie is een subcategorie van de een andere mooie categorie: Categorie:Wikipedia:Pagina's waar iets mee is.
- Weer een mooie ontdekt: Categorie:Geleuter.
Logisch juiste categorieën, maar toch
bewerkenWalvissen vallen taxonomisch in dezelfde groep als de Hoefdieren, maar het is toch een beetje raar dat bij bijvoorbeeld de Dolfijn staat: Categorie:Hoefdier.
Antropocentrisme
bewerken- Artikelen worden te snel gezien als betrekking hebbend op de mens, terwijl het beschreven onderwerp breder is. Zo bestaat er een Categorie:Geneeskunde (met subcategorieën) waar een aantal artikelen in geplaatst is dat echt niet alleen met de mens te maken heeft, en onder Biologie vallen, bijvoorbeeld: Endemisch, Biologische klok, LD50, Hormoon (het artikel is in dit geval ook antopocentrisch, er bestaan ook plantenhormonen), Nobelprijs voor de Fysiologie of Geneeskunde (wordt meestal uitgereikt aan biologen), Embryologie, Rudimentair (mogelijk alleen in deze categorie opgenomen vanwege de appendix), Pathogeen.
- Zelfs het artikel mes is ingedeeld in de Categorie:Medisch instrument, terwijl een medisch mes een Scalpel heet.
- De Categorie:Plantenanatomie is een subcategorie van de Geneeskunde.
- Niet direct. Wel via categorie:Anatomie. Michiel1972 25 apr 2005 21:07 (CEST)
Helemaal loos
bewerkenIk kwam dit nog tegen op Overleg:Lijst van lijsten van burgemeesters en heb het hierheen verplaatst, hier staat het beter.
Laten we een Categorie:Categorie aanmaken, of een Lijst van categorieën. Binnenkort ook op deze wikipedia: Portaal:Portalen, Portaal:Categorieën op de Wikipedia, Lijst van Portalen, Categorie:Portaal (sterker nog, we hebben al een Categorie:Hoofdportalen, en dingen als Categorie:Wikipedia:Portalen archief). Wat te denken van een Lijst van Portaalcategorieën, een Portaal:Lijsten.
Om kort te gaan: iedereen probeert zijn eigen ordening aan te brengen, en de argumentatie "mijn geliefde ordening is beter dan de jouwe" is net zoiets als wie het verst kan spugen. Taka 5 apr 2005 10:56 (CEST)
- Hier staat het inderdaad beter, te meer omdat het je eigen toevoeging was op Overleg:Lijst van lijsten van burgemeesters. HenkvD 18 jun 2005 15:05 (CEST)
- Oh leuk is dit: Categorie:Artikel op Portaal:Informatica, Categorie:Complete lijsten (ter onderscheid van Categorie:Lijsten waar ook artikelen op staan die nog niet aangemaakt zijn), Categorie:Alfabetische gesorteerde lijsten, Categorie:Chronologisch gesorteerde lijsten, Categorie:Lijsten die op andere wijze gesorteerd zijn, Categorie:Lijsten die in artikelen staan en die wegens auteursvermelding niet verplaatst kunnen worden naar een eigen lemma.
- Taka 5 apr 2005 11:13 (CEST)