Classificatie: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
opmaak
definitie, formulering
Regel 1:
[[Bestand:Linnaeus - Regnum Animale (1735).png|330px|thumb|[[Carolus Linnaeus|Linnaeus]]' tabel van het dierenrijk uit de ''[[Systema Naturae]]'' (1735)]]
EenOnder '''classificatie''' isverstaat men de activiteiten die leiden tot een [[classificatiesysteem]]: een indeling van verschijnselen, objecten of processen in groepen op grond van overeenkomst of [[verwantschap]] in eigenschappen of kenmerken. Daarnaast verstaat men onder '''classificatie''' het resultaat van die activiteiten: het classificatiesysteem.

Voorwerpen die in dit verband in de [[bibliotheekwetenschap]] niet gemakkelijk geclassificeerd kunnen worden, worden [[realia (classificatie)|realia]] genoemd.
 
== Algemeen ==
Onder classificatie kunnen verschillende zaken worden verstaan:
# ''[[Clusteranalyse]]'';, ''het classificeren''; of ''classificatie in engere zin'': het ontwerpen van een [[classificatiesysteem]] op grond van overeenkomst van [[Object (ding)|objecten]] in hun [[Eigenschap|kenmerk]]en. Hierbij kunnen beschrijvende [[multivariate statistiek|multivariate statistische]] methoden gebruikt worden. Elke "klasse" wordt daarbij door een [[diagnose]] gekarakteriseerd: een opsomming van de onderscheidende, specifieke kenmerken.
# [[Classificatiesysteem]]: het resultaat van de vorige stap, (ook dit heet wel een ''classificatie'' of ''classificatiesysteem''): de in groepen ingedeelde verschijnselen, objecten of processen. Voorbeeld: het [[periodiek systeem]] der [[Chemisch element|elementen]].
# ''[[indexIndex (boek)|indexIndexeren]]eren'', ''[[sorteren]]'', ''[[Diagnose|diagnosticeren]]'', ''[[Identificatie (informatica)|identificeren]]'' of ''[[Determinatie|determineren]]'': het rubriceren van objecten of verschijnselen in een gekozen, reeds bestaand classificatiesysteem, of het vaststellen van de identiteit van objecten volgens één of meer [[Onderscheidingscriterium|criteria]]. Voorbeeld: [[planten]] met behulp van een [[Flora (boek)|flora]].
 
Classificatie in engere zin of clusteranalyse is van nut bij de [[datareductie]], dus bij het opsporen van [[redundantie]] en de samenvatting van gegevens, bij de reductie van [[ruis (signaal)|ruis]], bij het opsporen van [[uitbijter]]s, bij [[modelvorming]] en bij de interpretatie van de samenhang met externe (verklarende, [[onafhankelijke en afhankelijke variabele|onafhankelijke]]) [[variabele]]n zoals omgevingsfactoren.
 
Het is niet strikt noodzakelijk dat een classificatie wordt gemaakt op grond van eenéén specifieke eigenschap (monothetische classificatie). Zo kunnen objecten een groep eigenschappen met elkaar gemeen hebben (polythetische classificatie), zonder dat eenéén specifieke eigenschap bij alle objecten voorkomt. Denk hierbij aan [[syndroom|syndromen]] van eigenschappen. [[Ludwig Wittgenstein|Wittgenstein]] noemt dit soort overeenkomsten 'familiegelijkenissen'. Ook kunnen objecten in een groep worden gezet juist omdat ze niet over een bepaalde eigenschap beschikken. Soms wordt voor classificatie in het algemeen de term '[[taxonomie]]' gebruikt. Hiermee wordt vaak meer specifiek de classificatie van levende wezens bedoeld.
 
Omdat een classificatie een kunstmatige constructie is, zijn de indelingscriteria subjectief. Wel kan worden gezegd dat een classificatie in meer of mindere mate bruikbaar is voor het doel waarvoor deze is gemaakt. Veel verschijnselen kunnen dan ook op verschillende manieren worden geclassificeerd. Een goed voorbeeld hierbij zijn de verschillende biologische classificaties van [[leven|levende wezens]]. Bij de [[taxonomie]] van levende wezens werd oorspronkelijk uitgegaan van uiterlijke vormen, terwijl tegenwoordig de veronderstelde gemeenschappelijke afstamming[[fylogenie]], o.a. af te leiden uit [[Genetica|genetische]] overeenkomsten, als het belangrijkste criterium geldt. De classificatie van de 'Library of Congress' is minder geschikt voor kleine bibliotheken. Een classificatie is meestal beter te gebruiken als de groepen waarin deze is opgedeeld elkaar niet overlappen.
 
In de biologie worden classificatie en ''ordinatie'' vaak als elkaar aanvullende [[Multivariate statistiek|multivariate methoden]] van gegevensverwerking gezien.
 
=== Clusteranalyse ===
{{Zie hoofdartikel|Clusteranalyse}}
Clusteranalyse is ''classificatie in engere zin'': het groeperen in '[[cluster (statistiek)|clusters]]' of 'klassen' van '''[[object (ding)|object]]en''' ([[entiteit]]en, [[individu]]en, operationele eenheden, [[steekproef|monster]]s, opnames, tellingen, ''sample units'', [[relevé]]es) op grond van hun '''[[kenmerk]]en''' (attributen, [[eigenschap]]pen, [[variabele]]n, ''characters'', ''traits'', ''features'', ''cases''). Het resultaat is een ''classificatiesysteem''. OokMeestal worden [[dendrogram]]men gebruikt om het resultaat van clusteranalyse [[Visualisatie|weer te geven]].
 
Er is een grote variatie aan classificatiemethoden te onderscheiden op grond van het al of niet overlappen van de klassen, de af- of aanwezigheid van een [[hiërarchie]], de wijze van opbouw van het [[dendrogram]] en de noodzaak van het vooraf berekenen van de onderlinge verschillen tussen de objecten.
 
Bij het classificeren moeten enkele subjectieve beslissingen worden genomen, zoals bij de keuze van de te clusteren [[object (ding)|object]]en en de keuze van de [[kenmerk]]en, hun aantal en hun weegfactoren[[weegfactor]]en. Daarna moet ook nog gekozen worden uit de verschillende clustermethoden. Het is ook mogelijk niet de objecten, maar de kenmerken te classificeren. Bij sommige methoden gebeurt dit echter gelijktijdig.
 
In de [[biologie]] (met name in de [[systematiek]]) worden beide methoden tegelijk gebruikt bij de classificaties van [[organisme]]n. Het centrale niveau is dat van de [[soort]]. Soorten kunnen weer worden onderverdeeld in lagere [[Taxon|taxa]], zoals [[ondersoort]] en [[Variëteit (biologie)|variëteit]]. Soorten zelf worden samengevoegd in [[Geslacht (biologie)|geslacht]]en en deze weer in [[Familie (biologie)|familie]]s en in taxa van nog hogere rang.