Classificatie: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
aanpassing
Regel 21:
=== Clusteranalyse ===
{{Zie hoofdartikel|Clusteranalyse}}
Clusteranalyse is ''classificatie in engere zin'': het groeperen in '[[cluster (statistiek)|clusters]]' of 'klassen' van '''[[object (ding)|object]]en''' ([[entiteit]]en, [[individu]]en, operationele eenheden, [[steekproef|monster]]s, opnames, tellingen, ''sample units'', [[relevé]]es) op grond van hun '''[[kenmerk]]en''' (attributen, [[eigenschap]]pen, [[variabele]]n, ''characters'', ''traits'', ''features'', ''cases''). Het resultaat is een ''[[classificatiesysteem]]''. Meestal worden [[dendrogram]]men gebruikt om het resultaat van clusteranalyse [[Visualisatie|weer te geven]].
 
Er is een grote variatie aan classificatiemethoden te onderscheiden op grond van het al of niet overlappen van de klassen, de af- of aanwezigheid van een [[hiërarchie]], de wijze van opbouw van het [[dendrogram]] en de noodzaak van het vooraf berekenen van de onderlinge verschillen tussen de objecten.
 
Bij het classificeren moeten enkele subjectieve beslissingen worden genomen.
Bij het classificeren moeten enkele subjectieve beslissingen worden genomen, zoals bij de keuze van de te clusteren [[object (ding)|object]]en en de keuze van de [[kenmerk]]en, hun aantal en hun [[weegfactor]]en. Daarna moet ook nog gekozen worden uit de verschillende clustermethoden. Het is ook mogelijk niet de objecten, maar de kenmerken te classificeren. Bij sommige methoden gebeurt dit echter gelijktijdig.
* de keuze van de te clusteren [[object (ding)|object]]en en
* de keuze van de [[kenmerk]]en, hun aantal en hun [[weegfactor]]en.
* keuze van de clustermethoden. Er kunnen divisieve methoden onderscheiden worden van agglomeratieve:
** bij ''divisieve methoden'' wordt de gehele verzameling objecten opgedeeld in 2 of meer zo homogeen mogelijke groepen, waarna deze eventueel verder kunnen worden opgedeeld; deze opdeling in clusters kan ook in een keer gebeuren in een van te voren opgegeven aantal clusters,
** bij ''agglomeratieve methoden'' worden de meest verwante paren van objecten eerst samengevoegd tot kleine clusters, waarna deze weer verder kunnen worden samengevoegd tot steed grotere clusters.
* Het is ook mogelijk de kenmerken (en niet de objecten) te classificeren. Bij sommige methoden gebeurt dit echter gelijktijdig.
 
In de [[biologie]] (met name in de [[systematiek]]) worden beidedivisieve en agglomeratieve methoden tegelijk gebruikt bij de classificaties van [[organisme]]n. Het centrale niveau is dat van de [[soort]]. Soorten kunnen weer worden onderverdeeld in lagere [[Taxon|taxa]], zoals [[ondersoort]] en [[Variëteit (biologie)|variëteit]]. Soorten zelf worden samengevoegd in [[Geslacht (biologie)|geslacht]]en en deze weer in [[Familie (biologie)|familie]]s en in taxa van nog hogere rang.
 
=== Classificatiesystemen ===