Distantie en similariteit: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Japiobot (overleg | bijdragen)
k zie :Wikipedia:Verzoekpagina voor bots, replaced: bij voorbeeld → bijvoorbeeld met AWB
aanpassing
Regel 1:
Met '''distantie en similariteit''' wordt de mate van verschil en van overeenkomst bedoeld zoals deze berekend kunnen worden op grond van de gemeten variabelen (attributen, kenmerken) van [[Multivariabele analyse|multivariate]] objecten zoals [[Steekproef|steekproeven]], [[vegetatieopname]]n, vogel[[Aantal|tellingen]].
 
'''Distanties''' (ook wel:of '''dissimilariteiten)''' zijn de verschillen die bepaald worden op grond van waarden (of responsies) van de variabelen of attributen bij verschillende objecten. '''Similariteiten'''De zijnmeest juistbekende dedistantie overeenkomsten tussen variabelen of tussen objecten. Dergelijke gegevens ten behoeve vanis de berekening[[Gewone wordenmetriek|euclidische weergegeven in tabellen (matrix) met rijen en kolommen voor de variabelen en de objectenafstand]].
 
De'''Similariteiten''' meestzijn bekendejuist distantiede isovereenkomsten tussen variabelen of tussen objecten. Dergelijke gegevens ten behoeve van de [[Gewoneberekening metriek|euclidischeworden afstand]],weergegeven in tabellen (matrix) met rijen en kolommen voor de variabelen en de objecten. De meest bekende similariteit is de [[correlatie]].
 
== Gebruik ==
BijDistanties en similariteiten worden wel gebruikt bij [[Multivariate statistiek|multivariate statistische]] methoden]] als [[clusteranalyse]] en bij [[ordinatie]] worden wel distanties of similariteiten gebruikt. Voorafgaand aan de analyse is het vaak nodig eerst de distanties of similariteiten tussen de objecten te berekenen. Bij een dergelijke berekening gaan de oorspronkelijke gegevensdata van de variabelen verloren. Er zijn ook 'directe' analysemethoden beschikbaar, waar ditdeze nietvoorafgaande hetberekeningen gevalniet isnodig zijn.
 
== Indexen ==
{|class="wikitable" style="float:right;text-align:center;font-size:85%;line-height:90%;" <!-- float:right; -->
|+''Tabel met objecten (kolommen), attributen (rijen) en met responsies (cellen)''
|-
|colspan=2 rowspan=2|<br>'''variabelen''' ↓
!colspan=8|''m'' objecten, monsters
|rowspan=2 style="background-color:pink;"|rand-<br>totalen<br>↓
|-
!Object{{sub|1}}!!Object{{sub|2}}!!Object{{sub|3}}!!Object{{sub|4}}!!...!!Object{{sub|k}}!!...!!Object{{sub|m}}
Regel 26 ⟶ 27:
|<math>\sum_{k=1}^{m} y_{2k}</math>
|-
!...
|...||...||...||...||...||...||...||...
|...
|-
!Y{{sub|i}}
Regel 34 ⟶ 35:
|<math>\sum_{k=1}^{m} y_{ik}</math>
|-
!...
|...||...||...||...||...||...||...||...
|...
|-
!Y{{sub|j}}
Regel 42 ⟶ 43:
|<math>\sum_{k=1}^{m} y_{jk}</math>
|-
!...
|...||...||...||...||...||...||...||...
|...
|-
!Y{{sub|n}}
Regel 50 ⟶ 51:
|<math>\sum_{k=1}^{m} y_{nk}</math>
|-
|colspan=2 style="background-color:lightgreen;"|randtotalen →
|<math>\sum_{j=1}^{n} y_{j1}</math>
|<math>\sum_{j=1}^{n} y_{j2}</math>
|<math>\sum_{j=1}^{n} y_{j3}</math>
|<math>\sum_{j=1}^{n} y_{j4}</math>
|...
|<math>\sum_{j=1}^{n} y_{jk}</math>
|...
|<math>\sum_{j=1}^{n} y_{jm}</math>
|
Regel 91 ⟶ 92:
!+ / Aanwezig / Ja / 1
!— / Afwezig / Nee / 0
!randtotalen
!rand-<br>totalen
|-
!rowspan="3"|Object(i)
Regel 104 ⟶ 105:
|''C + D''
|-
!randtotalen
!rand-<br>totalen
|''A + C'' = <big>Σ</big> y{{sub|jk}}
|''B + D''
Regel 123 ⟶ 124:
!+ / Aanwezig / Ja / 1
!— / Afwezig / Nee / 0
!randtotalen
!rand-<br>totalen
|-
!rowspan="3"|Object(i)
Regel 136 ⟶ 137:
|
|-
!randtotalen
!rand-<br>totalen
|''b'' = <big>Σ</big> y{{sub|jk}}
|
Regel 142 ⟶ 143:
|}
|}
Een binaire variabele is een variabele die slechts twee, elkaar uitsluitende waarden kan aannemen, zoals {{nowrap|'''0 - 1}}, {{nowrap|Ja''' /- '''Nee'''}}, {{nowrap|Positief - Negatief}}, of {{nowrap|'''0'''Aanwezig /- '''1'''Afwezig}}. Bij vergelijking van objecten met binaire variabelen kunnen de formules vereenvoudigd worden, afhankelijk van het al of niet meerekenen van de "dubbel-negatieve" overeenkomsten.
 
Onder dubbel negatieven verstaat men de situatie dat beide binaire variabelen de waarde {{nowrap|'''—''', '''Afwezig''', '''Nee''' of '''0'''}} hebben. In sommige gevallen hebben deze geen zinvolle betekenis. Een voorbeeld is een ecologische gegevenstabel met [[Abundantie (ecologie)|abundanties]] van aangetroffen soorten. Het ontbreken van soorten is twee te vergelijken objecten (bijvoorbeeld tellingen, monsters, vegetatieopnamen) geeft geen zinvolle informatie.