Distantie en similariteit: verschil tussen versies
Verwijderde inhoud Toegevoegde inhoud
→Distanties: in tabelvorm |
→Indexen: aanpassing |
||
Regel 8:
== Indexen ==
{|class="wikitable" style="float:right;text-align:center;font-size:85%;line-height:90%;" <!-- float:right; -->
|+''Tabel met objecten (kolommen), attributen (rijen) en met responsies (cellen)''
|-
|colspan=2 rowspan=2|<br>'''variabelen''' ↓
!colspan=8|''m'' objecten, monsters
|rowspan=2|rand-<br>totalen<br>↓
|-
!Object{{sub|1}}!!Object{{sub|2}}!!Object{{sub|3}}!!Object{{sub|4}}!!...!!Object{{sub|k}}!!...!!Object{{sub|m}}
|-
!rowspan=8|''n''<br>afhankelijke<br>variabelen<br><br>voor de<br>attributen
!Y{{sub|1}}
|y{{sub|11}}||y{{sub|12}}||y{{sub|13}}||y{{sub|14}}||...||y{{sub|1k}}||..||y{{sub|1m}}
|<math>\sum_{k=1}^{m} y_{1k}</math>
|-
!Y{{sub|2}}
|y{{sub|21}}||y{{sub|22}}||y{{sub|23}}||y{{sub|24}}||...||y{{sub|2k}}||...||y{{sub|2mk}}
|<math>\sum_{k=1}^{m} y_{2k}</math>
|-
!...
|...||...||...||...||...||...||...||...
|...
|-
!Y{{sub|i}}
|y{{sub|i1}}||y{{sub|i2}}||y{{sub|i3}}||y{{sub|i4}}||...||y{{sub|ik}}||...||y{{sub|im}}
|<math>\sum_{k=1}^{m} y_{ik}</math>
|-
!...
|...||...||...||...||...||...||...||...
|...
|-
!Y{{sub|j}}
|y{{sub|j1}}||y{{sub|j2}}||y{{sub|j3}}||y{{sub|j4}}||...||y{{sub|jk}}||...||y{{sub|jm}}
|<math>\sum_{k=1}^{m} y_{jk}</math>
|-
!...
|...||...||...||...||...||...||...||...
|...
|-
!Y{{sub|n}}
|y{{sub|n1}}||y{{sub|n2}}||y{{sub|n3}}||y{{sub|n4}}||...||y{{sub|nk}}||...||y{{sub|nm}}
|<math>\sum_{k=1}^{m} y_{nk}</math>
|-
|colspan=2|randtotalen →
|<math>\sum_{j=1}^{n} y_{j1}</math>
|<math>\sum_{j=1}^{n} y_{j2}</math>
|<math>\sum_{j=1}^{n} y_{j3}</math>
|<math>\sum_{j=1}^{n} y_{j4}</math>
|...
|<math>\sum_{j=1}^{n} y_{jk}</math>
|...
|<math>\sum_{j=1}^{n} y_{jm}</math>
|
|}
Voor het berekenen van deze "[[Index (formule)|indices]]" of "[[coëfficiënt]]en" voor distantie en similariteit zijn een groot aantal verschillende formules beschikbaar. Daarnaast kunnen similariteiten vaak worden omgerekend tot distanties en omgekeerd. De rol van objecten en variabelen kan in sommige gevallen worden omgewisseld, zodat ook de distanties en similariteiten tussen de objecten kunnen worden berekend.
Regel 22 ⟶ 75:
{{Stamboom2/einde}}
=== Similariteiten ===
Voorbeelden van similariteiten zijn correlaties en cosinus. Correlatiecoëfficiënten nemen waarden aan van -1 tot +1, waarbij bij de hoogste waarde staat voor de hoogste mate van overeenkomst (similariteit) en de kleinste distantie (dissimilariteit). Om als distantiemaat te kunnen fungeren moeten ze dus getransformeerd worden.
{|class="wikitable sortable" style="text-align:left;font-size:85%;line-height:100%;" <!-- width=100% vatop -->
!afko
!naam
!class="unsortable"|formule
!class="unsortable"|waarin:
!range
|-
!r
|[[Correlatiecoëfficiënt#Pearsons product-momentcorrelatiecoëfficiënt|Pearsons<br>product-moment<br>correlatiecoëfficiënt]]<br>
<center><u>''(ALGEMENE FORMULE)''</u></center>
|<math>r_{ij} = \frac{m \cdot \sum_{k=1}^{m} y_{ik} \cdot y_{jk} - \sum_{k=1}^{m} y_{ik} \cdot \sum_{k=1}^{m} y_{jk}}{\sqrt {m \cdot \sum_{k=1}^{m} y_{ik}^2 - (\sum_{k=1}^{m} y_{ik})^2} \cdot \sqrt {m \cdot \sum_{k=1}^{m} y_{jk}^2 - (\sum_{k=1}^{m} y_{jk})^2}}</math>
|''r{{sub|ik}}'' = correlatie<br>''y{{sub|ik}}'' = waarde voor object ''i'' en variabele ''k''<br>''y{{sub|jk}}'' = waarde voor object ''j'' en variabele ''k''<br>''m'' = aantal variabelen
|[-1,+1]
|-
!r{{sub|S}}
|[[Spearmans rangcorrelatiecoëfficiënt]]
|<math>\rho_{ij} = 1 - \frac {6 \cdot \sum_{k=1}^{m} (y_{ik} - y_{jk}) ^2}{m \cdot (m^2 - 1)}</math>
|''y{{sub|ik}}'' en ''y{{sub|jk}}'' zijn rangnummers<br>binnen de variabelen ''Y{{sub|i}}'' en ''Y{{sub|j}}''
|[-1,+1]
|-
!phi, φ
|puntcorrelatie,<br>associatiecoëfficiënt
|<math>\varphi_{ij} = \frac{bc-ad}{\sqrt{(a+b)(a+c)(b+c)(b+d)}}</math>
|''y{{sub|ik}}'' en ''y{{sub|jk}}'' zijn presenties: 0 of 1<br>
<math>a = \sum_{k=1}^{m} {y_{ik}}</math>, <math>b=\sum_{k=1}^{m} {y_{jk}}</math>, <math>c = \sum_{k=1}^{m} ({y_{ik} \cdot y_{jk})}</math>
|[-1,+1]
|-
!Cos
|[[Sinus en cosinus|cosinus]]<br>van de hoek α tussen<br>de vectoren door de oorsprong
|<math>Cos_{ij} = \frac {\sum_{k=1}^{m} (y_{ik} \cdot y_{jk})} {\sqrt {\sum_{k=1}^{m} (y_{ik}) \cdot \sum_{k=1}^{m}(y_{jk})}}</math><br>voor binaire variabelen wordt de formule: <math>Cos_{ij} = \frac {c} {\sqrt{a \cdot b}}</math>
|''r{{sub|ik}}'' = correlatie<br>''y{{sub|ik}}'' = waarde voor object ''i'' en variabele ''k''<br>''y{{sub|jk}}'' = waarde voor object ''j'' en variabele ''k''<br>''m'' = aantal variabelen
|[-1,+1]
|}
Overige maten, zoals de coëfficiënten van Jaccard, Sörensen, Whittaker en Motyka worden besproken bij de distanties.
|