Distantie en similariteit: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
→‎Distanties: bij kwadraten geen |
→‎Distanties: aanpassing
Regel 118:
 
{|class="wikitable sortable" style="text-align:left;font-size:85%;line-height:100%;"
!afkorting
!afko
!naam coëfficiënt
!class="unsortable"|formule
!class="unsortable"|waarin:
!range
|-style="background-color:#CCFFFFDDFFDD;"
!MD
| '''Minkowski''' distance<br>&nbsp;
<center><u>''(ALGEMENE FORMULE)''</u></center>
|<math>d_{ij} = (\sum_{k=1}^{m} {\mid a_y_{ik}- a_y_{jk} \mid}^r )^{\frac {1}{r}}</math>
|''d{{sub|ij}}'' = distantie tussen objecten ''i'' en ''j''<br>''ay{{sub|ik}}'' = waarde voor object ''i'' en variabele ''k''<br>''ay{{sub|jk}}'' = waarde voor object ''j'' en variabele ''k''<br>''m'' = aantal variabelen<br>''r'' is een constante
|
|-style="background-color:#DDFFDD;"
|-
!H
|'''Heterogeniteit'''
|<math>H_{ij} = \sum_{k=1}^{m} {\mid a_{ik}- a_{jk} \mid}</math><br>
<math>H_{ij} = a + b - 2c</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn presenties: 0 of 1<br>
<math>a = \sum_{k=1}^{m} {a_{ik}}</math>, <math>b=\sum_{k=1}^{m} {a_{jk}}</math>, <math>c = \sum_{k=1}^{m} {a_{ik} \cdot a_{jk}}</math>
|[0, ∞)
|-
!CBD
|'''City Block Distance''',<br>Chessboard Distance
|<math>{CBD}_{ij} = \sum_{k=1}^{m} {\mid a_y_{ik}- a_y_{jk} \mid}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, ∞)
|-style="background-color:#DDFFDD;"
|-
!ED
|{{Sorteer|Euclidische afstand|[[Gewone metriek|'''Euclidische afstand''']]}}
|<math>{ED}_{ij} = (\sum_{k=1}^{m} {{(a_y_{ik}- a_y_{jk})}^2)}^{\frac {1}{2}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, ∞)
|-style="background-color:#DDFFDD;"
|-
!SM'
|{{Sorteer|Simple Matching Coefficient|complement van<br>'''Simple Matching Coefficient'''}}
|<math>{SM'}_{ij} = \frac {1}{m} \cdot \sum_{k=1}^{m} {\mid a_{ik}- a_{jk} \mid}</math><br>
<math>{SM'}_{ij} = \frac{a+b-2c}{m}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn presenties: 0 of 1<br>
<math>a = \sum_{k=1}^{m} {a_{ik}}</math>, <math>b = \sum_{k=1}^{m} {a_{jk}}</math>, <math>c = \sum_{k=1}^{m} {a_{ik} \cdot a_{jk}}</math>
|[0, 1]
|-
!MCD
|'''Mean Character Distance'''
|<math>{MCD}_{ij} = \frac {1}{m} \cdot \sum_{k=1}^{m} {\mid a_y_{ik}- a_y_{jk} \mid}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, ∞)
|-style="background-color:#DDFFDD;"
|-
!GE
|'''Gemiddelde euclidische afstand''',<br>euclidische vorm van '''MCD'''
|<math>{GE}_{ij} = (\frac {1}{m} \cdot \sum_{k=1}^{m} {{(a_y_{ik}- a_y_{jk})}^2)}^{\frac {1}{2}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, ∞)
|-style="background-color:#CCFFFFDDFFFF;"
!DM
|'''Distance Metric'''<br>&nbsp;
<center><u>''(ALGEMENE FORMULE)''</u></center>
|<math>DM_{ij} = \left( \sum_{k=1}^{m} {\frac {{\mid a_y_{ik}- a_y_{jk} \mid}^r}{(a_y_{ik}+ a_y_{jk})^r}}\right)^{\frac {1}{r}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, 1]<!---->
|-style="background-color:#DDFFFF;"
|-
!CM
|'''Canberra Metric'''
|<math>CM_{ij} = \sum_{k=1}^{m} {\frac {\mid a_y_{ik}- a_y_{jk} \mid} {(a_y_{ik}+ a_y_{jk})}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, ∞)
|-style="background-color:#DDFFFF;"
|-
!HM
|'''Hodson's Metric''',<br>euclidische vorm van '''CM'''
|<math>HM_{ij} = \left( \sum_{k=1}^{m} {\frac {{(a_y_{ik}- a_y_{jk})}^2}{(a_y_{ik}+ a_y_{jk})^2}}\right)^{\frac {1}{2}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, ∞)
|-style="background-color:#DDFFFF;"
|-
!CD
|'''Coefficient of Divergence'''
|<math>CD_{ij} = \left( \frac {1}{m} \cdot \sum_{k=1}^{m} {\frac {{( a_y_{ik}- a_y_{jk} )}^2}{(a_y_{ik}+ a_y_{jk})^2}}\right)^{\frac {1}{2}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, 1]
|-
!JM
|{{Sorteer|JaccardMotyka|distantie naar '''JaccardMotyka''',<br>distantie naar Czekanowsky,<br>Percentage Dissimilarity<br>kwantitatieve vorm van '''S'''}}
|<math>a M_{ij}= \frac {\sum_{k=1}^{m} {a_y_{ik}}</math>, <math>b=+\sum_{k=1}^{m} {a_y_{jk}}</math>, <math>c- =2 \cdot \sum_{k=1}^{m} {a_\min(y_{ik},y_{jk})}}{\sum_{k=1}^{m} {y_{ik}}+\cdotsum_{k=1}^{m} a_{y_{jk}}}</math>
|<math>J_{ij} = \frac{a+b-2c}{a+b-c}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn presenties:numerieke 0 of 1<br>waarden
<math>a = \sum_{k=1}^{m} {a_{ik}}</math>, <math>b = \sum_{k=1}^{m} {a_{jk}}</math>, <math>c = \sum_{k=1}^{m} {a_{ik} \cdot a_{jk}}</math>
|[0, 1]
|-
!W
|{{Sorteer|Whittaker|distantie naar '''Whittaker''',<br>kwantitatieve vorm van '''J'''}}
|<math>W_{ij} = \frac {\sum_{k=1}^{m} {a_y_{ik}}+\sum_{k=1}^{m} {a_y_{jk}} - 2 \cdot \sum_{k=1}^{m} {\min(a_y_{ik},a_y_{jk})}}{\sum_{k=1}^{m} {a_y_{ik}}+\sum_{k=1}^{m} {a_y_{jk}} -\sum_{k=1}^{m} {\min(a_y_{ik},a_y_{jk})}}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numerieke waarden
|[0, 1]
|-style="background-color:#FFFFDD;"
|-
!H
|'''Heterogeniteit'''
|<math>H_{ij} = \sum_{k=1}^{m} {\mid a_y_{ik}- a_y_{jk} \mid}</math><br>
<math>H_{ij} = a + b - 2c</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn presenties: 0 of 1<br>
|[0, ∞)
|-style="background-color:#FFFFDD;"
!J
|{{Sorteer|Jaccard|distantie naar '''Jaccard'''}}
|<math>{SM'}_J_{ij} = \frac{a+b-2c}{ma+b-c}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn presenties: 0 of 1<br>
|[0, 1]
|-style="background-color:#FFFFDD;"
!S
|{{Sorteer|Sørensen|distantie naar '''Sørensen''',<br>distantie naar '''Dice''',<br>1-'''Coefficient of Community'''}}
|<math>S_{ij} = \frac{a+b-2c}{a+b}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn presenties: 0 of 1<br>
<math>a = \sum_{k=1}^{m} {a_{ik}}</math>, <math>b = \sum_{k=1}^{m} {a_{jk}}</math>, <math>c = \sum_{k=1}^{m} {a_{ik} \cdot a_{jk}}</math>
|[0, 1]
|-style="background-color:#FFDDFF;"
|-
!MSM'
|{{Sorteer|Simple Matching Coefficient|complement van<br>'''Simple Matching Coefficient'''}}
|{{Sorteer|Motyka|distantie naar '''Motyka''',<br>distantie naar Czekanowsky,<br>Percentage Dissimilarity<br>kwantitatieve vorm van S}}
|<math>M_{SM'}_{ij} = \frac {\sum_{k=1}^{m}A {a_{ik}}+\sum_{k=1 D}^{m}A {a_{jk}}+ -B 2+ \cdotC \sum_{k=1}^{m} {\min(a_{ik},a_{jk})}}{\sum_{k=1}^{m} {a_{ik}}+\sum_{k=1}^{m} {a_{jk}}D}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn numeriekebinaire waarden: ''Yes'' of ''No''
|[0, 1]
|-style="background-color:#FFDDFF;"
!YC
|'''Yule-Coefficient'''
|<math>J_YC_{ij} = \frac{a+bAD -2c BC}{aAD +b-c BC}</math>
|''a''{{sub|ik}} en ''a''{{sub|jk}} zijn binaire waarden: ''Yes'' of ''No''
|[-1, 1]
|}