Gebruiker:PAvdK/Kladblok/Biologie

PAvdK/Kladblok/Biologie

Dit is het persoonlijke kladblok van PAvdK/Kladblok.

Een kladblok is een subpagina van iemands gebruikerspagina. Het dient als testruimte voor de gebruiker en om nieuwe artikelen of langere toevoegingen aan bestaande pagina's voor te bereiden.

Let op: je kladblok opslaan gaat met de knop 'publiceren'. De pagina wordt daarmee nog niet in de openbare encyclopedie geplaatst en blijft een kladpagina. De kladblokpagina is wel zichtbaar (voor iedereen met wat meer Wikipedia-ervaring) en mag dus geen onoorbare dingen bevatten, zoals auteursrechtschendingen.

Het is, ook in een kladblok, uitdrukkelijk niet toegestaan om zonder toestemming auteursrechtelijk beschermd materiaal van derden te publiceren.


Magyar kikerics

Onderzoek

bewerken

Het onderzoeksgebied in drie beslissingsniveaus:

Ui

  • Ui
  • Ordinatiemethoden

    bewerken
    Ordinatietechnieken
     Ordinatie-
    technieken 
     informele 
     technieken 

     met verklarende variabelen bij de objecten



     met behulp van attribuutkenmerken



     andere technieken



     indirecte 
     gradiëntanalyse 
     distantiematrix 
     

     PO - Polaire ordinatie, Bray-Curtis ordinatie, Wisconsin ordinatie


     

     PCoA, MMS - Principal Coordinates Analysis, Metric Multidimensional Scaling


     

     NMDS - Nonmetric multidimensional scaling



     eigenanalyse 
    lineair
     responsmodel 

     
     PCA - Hoofdcomponentenanalyse


    unimodaal
     responsmodel 
      

     CA, RA - Correspondentieanalyse, Reciprocal averaging


     detrended 

     DCA - Detrended correspondence analysis





     directe 
     gradiëntanalyse 
    lineair
     responsmodel 

     
     RDA - Redundantieanalyse


    unimodaal
     responsmodel 
      

     CCA - Canonische correspondentieanalyse


     detrended 

     DCCA - Detrended canonical correspondence analysis





    [[Categorie:Wikipedia:Sjablonen wiskunde|Ordinatie]]


    Indexen

    bewerken
    Tabel met objecten (m kolommen), attributen (n rijen) en responsies (n×m cellen)
    n attributen
    (variabelen)
    m objecten (monsters, samples) randtotalen
    variabelen
    Object1 Object2 Objectf Objectg Objectm
    n
    afhankelijke
    variabelen
    variabele
     
               
    variabele
     
               
    variabele
     
               
    variabele
     
    yj1          
    variabele
     
               
    randtotalen
    van de
    objecten
               

    Voor een objecten-bij-attributentabel zijn voor het berekenen van indexen of coëfficiënten voor distantie en similariteit (verschil en overeenkomst) van de objecten of van de attributen een groot aantal verschillende indexen beschikbaar. Voor de elk van attributen is er slechts één variabele. Als er meer variabelen zijn worden deze gecombineerd tot slechts één variabele.

    Similariteiten kunnen vaak worden omgerekend tot distanties en omgekeerd. De rol van objecten en variabelen kan in sommige gevallen worden omgewisseld, zodat niet alleen de distanties en similariteiten tussen de objecten kunnen worden berekend, maar ook tussen attributen of variabelen.

    Meetschaal

    bewerken

    De keuze van de index hangt af van de meetschaal van de gegevens. Vaak is een mogelijkheid de waarden van de ene schaal te transformeren naar een andere schaal.

    Voorbeeld: Bij vegetatieopnamen (de objecten) volgens de Braun-Blanquet-methode worden voor de soorten (de attributen) de variabelen voor bedekking en voor talrijkheid samengevoegd tot een gecombineerde schatting (de variabelen) en ten behoeve van numerieke verwerking daarna getransformeerd.
    Men onderscheidt de volgende niveaus waarop gemeten wordt:
    • kwalitatieve (categorische) gegevens:
      • nominaal: benoemen (niet-rangschikbare waarden)
      • ordinaal: ordening (rangschikbare waarden)
    • binaire variabelen (twee opties: 0-1, afwezig-aanwezig, nee-ja, onwaar-waar, negatief-positief)
    • kwantitatieve (numerieke, scalaire, metrische, kardinale) gegevens
    • circulaire gegevens
  • De bovenstaande zijn niveaus van gegevens in de genoemde volgorde van toenemende complexiteit en omvat een volgend genoemd niveau steeds de eerdere. Circulaire gegevens zijn hier verder buiten beschouwing gelaten, deze worden hier verder niet besproken. Voorbeelden daarvan zijn: dag van de week, maand van het jaar, het seizoen (voorjaar/zomer/herfst/winter), waterhoogte (eb/vloed), tijdstip op de dag, windrichting.

    Waarnemingen nominale variabelen

    bewerken

    Waarnemingen met nominale variabelen kunnen ten behoeve van de ggevensverwerking getransformeerd worden in binaire variabelen, door met voor elke nominale waarde een dummy-variabele met 0-1 waarden (binair) aan te maken.

    Voorbeeld: de variabele "Oogkleur" (mogelijke waarden: bruin/zwart/groen) wordt getransformeerd in de variabelen "Oogkleur bruin" (mogelijke waarden: 1/0), "Oogkleur zwart" (mogelijke waarden: 1/0) en "Oogkleur groen" (mogelijke waarden: 1/0).

    Waarnemingen ordinale variabelen

    bewerken

    Waarnemingen met ordinale variabelen kunnen worden getransformeerd in binaire variabelen

    Waarnemingen binaire variabelen

    bewerken

    Een binaire variabele is een variabele die slechts twee, elkaar uitsluitende waarden kan aannemen, zoals 1 - 0, Ja - Nee, Positief - Negatief, of Aanwezig - Afwezig. Bij vergelijking van objecten met binaire variabelen worden de waarnemingen zo nodig getransformeerd naar 0 - 1 waarden en kunnen de formules vereenvoudigd worden, afhankelijk van het al of niet meerekenen van de 'dubbel-afwezige' (dubbel 0, dubbel Afwezig, dubbel Nee) overeenkomsten.

    Indien gewenst kunnen ook attributen of variabelen met elkaar vergeleken worden, met vergelijkbare formules (deze zijn hier niet uitgeschreven).

    Vergelijking van Objectf en Objectg met n binaire variabelen
    met meerekenen van de 'dubbel-afwezigen'
     
    met uitsluiting van de 'dubbel-afwezigen'
    objecten Objectg randtotalen
    waarden
    1,
    Aanwezig,
    +,
    Ja
    0,
    Afwezig,
    —,
    Nee
    Objectf 1, Aanwezig,
    +, Ja
    A B A + B
    0, Afwezig,
    —, Nee
    C D C + D
    randtotalen → A + C B + D N = A + B + C + D
    objecten Objectg randtotalen
    waarden
    1,
    Aanwezig,
    +,
    Ja
    0,
    Afwezig,
    —,
    Nee
    Objectf 1, Aanwezig,
    +, Ja
    c a - c a
    0, Afwezig,
    —, Nee
    b - c ø
    ('dubbel-Afwezig')
    b - c
    randtotalen → b a - c m = a + b - c
    waarin:   en   hebben de waarden 0 of 1
    A =  , B =  ,
    C =   en D =  
     
    waarin:   en   hebben de waarden 0 of 1
    a =  , b =   en c =  
    ø: Onder 'dubbel-afwezig' verstaat men de situatie dat beide
    binaire variabelen de waarde 0 (—, Afwezig, Nee) hebben.
    In sommige gevallen hebben deze geen zinvolle betekenis.

    Nominale en ordinale variabelen kunnen voor de verschillende waarden getransformeerd worden naar binaire variabelen.

    Voorbeeld: Een ecologische gegevenstabel met abundanties van aangetroffen soorten (met weglating van niet-aangetroffen soorten). Deze waarden kunnen eventueel eenvoudig worden getransformeerd naar aan- en afwezigheid. De afwezigheid van soorten in twee te vergelijken objecten (bijvoorbeeld tellingen, monsters, vegetatieopnamen) geeft meestal geen zinvolle informatie.

    Similariteiten

    bewerken

    Voorbeelden van similariteiten zijn correlaties en cosinus. Correlatiecoëfficiënten nemen waarden aan van -1 tot +1, waarbij bij de hoogste waarde staat voor de hoogste mate van overeenkomst (similariteit) en de kleinste distantie (dissimilariteit). Om als distantiemaat te kunnen fungeren moeten ze dus getransformeerd worden.

    afko. naam formule waarin: range
      Pearsons
    product-moment
    correlatiecoëfficiënt

     
    (algemene formule)
        = correlatie
      = waarde voor object f en variabele h
      = waarde voor object g en variabele h
    n = aantal waarden
    [-1,+1]
      Spearmans
    rangcorrelatiecoëfficiënt

    (ordinale variabelen)
        = rangcorrelatiecoëfficiënt
    yhf en yhg zijn rangnummers
    [-1,+1]
      punt-biseriële correlatiecoëfficiënt

    (binaire en kwantitatieve variabele)
    als   (zie aldaar)   = punt-biseriële correlatie
    yhf of yhg bestaat uit presenties (0 of 1),
    de ander is kwantitatief
    [-1,+1]
     ,
     
    puntcorrelatie,
    associatiecoëfficiënt
    (binaire variabelen)
        = puntcorrelatie
    yhf en yhg zijn presenties: 0 of 1
    [-1,+1]
      cosinus van de hoek α
    tussen de vectoren
    door de oorsprong
     
    (algemene formule)
     
    voor binaire variabelen wordt de formule:  
      = cosinus(α)
      = waarde voor object f en variabele h
      = waarde voor object g en variabele h
    n = aantal waarden
    [-1,+1]

    Een andere correlatiecoëfficiënt is de punt-biseriële correlatiecoëfficiënt, evenals de puntcorrelatie een variant van de Pearsons product-momentcorrelatiecoëfficiënt.

    Overige maten voor similariteit, zoals de coëfficiënten van Jaccard, Sörensen, Whittaker en Motyka worden besproken bij de distanties.

    Distanties

    bewerken

    Voorbeelden van indexen voor distanties (dissimilariteiten).

    Distantie-indexen voor vergelijking van Objectf en Objectg met n variabelen
    afko. naam index formule waarin: range
    MD Minkowski distance,
     geïnduceerd door de Lr-norm
     
    (algemene formule)
      MDfg = distantie tussen objecten f en g

    yhf = waarde voor object f en variabele h
    yhg = waarde voor object g en variabele h
    m = aantal attributen met positieve waarden

    r is een constante: 1 of 2
    CBD City Block Distance,
    Manhattan-metriek
      [0, ∞)
    ED Euclidische afstand   [0, ∞)
    MCD Mean Character Cistance   [0, ∞)
    GE gemiddelde euclidische afstand
    euclidische vorm van MCD
      [0, ∞)
    DM Distance Metric
     
    (algemene formule)
      DMfg = distantie tussen objecten f en g

    yhf = waarde voor object f en variabele h
    yhf = waarde voor object g en variabele h
    (yhf + yhg) > 0
    m = aantal attributen met positieve waarden

    r is een constante: 1 of 2
    CM Canberra metric   [0, ∞)
    HM Hodson's metric,
    euclidische vorm van CM
      [0, ∞)
    CD Coefficient of Divergence   [0, 1]
    M distantie naar Motyka,
    Percentage dissimilarity
    distantie naar Czekanowsky,
    kwantitatieve vorm van Sørensen

     
    (algemene formule)
      Mfg = distantie tussen objecten f en g

    yhf = waarde voor object f en variabele h
    yhg = waarde voor object g en variabele h
    m = aantal attributen met positieve waarden
    [0, 1]
    W distantie naar Whittaker,
    kwantitatieve vorm van Jaccard
      [0, 1]
    S distantie naar Sørensen,
    distantie naar Dice,
    1 - Coefficient of Community
      a =  , b =  , c =   [0, 1]
    J distantie naar Jaccard   [0, 1]
    H Heterogeniteit   yhf en yhg zijn numerieke waarden
    van kwantitatieve variabelen
    [0, ∞)
      binaire variabelen
    a =  , b =  , c =  
    SM' complement van
    Simple Matching Coefficient
      binaire variabelen
    A =  , D =  ,
    B =  , C =  
    [0, 1]
    YC Yule-coefficient   [-1, 1]
    χ2 Chi-kwadraat afstand   [0, ∞)

    Distantiematrix

    bewerken

    Een distantiematrix (distance matrix) is een vierkante, symmetrische matrix met voor elk paar van objecten de onderlinge distanties. Een dergelijke matrix is symmetrisch, omdat de distantie tussen objecten   en   gelijk is aan de distanties tussen de objecten   en  . Op de diagonaal staan de distanties van de objecten tot zichzelf: 0.

    Distantiematrices worden onder andere gebruikt bij clusteranalyse en bij ordinatietechnieken op basis van een distantiematrix,[1] zoals polaire ordinatie (PO), principal coordinates analysis, PCoA of metric multidimensional scaling, en nonmetric multidimensional scaling (NMDS).

    Een matrix met similariteiten in plaats van distanties wordt ook wel resemblance matrix genoemd.