Overleg:Empirische verdelingsfunctie

Laatste reactie: 9 jaar geleden door Bob.v.R in het onderwerp Beginzinnen

In artikel verdelingsfunctie is dit de basisterm.Madyno 14 mei 2007 23:57 (CEST)Reageren

Dat is inderdaad het geval, en dat is zeker niet mijn eerste voorkeur! (De kansverdelingsfunctie is wat mij betreft de kansdichtheid.) Maar daar wordt in ieder geval de (m.i. enige correcte!!!) term cumulatieve verdelingsfunctie óók genoemd! Het lijkt me daarom passend om dat op deze pagina ook te doen. Bob.v.R 15 mei 2007 00:10 (CEST)Reageren
Daar ben ik gezien het artikel verdelingsfunctie niet voor. Bovendien is het wel mijn eerste keuze (en niet van mij alleen) om over verdelingsfunctie te spreken. Het is immers de functie die de verdeling bepaalt. Of er een kansdichtheid (want een dichtheid is het) bestaat is maar de vraag.Madyno 15 mei 2007 00:16 (CEST)Reageren
De meningen zijn verdeeld, dat is in ieder geval duidelijk. Misschien moeten we de diverse meningen nog eens met bronnen onderbouwen (wellicht in eerste instantie op de overlegpagina's). Hoe dan ook, in verdelingsfunctie wordt in ieder geval gesteld dat er ook mensen zijn dit de cumulatieve verdelingsfunctie noemen. Ik zie dan ook géén reden om een dergelijke vermelding in het huidige artikel compleet achterwege te laten (dus nog los van het feit dat het m.i. de enige correcte term is).
Je hebt natuurlijk gelijk dat er niet altijd een kansdichtheid is. Maar áls die er is, dan noem ik die ook (kans)verdelingsfunctie. Bob.v.R 15 mei 2007 00:26 (CEST)Reageren
Je kan nu wel stug in andere artikelen je mening doorzetten, maar wellicht kunnen we eerst overleggen hierover. Bob.v.R 15 mei 2007 00:34 (CEST)Reageren
Het ging me er niet om "stug" m'n mening door te zetten, maar wel consistentie aan te brengen. Het probleem lijkt vooral het gebruik van (kans)verdelingsfunctie voor (kans)dichtheid. Dat lijkt me zeer af te raden, zeker waar in bijna alle talen, verdelingsfunctie (tegenwoordig) synoniem is met cumulatieve verdelingsfunctie. Dat was vroeger vermoedelijk niet zo, en was de logica: verdelingsfunctie = dichtheid, cumulatief = cumulatieve verdelingsfunctie.Madyno 15 mei 2007 00:59 (CEST)Reageren
Consistentie is prima natuurlijk. Zolang de discussie loopt lijkt het dan ook zinvol om voorlopig in Empirische verdelingsfunctie beide termen te vermelden (immers, dat is consistent met het artikel verdelingsfunctie).
En wat betreft de discussie als zodanig: in ieder geval voel ik me voorlopig gesteund door de Engelstalige wikipedia. Bob.v.R 15 mei 2007 01:24 (CEST)Reageren
Ik zou het niet gesteund willen noemen, want de term verdelingsfunctie is ook daar synoniem met cumulatieve verdelingsfunctie. Dat lijkt in meer talen het geval te zijn. In ieder geval wordt verdelingsfunctie zeker niet gebruikt voor dichtheid.Madyno 15 mei 2007 01:30 (CEST)Reageren

Analyse van de cumulatieve frequentie bewerken

Vervolg op de discussie bij Overleg:Cumulatieve-frequentieanalyse.

 
Grafiek van de getrapte somfrequentie volgens de tabel in empirische verdelingsfunctie.
  • De pagina empirische verdelingsfunctie zou hernoemd kunnen worden tot "Empirische cumulatieve verdelingsfunctie", of misschien eenvoudiger en doeltreffender tot "Cumulatieve frequentieverdeling" want daar gaat hij over en niet over de gewone (niet-cumulatieve) verdeling zoals bij frequentieverdeling, waar een indeling in klassen wordt gebruikt en de frequentie van voorkomen per klasse wordt besproken. (Overigens zou je hier ook het probleem kunnen behandelen dat ontstaat als je heel veel klassen gebruikt met een kleine bandbreedte.)
Beslist niet: empirische verdelingsfunctie is een bestaand begrip
  • De naam van de pagina Verdelingsfunctie is ook ietwat misleidend want die gaat eveneens alleen maar over de cumulatieve verdelingsfunctie.
Absoluut niet misleidend, in de gangbare literatuur wordt niet gesproken over cumulatieve verdelingsfunctie. Waarom zou men ook?
  • Er is een artikel over kansverdeling en het artikel "Verdelingsfunctie" zou hernoemd kunnen worden to "Cumulatieve kansverdeling" om een en ander overzichtelijker te maken.
Zeker niet.
  • De pagina empirische verdelingsfunctie komt niet verder dan een getrapte Somfrequentie. Goed genoeg voor lezers die daar voldoende aan hebben, maar voor hen die meer willen weten (bijvoorbeeld over continue in plaats van getrapte verdelingen en verdere analyse/toepassingen) wordt een link geboden naar Cumulatieve-frequentieanalyse. Op zich lijkt dat niet gek. Anderzijds zouden deze pagina's wellicht ook samengevoegd kunnen worden.
Een empirische verd.f. is altijd een trapfunctie. Wat die cum-freq, analyse betreft, daar moeten we het nog eens over hebben.
  • De symbolen gebruikt in de vergelijking gegeven bij "empirische verdelingsfunctie" hebben m.i. een verklaring nodig.

Met groet, Referent 17 jun 2010 15:26 (CEST)Reageren

Daar zal ik eens naar kijken. Madyno 17 jun 2010 23:44 (CEST)Reageren

Alleen maar glasharde ontkenningen, verder niets. Voor goed overleg schiet dat niet op. Er bestaan vele verdelingsfuncties in dit leven, bijvoorbeeld: arbeidsmarktverdelingsfunctie, fermi-verdelingsfunctie, verdelingsfunctie voor specifieke uitkeringen etc. etc. Wiki is een naslagwerk voor een breed publiek en het zou dienstig zijn de namen van de onderwerpen wat nader/duidelijker te omschrijven. Referent 18 jun 2010 12:56 (CEST)Reageren

Vragen aan Madyno bewerken

Er staat in dit artikel dat een "empirische verdelingsfunctie" een "verdelingsfunctie" is die zo goed mogelijk bij de gevonden data ("gegevens"?) past. Als ik bij verdelingsfunctie kijk zie ik een vergelijking in "P". (Er staat niet bij wat P betekent, maar ik raad dat het staat voor "kans", misschien komt de "P" van het Engelse "probability"). Echter, bij "empirische verdelingsfunctie" staat een vergelijking in "aantal", niet in "P". Kan je hieruit afleiden dat de "empirische verdelingsfunctie" eigenlijk geen "verdelingsfunctie" is? Dat is taalkundig dan wel eigenaardig.

Als je beter leest, zul je zien dat bij verdelingsfunctie staat dat iedere functie met bepaalde eigenschappen een verdelingsfunctie genoemd wordt. De als empirische vdf gedefineerde functie, met aantallen, heeft indcerdaad deze eigenschappen

      Even verderop staat dat de "empirische verdelingsfunctie" telkens (?) een somfrequentie of cumulatieve frequentie geeft. Is het dan niet beter de de namen "somfrequentiefunctie" of "cumulatieve frequentiefunctie" te gebruiken in plaats van "empirische verdelingsfunctie"?

De dingen heten nu eenmaal zoals ze heten.

      Nog wat verderop staat: de "empirische verdelingsfunctie" geeft de "cumulatieve relatieve frequentie" (CRF) weer. Maar hij geeft ook de somfrequentie of cumulatieve frequentie. Kan je hieruit afleiden dat "cumulatieve relatieve frequentie" hetzelfde is als somfrequentie of cumulatieve frequentie?

Het gaat om de relatieve frequenties. Madyno (overleg) 1 feb 2011 17:49 (CET)Reageren

      Nog wat vragen over de gegeven vergelijking zelf. (a) Wat betekent de "x" in de gegeven vergelijking? (b) Er wordt een ingewikkelde indicatorfunctie "I" gebruikt die na veel puzzelen uiteindelijk 0 blijkt op te leveren als Xi>x, anders is hij 1. Is dit niet een omslachtig gedoe dat vereenvoudigd kan worden? (c) Er wordt een symbool "i" gebruikt. Kan die gedefinieerd worden? (d) Er wordt gebruikt: "aantal{. . .}". Wat betekent dat? Is het gebruikelijk in formules hele woorden te gebruiken? (e) Er wordt een symbool "|" gebruikt. Kan er uitgelegd worden wat die betekent? (f) Een vergelijking heeft een "=" teken, maar hier wordt bij de definitie van een functie 2x een "=" teken gebruikt. Kan ik hieruit afleiden dat een functie een meervoudige vergelijking is? Is het niet zo in het wiskundige wereldje dat het niet gebruikelijk is 2x "=" achter elkaar te gebruiken? (g) Kan de functie niet zo uitgelegd worden dat hij begrijpelijk is voor iemand die niet is ingevoerd in het wereldje van het statistische jargon?
Goeiedag 19 jun 2010 10:03 (CEST)Reageren

Ik ga m'n best doen. Veel van je vragen zijn het gevolg van meerdere auteurs van de artikelen. Madyno 19 jun 2010 10:20 (CEST)Reageren

Fijn. Ik heb nog een vraagje. Als je bij normale verdeling kijkt zie je een functie f(x) en die wordt ook kansdichtheid genoemd.

>>>Die f is de kansdichtheid

Bij kansdichtheid zie je dat f(x) de afgeleide is van F(x). Nu komt het bij me op dat de normale verdeling misschien ook wel normale verdelingsfunctie genoemd kan worden zodat de hier gegeven f(x) een functie is voor de normale verdeling.

>>>Snel onderdrukken die gedachte; een verdeling is iets anders dan de functie die die verdeling beschrijft.

Als ik nu bij verdelingsfunctie ga kijken zie ik bij de definitie F(x) staan en het ≤ teken. In mijn gedachten heeft dat iets met "cumulatief" te maken en niet met kansdichtheid.

>>>Ik begrijp niet wat je probleem hier is. F is de verdelingsfunctie, de integraal (gecumuleerde waarden) van de dichtheid.

Nu heeft WikiNL geen artikel waarin is uitgelegd wat de cumulatieve normale verdeling is

>>>Nee, want dat begrip bestaat niet.

maar in WikiEn vindt je wel iets over "Cumulative distribution function" (in het artikel Normal distribution) en dat vertaal je als cumulatieve verdelingsfunctie.

>>>Een woordelijke vertaling hoeft niet correct te zijn.

Er bestaat dus, lijkt mij, een "verdelingsfunctie" en een "cumulatieve" versie er van.

>>>Nee, zo'n versie bestaat niet.

Bij WikiNL wordt de cumulatieve versie behandeld onder "verdelingsfunctie" en de niet-cumulatieve ('gewone') versie vind ik er niet.

Zou het niet beter zijn het artikel "verdelingsfunctie" om te dopen tot "Cumulatieve verdelingsfunctie"? Er is dan ook ruimte om iets te schrijven over de 'gewone' verdelingsfunctie, die iets met kansdichtheid te maken moet hebben
Goeiedag 19 jun 2010 12:29 (CEST)Reageren

>>>Je zult al begrepen hebben dat het antwoord "nee" is. Ik weet niet eens wat je eigenlijk bedoelt. Vermoedelijk weet je zelf ook niet precies waar het over gaat. Ik hoop alleen dat mijn bovenstaande commentaar het duidelijker maakt voor je.Madyno 19 jun 2010 13:12 (CEST)Reageren

Cumulative verdelingsfunctie bewerken

De antwoorden hierboven van Madyno getuigen van een ongegronde arrogantie.

De Open Universiteit [1] spreekt wel degelijk van cumulatieve verdelingsfucties en van cumulative distributiefuncties. Yucateco (overleg) 28 jan 2011 18:39 (CET)Reageren

Er lopen twee dingen door elkaar bewerken

  • Een kansverdeling kan altijd uitgedrukt worden in een cumulatieve verdelingsfunctie. Oftewel een cumulatieve verdelingsfunctie is een eigenschap van een kansverdeling.
  • Er kan getoetst worden of empirische data gegenereerd kunnen zijn uit een kansverdeling (die een cumulatieve verdelingsfunctie heeft).

Maar een empirische verdelingsfunctie is simpelweg een contaminatie van die twee verschillende begrippen. Marcocapelle (overleg) 11 mei 2014 17:57 (CEST)Reageren

Vermoedelijk bedoel je dat een kansverdeling beschreven kan worden door een verdelingsfunctie (door sommige auteurs cumulatieve verdelingsfunctie genoemd). De term 'empirische verdelingsfunctie' is absoluut geen contaminatie, maar zegt precies wat het is: een verdelingsfunctie die empirisch bepaald is. Madyno (overleg) 11 mei 2014 19:39 (CEST)Reageren
Dat bedoel ik inderdaad. Als jij vervolgens een empirische verdelingsfunctie zo wilt definiëren mag je dat thuis gerust doen als je dat graag wilt, maar plaats dat soort ongebruikelijke en verwarrende definities alsjeblieft niet op Wikipedia. In de statistische theorie spelen alleen empirische data een rol, en wel in de context dat je wilt toetsen of empirische data gegenereerd kunnen zijn uit een bepaalde kansverdeling. Groeten, Marcocapelle (overleg) 12 mei 2014 23:43 (CEST)Reageren
????Madyno (overleg) 13 mei 2014 10:03 (CEST)Reageren
Ik had gehoopt dat er al wel een apart artikel "Beschrijvende statistiek" zou bestaan. Hier zou dan namelijk makkelijk vermeld kunnen worden dat empirische data grafisch weergegeven kunnen worden door een histogram of door een cumulatieve frequentieverdeling (i.p.v. een empirische verdelingsfunctie). Na een dergelijke toevoeging zou dit artikel over empirische verdelingsfunctie overbodig worden. Merkwaardigerwijze bestaat er nog helemaal geen apart artikel "Beschrijvende statistiek" en is ook het algemene artikel Statistiek opvallend slecht gevuld. Er is blijkbaar nog heel veel werk aan de winkel. Marcocapelle (overleg) 14 mei 2014 06:53 (CEST)Reageren
Het artikel over de empirische verdelingsfunctie zal nooit overbodig zijn. Het is een bekend begrip in de statistiek. Madyno (overleg) 14 mei 2014 12:14 (CEST)Reageren
Niet elk begrip behoeft een apart artikel. Grafische weergaven van de frequentieverdeling, zoals histogram en cumulatieve frequentieverdeling (i.p.v. empirische verdelingsfunctie) kunnen ook prima in een overzichtsartikel genoemd worden, dan zijn die begrippen nog steeds prima vindbaar op Wikipedia. Erg spannend zijn die begrippen niet. En laten we het in ieder geval bij de juiste naam noemen. Marcocapelle (overleg) 16 mei 2014 08:43 (CEST)Reageren

De juiste naam is 'empirische verdelingsfunctie', en dit begrip verdient zeker een apart artikel. Madyno (overleg) 16 mei 2014 10:34 (CEST)Reageren

Het zegt niet alles maar het is wel een belangrijke indicator dat de term in de volgende zeer uitgebreide glossary niet eens voorkomt: http://www.statistics.com/resources/glossary. Groeten, Marcocapelle (overleg) 17 mei 2014 09:06 (CEST)Reageren
Bovendien, leg dan maar eens het verschil uit tussen cumulatieve frequentieverdeling en empirische verdelingsfunctie. Marcocapelle (overleg) 17 mei 2014 09:13 (CEST)Reageren
Het lijkt me wat te veel gevraagd om in een lijst met Engelse termen een Nederlands begrip te vinden. Maar je hebt in zoverre gelijk dat de lijst wel de Engelse term 'Cumulative Relative Frequency Distribution' noemt, maar niet 'Empirical (cumulative) distribution function' zoals die in de Engelse Wikipedia genoemd wordt. Je zult toch moeten accepteren dat 'empirische verdelingsfunctie' de gebruikelijke term is onder (wetenschappelijke) statisici. Net zoals in het Engels 'Empirical distribution function', in het Duits 'Empirische Verteilungsfunktion' en in het Frans 'Fonction de répartition empirique'. De door jou genoemde benaming 'cumulatieve frequentieverdeling' wordt mogelijk wel hier en daar gebruikt, maar heeft als bezwaar dat niet naar de empirie, de steekproef, verwezen wordt. Bovendien is de term verdeling eigenlijk niet geschikt om de verdelingsfunctie aan te duiden. Het is misschien wel goed om in het lemma ook deze benaming te vermelden. Ik zal eens nadenken in welke vorm dat het beste kan gebeuren. Madyno (overleg) 17 mei 2014 10:58 (CEST)Reageren

Beginzinnen bewerken

Ik ga niet het hele artikel ontleden hoor, dat vind ik niet de moeite waard. Maar laat ik toch over de beginzin van het artikel ook maar wat opmerken. Er staat nu:

  • In de statistiek is de empirische verdelingsfunctie de (stochastische) verdelingsfunctie die zo goed mogelijk bij de gevonden data past. Het is een trapfunctie die telkens een sprong ter grootte 1/n maakt in elk van de n waarnemingen.

De eerste en de tweede zin spreken elkaar tegen. In de eerste zin is sprake van een stochastische functie, in de tweede zin van een deterministische functie (nl. gebaseerd op feitelijke waarnemingen). In de eerste zin staat dat de functie "zo goed mogelijk bij de gevonden data past", in de tweede zin wordt de functie gelijkgesteld aan de cumulatieve frequentie van de data. Marcocapelle (overleg) 17 mei 2014 09:06 (CEST)Reageren

Het is in de statistiek altijd een groot probleem consquent het onderscheid te maken tussen een steekproeffunctie als functie en als resultaat na waarneming. Dat speelt ook hier. Ik zal er nog verder over nadenken. Madyno (overleg) 17 mei 2014 11:01 (CEST)Reageren
Haha, het is een zelfgecreëerd probleem, je zou namelijk in deze context helemaal niet over een functie moeten praten! Nog afgezien van dat het maar zelden zo genoemd wordt (de gebruikelijke term is cumulatieve frequentieverdeling), heeft ook helemaal geen praktisch nut om hier van een functie te spreken. Functies hebben pas praktisch nut als je ze kunt integreren en/of differentiëren (zoals kansdichtheidsfuncties), een trapsgewijze functie kom je bij mijn beste weten in geen enkele toepassing tegen. Marcocapelle (overleg) 17 mei 2014 16:06 (CEST)Reageren
Uit wat je zo zegt krijg ik de indruk dat je niet erg op de hoogte met functies en ook niet met statistiek. Je doet er beter aan van de artikelen wat te leren. Madyno (overleg) 17 mei 2014 21:24 (CEST)Reageren
Helaas, het is net andersom. Marcocapelle (overleg) 18 mei 2014 07:21 (CEST)Reageren
Heren, op de persoon spelen helpt niet in de discussie volgens mij. Inhoudelijk: een trapfunctie is ook een functie; het is niet zo dat we een functie pas een functie noemen als deze overal differentieerbaar is. Groeten, Bob.v.R (overleg) 18 mei 2014 13:48 (CEST)Reageren
Terugkeren naar de pagina "Empirische verdelingsfunctie".