fredag den 16. september 2011

Frekventisme og Bayesianisme

Det kommer måske som en overraskelse for de fleste, at der findes to fundamentalt forskellige retninger indenfor statistisk. To vidt forskellige tilgange til at løse det grundliggende problem at komme frem til en konklusion baseret på et statistisk talmateriale. Disse to tilgange kaldes Frekventisme og Bayesianisme.

Lad os for eksempel sige at vi ønsker at finde ud af hvor mange procent af stemmerne hhv. rød og blå blok får ved næste valg. Vi laver en rundspørge, og øvelsen går nu ud på at sige noget om usikkerheden på vores resultat.

I den frekventistiske tilgang undersøger vi hvordan resultatet ville ændre sig, hvis vi gentog rundspørgen. Vi kan fx. beregne et 95% konfidensinterval. Fortolkningen af sådan et interval er lidt kryptisk, nemlig at 95% af sådanne intervaller vil indeholde den korrekte stemmeandel. Laver vi en ny meningsmåling hver dag, vil den korrekte stemmeandel altså ligge indenfor vores interval 19/20 gange.

I den Bayesianske tilgang undersøger vi direkte sandsynlighedsfordelingen for stemmeandelen. Det kræver dog at man specificerer sandsynlighedsfordelingen som den ser ud før man har set data. Denne såkaldte prior-fordeling kan fx. være en flad fordeling fra 0%-100%, hvilket betyder at man på forhånd ikke har nogen viden af betydning. Herefter kan man som i den frekventistiske tilgang også beregne et 95% interval, som på engelsk kaldes et "credible interval". Dette interval er lidt nemmere at fortolke, idet det direkte betyder at stemmeandelen med 95% sikkerhed ligger indenfor intervallet.

Ingen kommentarer:

Send en kommentar