InfoNu.nl > Educatie en School > Methodiek > Inferentie: zuiverheid, vertekening en variabiliteit

Inferentie: zuiverheid, vertekening en variabiliteit

Inferentie: zuiverheid, vertekening en variabiliteit Op basis van steekproefgegevens uitspraak doen over de populatie, is de betekenis van inferentie bij statistiek. Waarom we op basis van steekproefgegevens uitspraak mogen doen over de populatie wordt o.m. bepaald door de centrale limietstelling, die zegt dat de steekproevenverdeling van vele steekproefgrootheden de populatieverdeling steeds dichter en dichter zal naderen, naarmate onze steekproefomvang groter wordt. Er kan sprake zijn van zuiverheid, vertekening en variabiliteit.

Zuiverheid

Populatieparameter

Wanneer we een steekproefgrootheid gebruiken voor het schatten van een populatieparameter (bv. het gemiddelde), is deze parameter een zuivere schatter, als de verwachting hiervan gelijk is aan de waarde van de populatieparameter.

Uitgelegd aan de hand van voorbeeld

Stel dat het gemiddelde loon in een steekproef van 100 mensen gelijk is aan 1400, en dit gemiddelde is gelijk over de hele populatie (dus bv. over alle inwoners van Nederland), dan spreken we van een volledige zuivere schatter van het populatiegemiddelde aan de hand van onze steekproef. Het steekproefgemiddelde is dan een zuivere voorspeller van ons populatiegemiddelde. Indien deze maar in zeer kleine mate afwijkt van het populatiegemiddelde (bv. 1405) kan men dus ook zeggen dat deze een grote zuiverheid kent en maar in zeer kleine mate vertekend is.

Vertekening

Een steekproefgrootheid is vertekend als het gemiddelde van zijn steekproevenverdeling niet samenvalt met de waarde van de parameter in de populatie. Zoals in het vorige voorbeeld gedemonstreerd, spreken we daar van 'vertekening' als het gemiddelde in de populatie (redelijk opvallend) niet hetzelfde is. Wanneer uit onze populatie naar boven komt dat het gemiddelde loon bv. 1500 is (in tegenstelling tot 1400 via onze steekproef bepaald), zien we dat dit een redelijk groot verschil is met onze steekproefverwachting. Vertekening is dus de tegenhanger van zuiverheid en dus een synoniem van 'niet zuiver'.

Variabiliteit

Steekproefgrootheid

Een steekproefgrootheid heeft ook variabiliteit. Dit is de hoeveelheid waarin de steekproefgrootheid tussen de verschillende steekproeven zal variëren. Hoe kleiner deze variabiliteit is, hoe nauwkeuriger de steekproefgrootheid wordt als schatting van de populatieparameter.

Voorbeeld

Wanneer het gemiddelde loon uit 3 verschillende steekproeven van 100 mensen uitkomt op bv. 1400, 1460 en 1320 kunnen we dus spreken van een redelijke variabiliteit in onze steekproefverdeling. Per steekproef blijkt het gemiddelde loon dan redelijk van elkaar te verschillen. Hoe groter de variabiliteit tussen deze verschillende steekproeven, hoe minder nauwkeurig de steekproefgrootheid wordt als schatter van de populatieparameter.

Kanttekening

In verband met het vergelijken van onze steekproefparameter met onze populatieparameter kunnen we ons nog het volgende afvragen:
Wanneer we via een steekproevenverdeling dus een populatieparameter gaan schatten, hoe kunnen we uiteindelijk dan bepalen of deze zuiver is of niet als we niet over de waarde van de populatieparameter beschikken. Want zuiverheid duidt dus op het feit dat deze overeenkomt met de parameter in de populatie. Wat moeten we dan doen als we niet kunnen vergelijken met de populatieparameter? Of is deze populatieparameter dan sowieso gegeven om mee te kunnen vergelijken? Omdat we dan anders toch ook niet kunnen weten of er sprake is van bv. vertekening in de steekproevenverdeling?

Antwoord

Op basis van theoretische inferentiële statistiek kan er gezegd worden dat indien we voor de steekproeftrekking de juiste procedures volgen (=correcte berekeningen doen), dat dan de steekproefuitkomst gemiddeld gesproken (dus als we de procedure vele malen zouden herhalen) zal overeenkomen met de populatieparameter. In één concrete steekproef zal de uitkomst eerder afwijken. Zuiverheid is dus een kenmerk van de procedure (die weerspiegeld wordt in de steekproevenverdeling) en niet van één concrete schatting
© 2011 - 2019 Brunos, het auteursrecht (tenzij anders vermeld) van dit artikel ligt bij de infoteur. Zonder toestemming van de infoteur is vermenigvuldiging verboden.
Gerelateerde artikelen
Statistiek de normale verdelingStatistiek de normale verdelingDe functie die voor continue kansvariabelen de kans als functie f van een zekere uitkomst x weergeeft, noemt men de kans…
Hoe formuleer ik een centrale vraag?Hoe formuleer ik een centrale vraag?Hoe formuleer ik een centrale vraag? Dit een probleem waar veel mensen mee zitten. Een centrale vraag moet duidelijk gef…
De 4 C's van diamantDe 4 C's van diamantOm de kwaliteit van een diamant te bepalen maakt men gebruik van de 4 C's van diamant: Carat, Colour, Clarity en Cut. De…
Diamant beoordelingHet mineraal diamant is het hardste materiaal dat bekend is. De ruwe diamant heeft een huid en glanst niet of nauwelijks…
De 4C's bepalen de waarde van uw diamantDe 4C's bepalen de waarde van uw diamantDiamanten zijn kristallen die volledig bestaan uit koolstof. De moleculen van diamanten zijn enorm hecht en gestructuree…
Bronnen en referenties
  • Inleidingsfoto: Geralt, Pixabay
  • Statistiek UA .

Reageer op het artikel "Inferentie: zuiverheid, vertekening en variabiliteit"

Plaats als eerste een reactie, vraag of opmerking bij dit artikel. Reacties moeten voldoen aan de huisregels van InfoNu.
Meld mij aan voor de tweewekelijkse InfoNu nieuwsbrief
Ik ga akkoord met de privacyverklaring en ben bekend met de inhoud hiervan
Infoteur: Brunos
Laatste update: 28-12-2016
Rubriek: Educatie en School
Subrubriek: Methodiek
Bronnen en referenties: 2
Schrijf mee!