Gemiddelde, modus, mediaan: wat is het en wat heb je eraan?
Wie wil weten hoe groot een typische Nederlander is, kan hier een goed beeld van krijgen door de gemiddelde lengte van een Nederlander te berekenen. Wie daarentegen benieuwd is naar het inkomen van een typische Nederlander, kan beter niet het gemiddelde inkomen berekenen aangezien er enkele Nederlanders zijn met een zeer hoog inkomen die het gemiddelde 'omhoog trekken'. In dit geval geeft het modale inkomen een beter beeld van de financiële situatie van een typische Nederlander. Het gemiddelde en de modus zijn, samen met de mediaan, drie centrummaten. Zij geven alle drie een idee van waar 'het centrum' van een verzameling getallen ligt, maar doen dit ieder op een andere manier. Zoals het voorgaande voorbeeld laat zien, is in sommige situaties de ene centrummaat informatiever, terwijl andere situaties om een andere centrummaat vragen.
Inhoud
Het gemiddelde, de modus en de mediaan zijn drie centrummaten, die elk op een eigen manier zijn gedefinieerd.
Rekenkundig gemiddelde
Het gemiddelde is het getal dat je krijgt wanneer je de som van een reeks getallen deelt door het aantal opgetelde getallen. Dit wordt ook wel het rekenkundige gemiddelde genoemd.
Meetkundig gemiddelde of geometrisch gemiddelde
Wanneer over 'het gemiddelde' wordt gesproken, dan wordt doorgaans het rekenkundige gemiddelde, zoals hierboven toegelicht, bedoeld. Er bestaat echter ook een tweede, alternatieve definitie van het gemiddelde, namelijk het meetkundige gemiddelde (ook wel het geometrische gemiddelde genoemd). Bij dit gemiddelde worden
n getallen met elkaar vermenigvuldigd waarna de n-de-machtswortel van de uitkomst wordt gemeten. Het meetkundige gemiddelde is vooral interessant wanneer een procentuele groei berekend moet worden, zoals
hieronder wordt toegelicht.
Modus
De modus van een reeks getallen is de meestvoorkomende waarneming.
Mediaan
De mediaan van een reeks getallen is de middelste waarneming van de getallen, wanneer je ze in volgorde van klein naar groot plaatst. De helft van de getallen uit een reeks staat vóór de mediaan en is kleiner of gelijk aan de mediaan, de andere helft staat na de mediaan en is groter of gelijk aan de mediaan. Bij een even aantal getallen is er geen getal dat precies in het midden ligt. Het is gebruikelijk om dan het gemiddelde van de twee middelste getallen te gebruiken als mediaan.
Om de hierboven gegeven definities toe te lichten, wordt hieronder het (rekenkundige) gemiddelde, de modus en de mediaan van een cijferreeks berekend. De cijferreeks bestaat uit de cijfers die tien leerlingen hebben behaald voor een rekentoets:
Leerling | Cijfer |
Adam | 4 |
Barbara | 9 |
Chris | 7 |
Dominique | 3 |
Erik | 6 |
Francine | 6 |
Gerard | 6 |
Henriëtte | 6 |
Isaak | 3 |
Julia | 10 |
Gemiddelde berekenen
Het gemiddelde cijfer wordt berekend aan de hand van twee stappen. Eerst, worden alle getallen bij elkaar opgeteld en daarna wordt de uitkomst hiervan gedeeld door het aantal cijfers (in dit geval 10, aangezien er 10 leerlingen in de klas zijn).
Stap 1: 4 + 9 + 7 + 3 + 6 + 6 + 6 +6 + 3 + 10 = 60
Stap 2: 60 : 10 = 6
Het gemiddelde cijfer in deze klas is dus een 6.
Modus berekenen
De modus 'bereken' je door te tellen hoe vaak elk cijfer voorkomt (de 'frequentie' van het getal). Voor de toets zijn de cijfers 3, 4, 6, 7, 9 en 10 behaald. In de onderstaande tabel toont de tweede kolom hoe vaak elk cijfer is behaald in de klas. Wanneer je alle frequenties bij elkaar optelt, dan komt er uiteraard weer 10 uit.
Cijfer | Frequentie |
3 | 2 |
4 | 1 |
6 | 4 |
7 | 1 |
9 | 1 |
10 | 1 |
Zoals te zien in de tabel, komt het cijfer 6 het vaakst voor in deze klas. 6 is zodoende in dit geval niet alleen het gemiddelde, maar ook de modus. Het gemiddelde is uiteraard niet altijd gelijk aan de modus, maar in deze cijferreeks toevallig wel.
Mediaan berekenen
De mediaan 'bereken' je door de cijfers allereerst te sorteren van laag naar hoog en vervolgens de middelste waarneming te zoeken. In de onderstaande tabel zijn de cijfers geordend van laag naar hoog:
Leerling | Cijfer |
Isaak | 3 |
Dominique | 3 |
Adam | 4 |
Erik | 6 |
Francine | 6 |
Gerard | 6 |
Henriëtte | 6 |
Chris | 7 |
Barbara | 9 |
Julia | 10 |
Aangezien er 10 waarnemingen zijn, een even getal, moet je zoeken naar de twee middelste waarnemingen; in dit geval de vijfde en zesde waarneming die in de tabel hierboven in lichtgrijs zijn gemarkeerd. Vervolgens, moet het gemiddelde van deze twee waarnemingen worden genomen: (6 + 6) : 2 = 6. Aangezien de twee waarnemingen aan elkaar gelijk zijn, is het gemiddelde van de waarnemingen uiteraard hetzelfde als de waarnemingen zelf.
In deze cijferreeks is 6 dus niet alleen het gemiddelde en de modus, maar ook de mediaan.
Efficiëntie versus robuustheid
Bij de keuze tussen het (rekenkundige) gemiddelde, de modus of de mediaan wordt een afweging gemaakt tussen wat in de statistiek
efficiënte en
robuustheid wordt genoemd. Efficiëntie houdt in dat je alle beschikbare informatie gebruikt, terwijl robuustheid juist inhoudt dat sommige informatie — met name, grote uitschieters (ook wel 'uitbijters' genoemd, of
outliers in het Engels) — geen of zo min mogelijk van invloed is op de uitkomst van een berekening.
Rekenkundig gemiddelde versus modus of mediaan
Of efficiëntie dan wel robuustheid de voorkeur verdient, moet per situatie worden beoordeeld. Doorgaans wordt bij de aanwezigheid van grote uitschieters — zoals bij de inkomensverdeling in een land — de voorkeur gegeven aan de mediaan of modus, maar niet altijd. Een leerling die bijvoorbeeld op de toetsen van een vak een 6, 7, 6 en 1 heeft gehaald, kan bij zijn leraar betogen dat de mediaan (een 6) of modus (eveneens een 6) van deze cijfers een beter beeld geeft van zijn beheersing van dit vak dan het door de uitschieter (een 1) vertekende gemiddelde (een 5), maar dit betoog zal vermoedelijk stranden in de onverbiddelijkheid van het examenreglement.
Meetkundig gemiddelde
Doorgaans wordt bij een reeks getallen een rekenkundig gemiddelde berekend, maar soms is een meetkundig gemiddelde 'juister'. Dit is met name het geval wanneer een jaarlijks groeipercentage moet worden berekend. Stel bijvoorbeeld, een jongeman neemt in één jaar 10% toe in lichaamsgrootte, het volgende jaar 15%, het jaar daarop 20% en in het laatste jaar van zijn groeispurt 5%. Indien hem wordt gevraagd hoeveel hij nu over deze periode per jaar is gegroeid, dan geeft het rekenkundige gemiddelde (12,5%) een vertekend beeld. Immers, wie vier jaar lang 12,5% groeit, is na vier jaar 60,2% gegroeid (1,125 ^ 4 - 1 = 0,6018...). De jongeman in kwestie is echter door zijn groeispurt in totaal slechts 59,4% groter geworden (1,1 * 1,15 * 1,2 * 1,05 - 1 = 0,5939).
Voor dit (kleine) verschil kan gecorrigeerd worden door niet een rekenkundig gemiddelde maar een meetkundig gemiddelde te berekenen. Dit gebeurt door de vier groeicijfers (1,1; 1,15; 1,2 en 1,05) met elkaar te vermenigvuldigen en vervolgens de vierde-machtswortel van de uitkomst te nemen, oftewel: (1,1 * 1,15 * 1,2 * 1,05) ^ (1 / 4) - 1 = 0,1236.... De jongeman is dus tijdens zijn vier jaar durende groeispurt 'gemiddeld' elk jaar ongeveer 12,36% gegroeid. Op deze manier is hij tijdens zijn totale groeispurt 59,4% in lichaamsgrootte toegenomen (1,1236 * 1,1236 * 1,1236 * 1,1236 - 1 = 0,594 (afgerond op drie decimalen)).