Statistische methoden > Resultaten vergelijken
1234567Resultaten vergelijken

Theorie

Neem een dataset `x_1, x_2,...,x_n` en veronderstel dat de waarden op volgorde van klein naar groot staan. Dan zijn er een aantal bekende centrummaten.

  • De modus is de waarneming met de hoogste frequentie. Deze is vooral geschikt voor kwalitatieve variabelen.

  • De mediaan is het middelste waarnemingsgetal. Is het aantal even, dan is de mediaan het gemiddelde van de middelste twee.

  • Het gemiddelde bereken je door alle waarnemingsgetallen `x_i` bij elkaar op te tellen en te delen door het totale aantal. Dit schrijf je als:
    `bar(x) = (sum_(i=1)^n x_i) /n` met `sum_(i=1)^n x_i = x_1 + x_2 + ... + x_n`
    of als `bar(x) = (sum_(i=1)^n x_i*f_i) /n` als je met de frequentie `f_i` van elk waarnemingsgetal rekening houdt.
    De Griekse hoofdletter `Sigma` ( "sigma" ) is het somteken.

Centrummaten alleen zeggen nog weinig, er hoort steeds een spreidingsmaat bij. Er zijn drie spreidingsmaten.

  • De spreidingsbreedte is het verschil tussen het hoogste en laagste waarnemingsgetal.

  • De interkwartielafstand is het verschil tussen het eerste en derde kwartiel. Hierbij is het eerste kwartiel de mediaan van de eerste helft van de waarnemingsgetallen en het derde kwartiel die van de tweede helft. Bestaan de waarnemingen uit een oneven aantal waarden, dan wordt de mediaan van de hele set niet meegenomen om `Q_1` en `Q_3` te berekenen.

  • De standaardafwijking (of standaarddeviatie) is een maat die aangeeft hoe dicht de spreiding rondom het gemiddelde zit. De Griekse (kleine) letter `sigma` ( "sigma" ) is het teken voor standaardafwijking. De standaardafwijking vind je met:
    `σ = sqrt( (sum_(i=1)^n (x_i-bar(x))^2)/n)` of met `σ = sqrt( (sum_(i=1)^n (x_i-bar(x))^2*f_i)/n)` .

Met de spreidingsbreedte, mediaan en interkwartielafstand kun je een boxplot maken waarmee je gemakkelijk kunt overzien hoe de waarnemingsgetallen in vier even grote groepen zijn verdeeld.

verder | terug