Vanaf 1848 worden in Nederland systematisch allerlei gegevens over het weer bijgehouden. Gemiddeld valt er jaarlijks mm neerslag in de Bilt. Grotere afwijkingen dan mm van dit gemiddelde zijn nooit voorgekomen. Op grond van die jarenlange ervaring maakt men een plaatje van de kansverdeling van de neerslag voor het komend jaar.
Hoe ziet dat plaatje eruit, denk je? Vermeld de relevante gegevens.
Stel dat er in een jaar mm neerslag viel
Vind je dat extreem weinig of valt het wel mee? Waarom?
Hiernaast staan twee mogelijke antwoorden op vraag a.
Wat is je bezwaar tegen elk van deze antwoorden?
Over een klokvormige kromme
In de simulaties in de vorige paragraaf kwam je hetzelfde soort plaatje tegen: de zogenaamde
klokvorm. De klokvorm heeft de volgende kenmerken.
Symmetrie om het gemiddelde: afwijkingen naar boven zijn even waarschijnlijk als even grote afwijkingen naar beneden.
Hoe groter de afwijking, des te kleiner is de kans dat die optreedt.
Erg grote afwijkingen komen praktisch niet voor.
In veel voorbeelden in de natuur en bij het menselijk handelen komt de klokvorm voor (vaak bij benadering). Dat deze verdeling vaak voorkomt, is ontdekt in de negentiende eeuw. De belangrijkste onderzoeker was de Belg Quételet. In 1835 publiceerde hij een boek met statistisch materiaal over allerlei grootheden betreffende een mens (bijvoorbeeld de lengte van 18-jarige jongens). Hij merkte op dat de grootheden klokvormig verdeeld waren rond een gemiddelde. Een individuele afwijking van dat gemiddelde kwam door toevallige oorzaken. Hij voerde het idee van de “volmaakte” mens in: dat is de mens die alle grootheden gemiddeld heeft. Heel iets anders dan wat als ideaal gezien wordt!
Teken voor elk van de volgende voorbeelden een plaatje zoals
hiernaast. Op de horizontale as wordt de genoemde grootheid
uitgezet.
Schrijf bij de horizontale as de eenheid waarin je meet. (Bij het
eerste voorbeeld is de grootheid lengte en is de eenheid cm.)
Schrijf bij de drie streepjes op de horizontale as getallen die
redelijk kloppen met de werkelijkheid.
Lengte van een Nederlandse jongen van jaar.
Leeftijd van een vrouw als ze moeder wordt (haar eerste kind krijgt).
Tijdsduur van een autorit Arnhem-Nijmegen ( km) in de ochtendspits.
Het precieze gewicht in een zogenaamd kilopak suiker.
Zoals gezegd, zijn veel verdelingen klokvormig, of ze lijken daar sterk op. We spreken wel
van een normale verdeling. De term normale verdeling is ingevoerd door de Engelse
statisticus Karl Pearson (1857-1936). Het plaatje bij opgave 94 staat model voor de normale
verdeling.
Maar niet alle verdelingen zijn normaal.
Geef zelf nog een paar praktijkvoorbeelden van (ongeveer) normale verdelingen.
Geef zelf ook een paar voorbeelden waarbij de verdeling duidelijk niet normaal is.
Geen van de volgende verdelingen is normaal.
![]() |
![]() |
Zeg van elke verdeling, waarom hij niet normaal is.
Zoals je gezien hebt, kun je uit een zogenaamde verdelingskromme kansen of percentages aflezen. Daarvoor is de oppervlakte onder de kromme bepalend.
Op 6 mei 1998 vonden er verkiezingen voor de Tweede Kamer plaats. De laatste dagen voor de verkiezingen werd de uitslag voorspeld. Er zijn twee grote bureaus die zich daarmee bezighouden: Inter/View en Nipo. Zij houden peilingen onder de Nederlandse bevolking. Op grond van die peilingen voorspellen de bureaus voor elke politieke partij een percentage van de stemmen. Maar dat voorspelde percentage klopt natuurlijk zelden precies: er is een onzekerheid. Welke percentages voorspeld werden voor de drie grote partijen, drie dagen voor de verkiezingen, kun je aflezen uit onderstaand plaatje. Bovendien kun je de erin zien in hoeverre de voorspellingen betrouwbaar zijn.
We bekijken het percentage voor de PvdA.
Welk percentage is voorspeld voor de PvdA?
Tussen welke twee grenzen ligt het percentage (met grote waarschijnlijkheid)?
Bij welke partij is de onzekerheid van de voorspelling het grootst? Bij welke partij is de onzekerheid het kleinst? Waar zie je dat aan?
De oppervlakte onder elk van de drie krommen is hetzelfde.
Waarom moet dat zo zijn?
Hoe groot ongeveer is volgens het plaatje de kans dat de PvdA meer dan % van de stemmen haalt?
Verkeersdoden
Het aantal verkeersdoden in een jaar in Nederland schommelt de laatste jaren rond de . Op grond van het verleden wordt het aantal verkeersdoden voor komend jaar voorspeld. De voorspelling en de onzekerheid daarvan lees je af uit het plaatje.
Schat hoe groot de kans is dat het aantal verkeersdoden onder de ligt.
Schat hoe groot de kans is dat het aantal verkeersdoden ligt tussen en .
De lengte van -jarige jongens in Nederland is klokvormig verdeeld. Het percentage van de jongens die langer zijn dan cm wordt gegeven door de gekleurde oppervlakte.
Hoe groot schat jij dat dat percentage ongeveer is?
Schat hoeveel procent van de jongens een lengte heeft tussen en cm.
Een grootheid is verdeeld volgens de kromme hiernaast.
Op de horizontale as zijn twee mogelijke waarden van
aangegeven: en .
De kans dat de waarde van ligt tussen en wordt gegeven
door de oppervlakte onder de kromme tussen en .
Preciezer: de volgende drie uitspraken komen op hetzelfde neer.
De grijze oppervlakte is % van de totale oppervlakte onder de kromme.
Bij een groot aantal herhalingen zal in ongeveer % van de gevallen een waarde tussen en hebben.
De kans dat is .
Hieronder staat een histogram van de cijfers van een wiskunde B-toets.
Bereken het gemiddelde cijfer.
Bereken de standaardafwijking van de cijfers.
Je kunt de standaardafwijking ook op je GR berekenen.
Zoek uit hoe dat op jouw machine gaat.
In 2009 werden in Nederland in totaal kinderen levend geboren. Hieronder staan een frequentietabel en een frequentiehistogram van de leeftijd van de moeders. De gegevens zijn ontleend aan het CBS StatLine. De verdeling is klokvormig.
Voer op de GR de leeftijden in.
Controleer het histogram door het op de GR te tekenen.
Bereken op de GR het gemiddelde en de standaardafwijking van de leeftijd van de moeders.
Als je als leeftijden , , ... invoert, krijg je als gemiddelde ongeveer jaar.
In werkelijkheid is het gemiddelde echter jaar.
Kun je dat halve jaar verschil verklaren?
Ga na dat in het frequentiehistogram , en goed zijn aangegeven.
Hoeveel procent van de moeders is ouder dan , hoeveel procent is ouder dan en hoeveel procent is ouder dan ?
Klokvormige verdelingen
Veel data zijn zo ongeveer klokvormig verdeeld zoals hiernaast schetsmatig is aangegeven. Er is één top en de verdeling is symmetrisch en loopt geleidelijk af tot . Jr kunt hierbij denken aan juli-temperaturen, lengte van rekruten, de eindexamencijfers voor het vak wiskunde A of het aantal jongens bij geboortes in een zekere gemeente. In opgave 101 zie nog zo'n voorbeeld. Bij die verdelingen zijn grote afwijkingen van het gemiddelde zeldzaam.
Bij klokvormige verdelingen gelden de volgende vuistregels voor de afwijkingen van het gemiddelde:
afwijkingen van meer dan zijn heel gewoon: dit gebeurt in ongeveer % van de gevallen,
afwijkingen van meer dan zijn tamelijk zeldzaam: dit gebeurt in ongeveer % van de gevallen,
afwijkingen van meer dan zijn uiterst zeldzaam: dit gebeurt in ongeveer % van de gevallen.
Zie de vier plaatjes hiernaast.
Bij de volgende opgaven mag je er telkens van uitgaan dat er sprake is van een normale verdeling.
Op een weg binnen de bebouwde kom (waar km/u de maximumsnelheid is) wordt vaak te hard gereden. Controles wijzen uit dat de gemiddelde snelheid km/uur is en de bijbehorende standaardafwijking km/uur.
Hoeveel procent van de passerende voertuigen rijdt te hard?
Hoeveel procent van de passerende voertuigen rijdt tussen en km/uur?
Klas 4V2 (met leerlingen) heeft bij Engels een schriftelijke overhoring gehad over een groot aantal woordjes. Gemiddeld had een leerling fout. De standaardafwijking van het aantal fouten was . De toegepaste normering is één punt eraf per vijf fouten.
Schat het laagste en het hoogste cijfer in deze klas.
Schat het aantal onvoldoendes () in deze klas.
Neem aan dat de leeftijd van leerlingen in vwo 5 aan het begin van een schooljaar (1 september) normaal verdeeld is met een gemiddelde van jaar en een standaardafwijking van 0,8 jaar. (Hierbij rekenen we de leeftijd als voortdurend oplopende tijd sinds de geboorte, zodat iemand bijvoorbeeld jaar kan zijn.)
Is de leeftijd van deze leerlingen aan het eind van het schooljaar (op 1 juli) ook normaal verdeeld? Wat is dan het gemiddelde en wat is de standaardafwijking?
Is de leeftijd van deze leerlingen gerekend in maanden (op 1 september) ook normaal verdeeld? Wat is dan het gemiddelde en wat is de standaardafwijking (beide in maanden)?
De lengte van -jarige Engelse jongemannen is normaal verdeeld met een gemiddelde van cm en een standaardafwijking van cm. Hun gewicht is ook normaal verdeeld en wel met een gemiddelde van kg en een standaardafwijking van kg.
Wat wordt het gemiddelde en wat de standaardafwijking als de lengtes in “feet” en “inches” worden weergegeven? ( foot = cm en 1 inch = 2,54 cm)
Wat wordt het gemiddelde en wat de standaardafwijking als de gewichten in “stones”
worden weergegeven?
( stone = kg)
Temperaturen kunnen zowel in graden Celsius als in graden Fahrenheit worden uitgedrukt.
De temperatuur in graden Celsius noemen we en de
temperatuur in graden Fahrenheit . Er geldt: .
Wat wordt de gemiddelde julitemperatuur van °C en een bijbehorende standaardafwijking van °C als de temperaturen naar Fahrenheit worden overgezet?
Een normale verdeling wordt volledig bepaald door twee parameters:
het gemiddelde,
de standaardafwijking.
Het gemiddelde en de standaardafwijking worden in de statistiek met Griekse letters aangegeven:
(spreek uit mu) voor het gemiddelde,
(spreek uit sigma) voor de standaardafwijking.
Stel dat een grootheid normaal verdeeld is met
gemiddelde en standaard-afwijking .
De kans dat de grootheid een waarde tussen en aanneemt ligt dan vast. Deze kans noteren we met: .
(Zie de figuur hierboven links.)
Op de GR kun je deze kans berekenen, in de figuur links met een vraagteken aangegeven.
Ook kun je met de GR het getal vinden (in de figuur rechts aangegeven met een vraagteken) als je de kans kent met
.
Zoek uit hoe dat op jouw GR gaat.
Ga met je GR bijvoorbeeld na dat voor
ongeveer vindt.
Ook dat je voor het getal met vindt:
.
In de volgende opgaven moet je beide opties veel gebruiken.
We gaan er vanuit dat je ook en
op de GR kunt berekenen.
Een tomatenkweker heeft geoogst. De vruchten variëren in grootte en gewicht. Het gewicht is
normaal verdeeld met gram en gram.
In totaal zijn tomaten geoogst. De
oogst wordt op gewicht gesorteerd.
De drie gewichtsklassen zijn:
klasse A:tot gram,
klasse B:van tot gram,
klasse C:meer dan gram.
Hoeveel procent van de oogst komt in elk van de klassen terecht?
De opbrengst van een tomaat hangt af van zijn gewichtsklasse:
klasse A: cent,
klasse B: cent,
klasse C: cent.
Welke opbrengst mag de kweker voor zijn hele oogst verwachten?
In 1986 werd van dienstplichtige -jarigen de lengte opgemeten.
Hun gemiddelde
lengte bleek cm te zijn en de standaardafwijking cm.
We willen weten hoeveel jongens cm of langer zijn.
Schets een normale kromme en geef daarbij de gegevens en het gevraagde aan.
Bereken met de GR hoeveel van de jongens naar verwachting cm of langer waren.
Jongens die langer waren dan cm of korter dan cm werden op grond van hun lengte afgekeurd.
Teken weer een bijpassend plaatje. Bereken hoeveel jongens er in 1986 op grond van hun lengte werden afgekeurd.
Bereken vanaf welke lengte een jongen tot de % langste behoorde.
Bereken tot welke lengte een jongen tot de % kleinste behoorde.
Een ei weegt gemiddeld gram met een standaardafwijking van gram. Men verdeelt eieren in verschillende gewichtsklassen: S staat voor Small, dat is met een gewicht onder de gram, M betekent Medium, dat is met een gewicht van tot gram, de L staat voor Large, dat is met een gewicht van tot gram en XL is Extra Large; dat zijn eieren die zwaarder zijn dan gram.
Bereken hoeveel procent van de eieren in de verschillende gewichtsklassen terechtkomt.
Stel dat de eieren worden ingedeeld in vier opeenvolgende gewichtsklassen die elk % van het totaal bevatten.
Bereken dan de bijbehorende gewichtsgrenzen.
Twee fabrikanten brengen voor dezelfde prijs eenzelfde type lamp op de markt. Merk A heeft een gemiddelde van branduren en een standaardafwijking van uur. Merk B heeft een gemiddelde van uur en een standaardafwijking van uur. Je wilt een lamp kopen die minstens uur moet branden.
Welk merk heeft jouw voorkeur?
Nederlandse euromunten worden in Utrecht geslagen bij de Koninklijke Nederlandse Munt. De afmetingen en gewichten zijn aan zeer strikte regels gebonden.
munstsoort |
metaal |
middellijn |
gewicht |
twee euro |
koper/nikkel/messing |
||
een euro |
koper/nikkel/messing |
23,25 |
7500 |
vijftig cent |
Nordic gold |
||
twintig cent |
Nordic gold |
22,25 |
5740 |
tien cent |
Nordic gold |
19,75 |
4100 |
vijf cent |
staal/koper |
21,25 |
3920 |
twee cent |
staal/koper |
18,75 |
3060 |
een cent |
staal/koper |
16,25 |
2300 |
Het gewicht van een nieuw geslagen euromunt is normaal verdeeld met mg en mg. Munten die meer dan mg afwijken van het vereiste gewicht mogen niet in omloop worden gebracht.
Waarom gelden er zulke strikte eisen voor het toegestane gewicht?
Bereken welk percentage van de nieuw geslagen één-euromunten niet in omloop zal worden gebracht.
Per jaar zijn er miljoen nieuwe één-euromunten nodig.
Hoeveel moeten er geslagen worden om aan die vraag te kunnen voldoen?
In een fabriek worden blikken gevuld met (gemiddeld) liter verf.
De vulmachine levert niet
blikken van precies liter. De inhoud van de blikken is normaal verdeeld met een
standaardafwijking van milliliter.
We willen weten hoeveel procent van de blikken meer dan ml verf te weinig bevat.
Schets een normale kromme en kleur de oppervlakte die hoort bij deze vraag.
Bereken hoeveel procent van de blikken meer dan ml verf te weinig bevat.
Een liter verf weegt kg.
Bereken hoeveel procent van de blikken minder dan gram verf bevat.