Steekproefgrootte: probleem en wiskunde

Na het lezen van dit artikel leert u over het probleem en de wiskunde van de steekproefomvang.

Het probleem van de steekproefomvang:

We zullen nu een van de lastigste problemen met betrekking tot monstername beschouwen, namelijk het probleem van de steekproefomvang. "Wat moet de adequate omvang van de steekproef zijn in verhouding tot de bevolkingsomvang?" "Hoe groot zou een steekproef moeten zijn?" Zijn vragen die vaak door onderzoekstudenten worden gesteld. Xo Doorslaggevend antwoord op deze vraag kan worden gegeven.

Dit komt omdat de kwestie van de grootte alleen kan worden beantwoord als we elementen voor de populatie samplen op een manier dat elk element dezelfde kans heeft om in de steekproef te worden opgenomen, dat wil zeggen wanneer we het waarschijnlijkheidsontwerp van steekproeven overnemen.

Alleen het kansontwerp maakt de formulering van representatieve steekproefplannen mogelijk. Vandaar, maakt het mogelijk om representatieve bemonsteringsplannen op te stellen.

Daarom veronderstelt de vraag, "hoe groot de steekproef moet zijn om representatief te zijn voor de populatie van een aangewezen grootte?", De probabiliteitssteekproefprocedure. Bij gebrek aan deze procedure kan de representativiteit van de steekproef hoe dan ook groot slechts een kwestie van hoop en gissingen zijn.

De algemene misvattingen met betrekking tot de omvang van het monster zijn dat de grootte van het universum waaruit het monster wordt getrokken, bepalend is voor het aantal gevallen dat nodig is om een ​​adequaat of representatief staal van dat universum op te leveren.

We doen er goed aan meteen op te merken dat de nadruk niet moet liggen op het aantal gevallen in het universum, maar op hun aantal in de steekproef.

De wiskunde van voorbeeldformaat:

De fundamentele praktische vraag "Hoe de steekproefomvang bepalen die de gewenste mate van nauwkeurigheid oplevert zoals door de onderzoeker voor een bepaald onderzoek is bepaald?" Het bemonsteringsprobleem is natuurlijk hetzelfde in alle studies, dwz om te schatten of voorspellen iets over de bevolking op basis van kennis van iets over de steekproef.

De onderzoeker moet weten wat voor soort statistieken over het monster het doel dienen, bijvoorbeeld percentages, gemiddelden, standaarddeviatie, enz., Voor een dergelijke schatting. Dit is belangrijk omdat verschillende soorten statistieken nuttig zijn, afhankelijk van de gewenste mate van nauwkeurigheid in voorbeeldterugvoeringen die op hun beurt worden aangeboden door verschillende steekproefomvang.

Gemiddelden en percentages zijn de meer algemeen gewenste statistieken, daarom zullen we ons specifiek bezighouden met de kwestie van steekproefomvang die overeenkomt met de gewenste nauwkeurigheid ten aanzien van gemiddelden en percentages.

Omdat het door de onderzoeker getrokken monster slechts een van de vele mogelijke monsters van het universum is die hij toevallig zou kunnen hebben gekozen, moet hij weten hoeveel vertrouwen hij op het monster kan stellen als de vertegenwoordiger van het 'universum' waarover hij wil iets weten of met betrekking waarnaar hij wil generaliseren.

Hij moet weten hoe groot het monster moet zijn om hem een ​​bevredigend niveau van nauwkeurigheid te geven. Deze berekening is mogelijk door een beroep te doen op de wiskunde, aangezien bij willekeurige steekproeven (kanssteekproefontwerp) waarbij elk item in het universum een ​​te specificeren kans op opname in de steekproef heeft, de precisie van de voorspelling of schatting gerelateerd is aan de vierkantswortel van het aantal items in het monster.

Alvorens verder te gaan met de berekening van de vereiste omvang van de steekproef voor een bepaald onderzoek, is het in de praktijk noodzakelijk enige voorlopige informatie over de populatie of het universum te verzamelen.

Als de onderzoeker van plan is de steekproef te gebruiken om een ​​schatting te maken van de gemiddelde maat van een bepaald kenmerk in het universum, moet hij een voorlopige schatting hebben van de standaardafwijking (spreiding) in de verdeling van de waarden van items in het universum met respect naar de gegeven eigenschap.

De onderzoeker die het bereik van waarden (de spreiding) leert kennen met betrekking tot een bepaald kenmerk in het universum, kan een voorlopige schatting van de standaarddeviatie krijgen door dit bereik te delen door 6, omdat de standaardafwijking van het (eindige) universum mogelijk is. voor alle praktische doeleinden wordt aangenomen dat ze ongeveer 1/6 van het volledige variatiebereik zijn.

Met andere woorden, het spreidingsbereik van een verdeling kan worden genomen om 6 standaardafwijkingseenheden te omvatten. De voorlopige informatie over het universum kan worden verkregen door middel van een pilotstudie, resultaten van eerdere enquêtes, rapporten gepubliceerd door statistische bureaus, rekening houdend met deskundigen in het veld, enz.

De onderzoeker moet, alvorens over te gaan tot het berekenen van de omvang van de steekproef, beslissen over het verwachte nauwkeurigheidsniveau van de schattingen. Deze verwachting is voornamelijk gebaseerd op het doel van het onderzoek.

Met andere woorden, de onderzoeker moet beslissen:

(a) Hoeveel fouten in de schatting die uit de steekproef moet worden afgeleid (in vergelijking met de werkelijke waarde, dwz de waarde van het 'universum'), kan worden getolereerd (wordt een foutenmarge of een nauwkeurigheidslimiet genoemd) en

(b) Met hoeveel zekerheid kan worden gesteld dat de schatting binnen deze foutenmarge valt (genoemd, mate van vertrouwen of waarschijnlijkheid).

Het zal echter gepast zijn om deze in meer detail te beschouwen, momenteel:

(a) Foutmarge of uiterste nauwkeurigheid:

De fundamentele vraag hier is: 'Hoeveel bedraagt ​​het percentage of het gemiddelde dat moet worden veiliggesteld uit het onderzoek van de steekproef, dat waarschijnlijk zal afwijken van het werkelijke gemiddelde (van de bevolking) en dat het nog steeds kan worden getolereerd?' De onderzoeker tolereert 5% fouten of hij kan nauwkeurigheid vereisen binnen een limiet van 2%.

Het hangt allemaal af van hoe nauwkeurig of precies hij bepaalde feiten wil weten. Stel dat de onderzoeker van tevoren wil weten wie van de twee kandidaten die de verkiezingen betwisten de zetel zal winnen. Als de stemming dichtbij komt, kan de onderzoeker het zich veroorloven om alleen een kleinere fout te tolereren als hij praktisch zeker is.

Hij kan bijvoorbeeld de toelaatbare fout op minder dan 2% instellen. Aan de andere kant, als de verkiezing eenzijdig lijkt te zijn en nogal bevooroordeeld ten gunste van een bepaalde kandidaat, kan de onderzoeker mogelijk de resultaten zelfs met een veel grotere fout in de schatting voorspellen.

Als de steekproefsgewijze enquête zou onthullen dat 60% van de stemmen in het voordeel van een kandidaat zou zijn, zou een fout zo hoog als 9% kunnen worden getolereerd. In dit geval, zelfs als de steekproef-poll de meest ongelukkige steekproef had getrokken die 9% van de werkelijke waarde afwijkt, zou de werkelijke waarde nog steeds 51% zijn, dwz 1% boven de 50%, wat het kritieke punt is.

Dus zowel de geschatte waarde van 60% als de werkelijke waarde van 51% zou boven het kritieke punt (dwz 50%) liggen en de voorspelling zou betrouwbaar zijn.

(b) Waarschijnlijkheids- of betrouwbaarheidsniveau:

Naast de nauwkeurigheidslimiet, moet de onderzoeker ook besluiten met betrekking tot zijn onderzoek, hoeveel vertrouwen hij in de steekproeframingen zou willen plaatsen, zo dicht mogelijk bij de werkelijke schatting, om binnen de grenzen te blijven van de tolerantie of nauwkeurigheid die is vastgesteld door hem voor de studie.

In bepaalde situaties kan het zijn dat hij er zeer zeker van wil zijn dat zijn schattingen (op basis van de steekproef) binnen 51% van de werkelijke waarde liggen, terwijl hij in bepaalde andere situaties tevreden kan zijn met een iets mindere mate van zekerheid.

In sociaalwetenschappelijk onderzoek zijn twee graden van waarschijnlijkheid of vertrouwen heel bekend en worden ze vaak gebruikt.

Een daarvan is het waarschijnlijkheidsniveau 0, 95, dwz er zijn 95 kansen op 100 dat de steekproefschatting de limieten van tolerantie of foutenmarge niet overschrijdt, en het tweede niveau is het 0, 99-niveau, of waarschijnlijkheid, dwz is waarschijnlijk dat in 99 van de 100 kansen de steekproefschatting de foutmarge die wordt nagestreefd niet overschrijdt.

Het betrouwbaarheidsniveau kan zelfs worden gesteld op 0, 999, dat wil zeggen dat de steekproefschatting niet afwijkt van de werkelijke waarde (van het universum) buiten de tolerantielimieten in 999 kansen van de 1000. Voor bepaalde doeleinden kan de onderzoeker een lage en stel het waarschijnlijkheidsniveau in op 0, 67 (dat is 2 van de 3).

De kans dat een bepaald monster voor een studie wordt getrokken, levert een schatting van het universum op die binnen de foutenmarge ligt, afhankelijk van de variatie tussen de monsters die uit het universum kunnen worden getrokken. Als de waarden die zijn beveiligd met de monsters de neiging hebben om aanzienlijk af te wijken van de werkelijke waarde, zijn de kansen dat een bepaalde steekproefwaarde binnen de toegestane foutlimieten blijft, slecht.

De standaardfout is de maatstaf die ons vertelt wat de kansen zijn dat een monster binnen de toegestane limieten blijft. Het is een maatstaf voor variatie in bemonsteringsschatting die kon worden verwacht bij willekeurige steekproeven. Willekeurige steekproeven hebben de neiging de wetten van waarschijnlijkheid te volgen en de steekproefschattingen hebben de neiging zich te clusteren rond de ware waarde van het universum.

Deze schattingen kunnen worden weergegeven door een klokvormige of normale curve. Het middelpunt van deze curve vertegenwoordigt de werkelijke waarde (van het universum) en de maximale variatie of afwijking van een willekeurige steekproefschatting van deze werkelijke waarde is ongeveer drie keer de standaardfout.

De standaardfout is dus ongeveer 1/6 van het volledige bereik van de willekeurige bemonsteringsvariatie. Voor alle praktische doeleinden echter, wordt de standaardfout genomen als 1/4 van het variatiebereik, omdat de extreme variaties zeer zelden optreden.

Waarschijnlijkheidsoverzichten laten zien dat 95 van de 100 steekproefschattingen naar verwachting binnen de limiet +2 en -2 standaardfouten vallen. Dit betekent dat, als we ons niveau van vertrouwen of waarschijnlijkheid op 0, 95 hebben gesteld, ons probleem zal zijn om een ​​willekeurig monster te trekken met een standaardfout die ongeveer de helft (helft) van onze foutenmarge is.

Voor een hoger waarschijnlijkheidsniveau zouden we een steekproef moeten trekken met een standaardfout, dat is een nog kleinere fractie van de foutenmarge.

Opgemerkt moet worden dat de standaardfout kleiner wordt (hogere precisie) naarmate de monsters groter worden. Om de nauwkeurigheid te verdubbelen, moet de steekproefomvang worden vermenigvuldigd met 4, dat wil zeggen vier maal verhoogd; om het te verdrinken, moet de steekproefomvang worden vermenigvuldigd met 9; om het te verviervoudigen, met 16 enzovoort.

Dit betekent alleen dat de precisie toeneemt als de vierkantswortel van het aantal gevallen in de steekproef. Statistici hebben tabellen opgesteld die de kans laten zien dat steekproefschattingen binnen de verschillende standaard foutlimieten vallen.

Deze limieten worden over het algemeen weergegeven als + (plus) en - (minus). Dergelijke tabellen laten bijvoorbeeld gemakkelijk zien dat 95% van de schattingen van willekeurige steekproeven binnen de limiet van +1, 96 en -1, 96 standaardfouten vallen, ongeveer 68% van de schattingen valt binnen de limieten van + 1 en -1 standaardfout en 99% van de schattingen de schattingen vallen binnen het bereik van +2, 57 en -2, 57 standaardfouten, enzovoort.

Met volledige inachtneming van (1) de foutenmarge en (2) de waarschijnlijkheid of het betrouwbaarheidsniveau, kan de onderzoeker doorgaan met de berekening van een gewenste steekproefomvang. Mildred Parten heeft de volgende formule gegeven voor het berekenen van de steekproefomvang, wanneer de te schatten statistiek het percentage is. Dit is duidelijk een getransponeerde variatie van een standaard foutformule.

Grootte van het monster = pc (100-pc) Z 2 / T 2

In de bovenstaande formule betekent pc de voorlopige schatting van het percentage (uit het universum).

Z betekent het aantal standaard fouteenheden dat wordt gevonden (uit de normale waarschijnlijkheidstabel) om overeen te komen met het vereiste waarschijnlijkheidsniveau.

T betekent de foutenmarge die kan worden getolereerd (5% of 2%).

Parten heeft de volgende formule gegeven voor het berekenen van de steekproefomvang voor het voorspellen of schatten van de gemiddelde waarde van het universum met betrekking tot een gespecificeerde eigenschap op een bepaald vertrouwensniveau en gericht op een gegeven marge of fout of tolerantielimiet.

Steekproefgrootte = (δ + Z / T) 2

Waar 8 staat voor de voorlopige inschatting van de standaarddeviatie van het universum.

Z staat voor het aantal standaard fouteenheden dat overeenkomt met het vereiste waarschijnlijkheids- of betrouwbaarheidsniveau.

Laten we een concreet voorbeeld nemen en de steekproefgrootte berekenen. Stel dat we het gemiddelde jaarinkomen willen schatten van gezinnen die in een bepaalde 'middenklasse' plaats van een stad wonen.

Laten we zeggen dat we onze foutenmarge op Rs.100 / - hebben gesteld, dat wil zeggen, we tolereren de steekproefschatting binnen plus of minus 100 van het ware gemiddelde van de bevolking met betrekking tot het inkomen. Stel dat we het waarschijnlijkheids- of betrouwbaarheidsniveau hebben ingesteld op 0, 95.

Veronderstel ook dat uit een enkele jaren geleden uitgevoerde enquête de standaardafwijking ten aanzien van het jaarinkomen van de bevolking (lokaliteit) op Rs.500 / - wordt geschat. De waarde van Z, dwz de standaard fouteenheden die overeenkomen met de kans van 0, 95 is 1, 96.

Vervanging van deze waarden in de bovenstaande formule, hebben we

Grootte van eenvoudig = (500 × 1, 96 / 100) 2

= (9.8) 2

= 95

Dit betekent dat een aselecte steekproef van 95 gevallen (families, die de steekproefeenheden zijn) ons een schatting van het gemiddelde van het gegeven 'universum' moet geven binnen de ingestelde foutmarge en op het gewenste niveau van vertrouwen of waarschijnlijkheid, respectievelijk, van Rs. 100 / - en 0, 95.

Als we de foutmarge vergroten en instellen op Rs. 50 / -, het aantal gevallen in de steekproef, dwz de vereiste grootte van de steekproef zal vier keer zo groot zijn (dwz 380) als de vereiste maat voor de eerdere foutmarge (Rs. 100 / -).

Als een andere lokatie wordt gekenmerkt door een grotere homogeniteit ten aanzien van het inkomen en veronderstelt dat de standaarddeviatie in inkomensvoorwaarden slechts 100 is, dan zal de omvang van de steekproef voor de bovengenoemde foutenmarge veel lager zijn.

Met andere woorden, het gebruik van de formule illustreert de les, namelijk: hoe groter de homogeniteit, hoe kleiner het vereiste monster en hoe groter de nauwkeurigheid waarnaar wordt gezocht, hoe groter de benodigde steekproefgrootte.

Het herhaaldelijk gebruik van termen als de foutmarge en het vertrouwensniveau en andere numerieke uitingen van waarschijnlijkheden en steekproefgroottes, kan de indruk wekken dat een steekproefomvang berekend met een formule een gewenste nauwkeurigheid garandeert.

Er dient echter aan te worden herinnerd dat de relaties die worden weergegeven in de statistische kansentabellen normale verwachtingen vertegenwoordigen in een ideale willekeurige steekproef. Maar voor zover de feitelijke bemonstering zelden ideaal is, kan niet worden verwacht dat de relaties die in tabellen worden uitgedrukt.

De algemene moeilijkheid en zeldzaamheid van ideale bemonstering moet begrijpelijkerwijs iemand sceptisch maken over resultaten die precies aan de verwachtingen voldoen.

Dit betekent echter niet dat de onderzoeker de exacte steekproefomvang die is berekend op basis van de kansformule niet mag gebruiken of prefereren. In feite is dit precies wat hij zou moeten doen, omdat het zijn beste gok is. Hij zou echter niet op deze exacte grootte moeten aandringen als praktische overwegingen hem ongeschikt maken.

Een wezenlijk andere benadering van het probleem van het bepalen van de gewenste steekproefomvang is de 'stabiliteitstest'. Dit bestaat uit het verzamelen van gegevens voor relatief kleine submonsters en het bijhouden van de verdeling van de retouren.

Wanneer na een punt de toevoeging van meer deelmonsters de resultaten niet significant verandert, kan de onderzoeker aannemen dat het tot dusverre getrokken totale monster toereikend, qua grootte, is geworden. Maar deze procedure kan heel goed als tijdverspilling worden beschouwd, omdat het in feite neerkomt op een onderzoeker die zich bezighoudt met een reeks afzonderlijke enquêtes, verspreid over een aanzienlijke periode.

Er is geargumenteerd dat deze procedure oneconomisch is omdat er meer planningen worden verzameld dan er feitelijk nodig zijn, aangezien de afbouw tot het punt van de geschatte stabiliteit niet met enige zekerheid kan worden vastgesteld totdat de curve zijn niveau een tijdje heeft gehandhaafd.

Maar dit lijkt geen ernstige beperking te zijn in vergelijking met de conservatieve praktijk van vele gerenommeerde onderzoeken die meer dan het noodzakelijke / minimale aantal items verzamelen als een steekproef.

Het belangrijkste voordeel van dit type stabiliteitstest is dat in plaats van afhankelijk te zijn van berekeningen op basis van voorlopige informatie, men eenvoudig de totale steekproefgrootte-eenheid verhoogt waarvan wordt vastgesteld dat deze voldoende is. De empirische controle van het kijken naar het rendement en het stoppen wanneer ze stabiliseren lijkt eenvoudig en overtuigend.

Het grootste gevaar van deze procedure ligt in het feit dat de opeenvolgende submonsters die verzameld zijn zich waarschijnlijk niet over het universum verspreiden. Resultaten kunnen stabiliseren, ook al vertegenwoordigen ze niet de populatie.

In feite, hoe minder representatief het deelmonster, des te waarschijnlijker is de toevoeging van meer gevallen om hetzelfde resultaat te geven en het uiterlijk van stabilisatie te veroorzaken. Tenzij deelmonsters een doorsnede van het universum is, zal er geen supergevoelig monster zijn om de naderende stabilisatie te observeren.

De basisvereiste van deze procedure is dat een steeds groter wordend representatief monster beschikbaar moet zijn voor observatie. De kosten en moeilijkheid van het verzamelen van opeenvolgende submonsters die zijn verspreid over het universum zijn de belangrijkste redenen waarom dit waarschijnlijk niet representatief is.

De empirische stabiliteitstest kan echter zeer effectief zijn wanneer de submonsters correct worden getrokken en verzameld. De methode is het meest geschikt voor interviewsquêtes over relatief kleine gebieden of gemeenschappen zoals een stad of een stad, omdat het dan niet zo moeilijk of duur is om van elk deelmonster een willekeurige steekproef van de populatie te maken.

Een meer verfijnde vorm van empirische controle in vergelijking met stabiliteitstests is een relatief recente ontwikkeling die Sequentiële analyse wordt genoemd. De algemene procedure die hierbij betrokken is, is om bij het monster te blijven en tegelijkertijd het monster op significantie te blijven testen totdat het minimale monster is geaccumuleerd dat het vereiste significantieniveau zal bieden.