8 Belangrijke soorten probabiliteitssampling

Dit artikel werpt licht op de acht belangrijke soorten kanssteekproeven die worden gebruikt voor het uitvoeren van sociaal onderzoek. De typen zijn: 1. Eenvoudige willekeurige bemonstering 2. Systematische bemonstering 3. Gestratificeerde willekeurige bemonstering 4. Proportionele gestratificeerde bemonstering 5. Onevenredige gestratificeerde bemonstering 6. Optimale toewijzingssteekproef 7. Clustermonsters 8. Meerfasenmonstername.

Type # 1. Eenvoudige willekeurige bemonstering:

Eenvoudige willekeurige steekproeven zijn in zekere zin het basisthema van alle wetenschappelijke steekproeven. Het is het primaire ontwerp voor kanssteekproeven. Alle andere methoden voor wetenschappelijke bemonstering zijn inderdaad variaties op de eenvoudige steekproeftrekking. Een goed begrip van de verfijnde of complexe verscheidenheid aan bemonsteringsprocedures veronderstelt een goed begrip van eenvoudige en willekeurige steekproeven.

Een eenvoudig willekeurig monster wordt geselecteerd door een proces dat niet alleen aan elk element in de populatie een gelijke kans geeft om in de steekproef te worden opgenomen, maar ook de selectie van elke mogelijke combinatie van gevallen in de gewenste steekproefomvang, even waarschijnlijk. Stel bijvoorbeeld dat die een populatie van zes kinderen heeft, namelijk A, B, C, D, E en F.

Er zijn de volgende mogelijke combinaties van cases, elk met twee elementen uit deze populatie, namelijk AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF en EF, dwz in alle 15 combinaties.

Als we elke combinatie op gelijke kaarten schrijven, plaats de kaarten dan in een mand, meng ze grondig en laat een geblinddoekte persoon er een kiezen, elk van de kaarten krijgt dezelfde kans om te worden geselecteerd / opgenomen in het monster.

De twee gevallen (het paar) die op de kaart zijn geschreven en door de persoon met de blinde rug worden opgepakt, vormen dus het gewenste eenvoudige willekeurige monster. Als u eenvoudige willekeurige steekproeven van drie gevallen uit de bovenstaande populatie van zes gevallen wilt selecteren, zijn de mogelijke steekproeven, elk van drie gevallen, ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF en DEF, dat wil zeggen 20 combinaties in totaal.

Elk van deze combinaties heeft een gelijke selectiekans in de steekproef. Met dezelfde methode kan een eenvoudige willekeurige steekproef van vier gevallen uit deze populatie worden geselecteerd.

In principe kan men deze methode gebruiken om willekeurige steekproeven van om het even welke grootte van een bevolking te selecteren. Maar in de praktijk zou het een zeer omslachtige en in sommige gevallen een onmogelijke taak worden om alle mogelijke combinaties van het gewenste aantal gevallen op te sommen. Hetzelfde resultaat kan worden verkregen door afzonderlijke elementen één voor één te selecteren met behulp van de bovenstaande methode (loterij) of door een boek met willekeurige getallen te gebruiken.

Het tabellenboek met een lijst met willekeurige nummers is vernoemd naar Tippet die als eerste het begrip willekeurigheid in een boek met willekeurige getallen had vertaald.

Dit boek is door een zeer ingewikkelde procedure op zo'n manier samengesteld dat de getallen geen enkel bewijs van systematische volgorde vertonen, dat wil zeggen dat niemand het aantal kan schatten, op basis van het voorgaande getal en omgekeerd. Laten we de twee manieren bespreken om een ​​eenvoudig willekeurig monster te tekenen.

Loterijmethode:

Deze methode omvat de volgende stappen:

(a) Elk lid of item in de 'populatie' krijgt een uniek nummer toegewezen. Dat wil zeggen, geen twee leden hebben hetzelfde nummer,

(b) Elk nummer wordt genoteerd op een afzonderlijke kaart of een chip. Elke chip of kaart moet vergelijkbaar zijn met alle anderen met betrekking tot gewicht, grootte en vorm, enz.,

(c) De kaarten of chips worden in een kom geplaatst en grondig gemengd,

(d) Een geblindeerde persoon wordt gevraagd om een ​​chip of kaart uit de kom op te halen.

Onder deze omstandigheden kan worden verwacht dat de kans dat een kaart wordt getrokken dezelfde is als de kans dat een andere kaart wordt getrokken. Aangezien elke kaart een lid van de populatie vertegenwoordigt, is de kans om elk kaartje te selecteren exact hetzelfde.

Als na het selecteren van een kaart (chip) deze in de kom werd vervangen en de inhoud opnieuw grondig werd gemengd, zou elke chip een gelijke kans hebben om te worden geselecteerd op de tweede, vierde of nde tekening. Een dergelijke procedure zou uiteindelijk een eenvoudige willekeurige steekproef opleveren.

Monster selecteren met behulp van willekeurige nummers :

We hebben al gezegd wat willekeurige getallen zijn. Deze cijfers helpen voorkomen dat bias (ongelijke kansen) voor items die een populatie bevatten in het monster worden opgenomen bij het selecteren van het monster.

Deze willekeurige getallen zijn zo voorbereid dat ze voldoen aan het wiskundige criterium van volledige willekeur. Elk standaardboek over statistieken bevat een paar pagina's met willekeurige getallen. Deze nummers worden meestal weergegeven in kolommen op opeenvolgende pagina's.

Hieronder volgt een deel van een reeks willekeurige getallen:

Het gebruik van de tabellen met willekeurige getallen omvat de volgende stappen:

(a) Elk lid van de bevolking krijgt een uniek nummer toegewezen. Een lid heeft bijvoorbeeld het nummer 77 en een ander 83, enzovoort.

(b) De tabel met willekeurige getallen wordt op een willekeurig punt (met een blinde vlek op een pagina van het tabellenboek) ingevoerd en de cases waarvan het aantal omhoog komt als men van dit punt naar beneden de kolom verplaatst, worden in de steekproef opgenomen totdat het gewenste aantal gevallen wordt verkregen.

Stel dat onze populatie uit vijfhonderd elementen bestaat en we willen vijftig gevallen als steekproef trekken. Stel dat we de laatste drie cijfers gebruiken in elk aantal van vijf cijfers (aangezien de universe-grootte 500 is, dat wil zeggen, drie-digitaal).

We gaan door de kolom vanaf 42827; maar aangezien we hebben besloten om slechts drie cijfers te gebruiken (zeg de laatste drie), beginnen we met 827 (waarbij we de eerste twee cijfers negeren). We merken nu elk nummer op minder dan 501 (aangezien de populatie 500 is).

Het monster wordt geacht te bestaan ​​uit de elementen van de populatie die de nummers dragen die overeenkomen met de gekozen nummers. We stoppen nadat we 50 elementen hebben geselecteerd (de door ons besloten grootte). Op basis van het bovenstaande gedeelte van de tabel zullen we 12 nummers kiezen die overeenkomen met de gekozen nummers. We zullen 12 gevallen kiezen die overeenkomen met de nummers 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Kenmerken van Simple Random Sample:

We zullen beginnen met het beschouwen van één zeer belangrijke eigenschap van de eenvoudige willekeurige steekproeven; dit wezen, dat groter is naarmate de steekproef groter is, hoe waarschijnlijker het is dat het gemiddelde (gemiddelde waarde) in de buurt komt van het 'populatiegemiddelde', dwz de werkelijke waarde. Laten we deze eigenschap illustreren door een populatie te veronderstellen bestaande uit zes leden (kinderen).

Laat de leeftijden van deze kinderen respectievelijk zijn: A = 2 jaar, B = 3 jaar, C = 4 jaar, D = 6 jaar, E = 9 jaar en F = 12 jaar. Laten we willekeurige steekproeven van één, twee, drie vier en vijf leden uit deze populatie trekken en zien hoe in elk geval de steekproefgemiddelden (gemiddelden) zich gedragen met verwijzing naar het ware 'populatiegemiddelde' (dwz 2 + 3 + 4) + 6 + 9 + 12 = 36/6 = 6). Tabelvolgorde illustreert het gedrag van de steekproefgemiddelden zoals geassocieerd met de grootte van het monster.

Tabel met de mogelijke monsters van één, twee, drie, vier en vijf elementen (kinderen, uit de populatie van zes kinderen in de leeftijd van respectievelijk 2, 3, 4, 6, 9 en 12 jaar):

In de gegeven tabel worden alle mogelijke willekeurige steekproeven van verschillende grootten (dwz 1, 2, 3, 4 en 5) en hun overeenkomstige middelen getoond. Het werkelijke (populatie) gemiddelde is 6 jaar. Dit gemiddelde kan natuurlijk worden berekend door de gemiddelde waarden van de totale combinaties van de elementen in de populatie op te tellen voor elke gegeven steekproefomvang.

In de tabel zien we bijvoorbeeld dat er voor de steekproefomvang van drie elementen 20 mogelijke combinaties van elementen zijn, waarbij elke combinatie een gelijke kans heeft om te worden geselecteerd als een steekproef volgens het waarschijnlijkheidsbeginsel.

Als we de gemiddelde waarden van deze mogelijke combinaties in de tabel optellen, krijgen we de totale score van 120. Het gemiddelde is 120 ÷ 20 = 6, wat natuurlijk ook het populatiegemiddelde is. Dit geldt ook voor andere kolommen.

Laten we nu de tabel zorgvuldig bekijken. We zullen vinden dat voor monsters van één element elk (kolom A) er slechts één gemiddelde waarde is die niet meer dan 1 eenheid afwijkt van het ware populatiegemiddelde van 6 jaar. Dat wil zeggen, alle anderen, namelijk 2, 3, 4, 9 en 12, wijken met meer dan één eenheid af van het populatiegemiddelde, dat wil zeggen 6. Als we de steekproef vergroten, bijvoorbeeld in kolom B, waar de steekproefgrootte is 2, we vinden een groter deel van de gemiddelden (gemiddelden) die niet afwijken van het populatiegemiddelde met meer dan 1 eenheid.

De bovenstaande tabel laat zien dat er voor het monster van twee 15 mogelijke combinaties en dus 15 mogelijke middelen zijn. Van deze 15 betekent dat er 5 middelen zijn die niet met meer dan 1 eenheid van het populatiegemiddelde afwijken.

Dat wil zeggen dat er 33% van de steekproefgemiddelden zijn die dicht bij het populatiegemiddelde liggen binnen +1 en -1 eenheden. In kolom C van de tabel zien we dat er 20 mogelijke combinaties van elementen zijn voor de steekproefomvang van drie elementen, elk.

Van de 20 mogelijke steekproefgemiddelden vinden we dat 10, dat wil zeggen 50% niet met meer dan 1 eenheid van het populatiegemiddelde afwijken. Voor de steekproefomvang van vier elementen zijn er 67% van de gemiddelden die binnen het bereik van +1 en -1 eenheid van het werkelijke (populatie) gemiddelde liggen.

Ten slotte zijn er voor de steekproefomvang van vijf elementen veel meer, dat wil zeggen 83% van dergelijke gemiddelden of schattingen. De les die uit onze observaties naar voren komt is vrij duidelijk, namelijk hoe groter het monster, hoe waarschijnlijker het is dat het gemiddelde dicht bij het populatiegemiddelde zal liggen.

Dit is hetzelfde als zeggen dat de spreiding van schattingen (gemiddelden) afneemt naarmate de steekproefomvang toeneemt. We kunnen dit duidelijk zien in de bovenstaande tabel. Voor de steekproefomvang van één (kolom A) is het bereik van gemiddelden het grootst, dwz tussen 2 en 12 = 10. Voor de steekproefomvang van twee ligt het bereik tussen 2, 5 en 10, 5 = 8.

Voor de steekproefomvang van drie, vier en vijf is het bereik van variabiliteit van gemiddelden respectievelijk 3 tot 9 = 6, 3, 8 tot 7, 8 = 4 en 4, 8 tot 6, 8 = 2. Uit de tabel zal ook blijken dat hoe meer een steekproef gemiddelde verschilt van populatiegemiddelde, des te minder vaak het voorkomt.

We kunnen dit fenomeen met betrekking tot eenvoudige en willekeurige bemonstering duidelijk weergeven aan de hand van een reeks curven die de relatie tonen tussen de variabiliteit van schattingen en de omvang van het monster. Laten we een grote populatie van inwoners beschouwen. Men kan zich voorstellen dat hun leeftijd varieert van minder dan 1 jaar (op zijn minst) tot meer dan 80 jaar (hoogstens).

De normale en redelijke verwachting zou zijn dat er minder gevallen zijn als men de extremen benadert en dat het aantal gevallen progressief en symmetrisch toeneemt naarmate we deze extremen verlaten.

De gemiddelde leeftijd van de bevolking is, laten we zeggen, 40 jaar. Een dergelijke verdeling van bewoners kan worden weergegeven door een curve die bekend staat als de normale of klokvormige curve (A in het onderstaande diagram). Laten we nu veronderstellen dat we uit deze populatie verschillende willekeurige steekproeven van verschillende groottes nemen, bijvoorbeeld 10.100 en 10.000. Voor elk van de steekproefomvang zullen we een zeer groot aantal monsters van de populatie krijgen.

Elk van deze monsters geeft ons een specifieke schatting van het populatiegemiddelde. Sommige van deze middelen zullen te hoge schattingen en een aantal te lage schattingen van de populatiekarakteristiek (gemiddelde of gemiddelde leeftijd) zijn. Sommige middelen zullen er heel dicht bij zijn, nogal wat vrij ver weg.

Als we dergelijke steekproefgemiddelden voor een bepaalde steekproefomvang uitzetten en deze punten samenvoegen, krijgen we in elk geval een normale curve. Verschillende normale curven zullen dus de waarden van monster-gemiddelden voor monsters van verschillende grootten voorstellen.

Het bovenstaande diagram benadert een afbeelding van hoe het monster-middel zich zou gedragen ten opzichte van de grootte van het monster. De curve A vertegenwoordigt de locaties van leeftijden van individuele personen. De geschatte gemiddelden van steekproeven van 10 individuen, elk, van de curve B die een vrij brede spreiding van ware populatiegemiddelde van 40 jaar laat zien).

De gemiddelden van monsters van elk 100 individuen vormen een normale curve C die veel minder afwijkt van het populatiegemiddelde. Eindelijk, het middel van de monsters van 10.000 uit een curve die bijna de verticale lijn benadert die overeenkomt met het populatiegemiddelde. De afwijking van de waarden die curve D uit het populatiegemiddelde vertegenwoordigen, zou verwaarloosbaar zijn, zoals duidelijk blijkt uit het diagram.

Uit de bovenstaande figuur kan ook heel gemakkelijk worden onderscheiden dat voor steekproeven van een willekeurige afmeting het meest waarschijnlijke steekproefgemiddelde het populatiegemiddelde is. De volgende meest waarschijnlijke zijn de gemiddelde waarden dicht bij het populatiegemiddelde.

We kunnen dus concluderen dat hoe meer een steekproefgemiddelde afwijkt van het populatiegemiddelde, hoe kleiner de kans is dat dit gebeurt. En ten slotte zien we ook wat we al hebben gezegd over het gedrag van de monsters, namelijk hoe groter de steekproef, hoe groter de kans dat het gemiddelde dicht bij het populatiegemiddelde ligt.

Het is dit soort gedrag van de kant van de eenvoudige willekeurige (waarschijnlijkheids) steekproeven met betrekking tot zowel het gemiddelde als de verhoudingen en andere soorten statistieken, die het ons mogelijk maken om niet alleen de populatiekarakteristiek in te schatten (bijv. het gemiddelde), maar ook de waarschijnlijkheid dat het monster met een gegeven hoeveelheid zou verschillen van de werkelijke populatiewaarde.

Een typisch kenmerk van de eenvoudige steekproeftrekking is dat wanneer de populatie groot is in vergelijking met de steekproefomvang (bijv. Meer dan zeg tien keer zo groot), de variaties van steekproefverdelingen meer worden beïnvloed door het absolute aantal gevallen in de steekproef. steekproef dan door het deel van de bevolking dat het monster bevat.

Met andere woorden, de omvang van de fouten die waarschijnlijk zullen optreden als gevolg van de bemonstering, hangt meer af van de absolute omvang van het monster dan van de verhouding die het met de populatie heeft, dat wil zeggen van hoe groot of hoe klein een deel van de steekproef is. bevolking.

Hoe groter de steekproef, hoe groter de kans dat deze een redelijk goede schatting geeft van het populatiekarakteristiek, ongeacht de proportie ervan in vergelijking met de populatie.

De schatting van een populaire stemming bij een nationale peiling, binnen de grenzen van een aanvaardbare foutenmarge, zou dus geen substantieel grotere steekproef vereisen dan die vereist zou zijn voor een schatting van de bevolkingsstemming in een bepaalde provincie waar uitkomst van de peiling is twijfelachtig.

Om het punt uit te werken, geeft een steekproef van 500 (100% steekproef) een perfecte nauwkeurigheid als een gemeenschap slechts 500 inwoners had. Een steekproef van 500 geeft een iets grotere nauwkeurigheid voor een gemeente van 1000 inwoners dan voor een stad met 10.000 inwoners. Maar voorbij het punt waarop het monster een groot deel van het 'universum' is, is er geen merkbaar verschil in nauwkeurigheid met de toenamen in de grootte van het 'universum'.

Voor elk gegeven nauwkeurigheidsniveau zouden identieke steekproefgrootten dezelfde nauwkeurigheid bieden voor gemeenschappen met verschillende populaties, bijvoorbeeld van 10.000 tot 10 miljoen. De verhouding van de steekproefgrootte tot de populaties van deze gemeenschappen betekent niets, hoewel dit belangrijk lijkt te zijn als we door de intuïtie gaan.

Type # 2. Systematische sampling:

Dit type bemonstering is voor alle praktische doeleinden een benadering van eenvoudige willekeurige bemonstering. Het vereist dat de populatie uniek geïdentificeerd kan worden aan de hand van de volgorde. De inwoners van een community kunnen bijvoorbeeld worden vermeld en hun namen alfabetisch kunnen worden gerangschikt. Elk van deze namen kan een uniek nummer krijgen. Zo'n index staat bekend als het 'frame' van de betreffende populatie.

Stel dat dit frame uit 1000 leden bestaat, elk met een uniek nummer, dat wil zeggen van 1 tot 1.000. Laten we zeggen dat we een steekproef van 100 willen selecteren. We kunnen beginnen met het selecteren van een nummer tussen 1 en 10 (beide inbegrepen). Stel dat we een willekeurige selectie maken door de lijst in te voeren en 7 te krijgen.

We gaan vervolgens over tot het selecteren van leden; beginnend vanaf 7, met een regelmatige interval van 10. De geselecteerde om leden te selecteren: vanaf met een regelmatige interval van 10. De geselecteerde steekproef zou dus bestaan ​​uit elementen met de nummers 7, 17, 27, 37, 47, ... 977, 987, 997. Deze elementen samen zouden een systematische steekproef vormen.

Er dient aan te worden herinnerd dat een systematisch monster alleen als kanssteekproef kan worden beschouwd als het eerste geval (bijvoorbeeld 7) willekeurig is geselecteerd en daarna zelfs, tiende geval uit het kader, daarna is geselecteerd.

Als het eerste geval niet willekeurig wordt geselecteerd, zal het resulterende monster geen kanssteekproef zijn, omdat in de aard van het geval de meeste gevallen die zich niet op een afstand van tien van het aanvankelijk gekozen aantal bevinden, een nul (0 hebben) ) de kans om in de steekproef te worden opgenomen.

Opgemerkt moet worden dat bij de systematische bemonstering wanneer het eerste geval willekeurig wordt getrokken, er op voorhand geen beperking is van de kans dat een bepaald geval in het monster wordt opgenomen. Maar zodra het eerste geval is geselecteerd, wordt de kans op volgende gevallen beslissend beïnvloed of gewijzigd. In het bovenstaande voorbeeld hebben de andere gevallen dan 17, 27, 37, 47 ... enz. Geen kans om in het monster te worden opgenomen.

Dit betekent dat een systematisch bemonsteringsplan niet alle mogelijke combinaties van gevallen mogelijk maakt, dezelfde kans om in de steekproef te worden opgenomen.

De resultaten kunnen dus nogal misleidend zijn als de gevallen in de lijst in een bepaalde cyclische volgorde zijn gerangschikt of als de populatie niet grondig gemengd is met betrekking tot de kenmerken die worden bestudeerd (bijvoorbeeld inkomsten of uren studie), dat wil zeggen op een bepaalde manier dat elk van de tien leden een gelijke kans had om gekozen te worden.

Type # 3. Stratified Random Sampling:

In de gestratificeerde aselecte steekproef wordt de populatie eerst verdeeld in een aantal strata. Dergelijke strata kunnen gebaseerd zijn op een enkel criterium, bijvoorbeeld op opleidingsniveau, en een aantal strata opleveren dat overeenkomt met de verschillende niveaus van opleidingsniveau) of op combinatie van twee of meer criteria (bijv. Leeftijd en geslacht), waardoor strata zoals mannen onder 30 jaar en mannen ouder dan 30 jaar, vrouwen onder de 30 jaar en vrouwen ouder dan 30 jaar.

Bij gestratificeerde aselecte steekproeven wordt een eenvoudig aselect monster genomen van elk van de strata en dergelijke deelmonsters worden samengebracht om het totale monster te vormen.

In het algemeen draagt ​​stratificatie van het universum ten behoeve van monstername bij aan de efficiëntie van bemonstering als het klassen vaststelt, dat wil zeggen als het de populatie kan verdelen in klassen van leden of elementen die intern relatief homogeen en relatief ten opzichte van elkaar zijn, heterogeen, met betrekking tot de kenmerken die worden bestudeerd. Laten we veronderstellen dat leeftijd en geslacht twee mogelijke grondslagen van gelaagdheid zijn.

Moeten we nu vaststellen dat stratificatie op basis van geslacht (man / vrouw) twee strata oplevert die aanzienlijk van elkaar verschillen wat betreft scores op andere pertinente kenmerken die onderzocht worden, terwijl aan de andere kant leeftijd als basis van stratificatie niet opbrengststrata opleveren die wezenlijk van elkaar verschillen in termen van de scores op de andere significante kenmerken, dan zal het raadzaam zijn om de populatie op basis van geslacht in plaats van leeftijd te stratificeren.

Met andere woorden, het criterium van geslacht zal in dit geval een effectievere basis van stratificatie zijn. Het is heel goed mogelijk dat het proces van het afbreken van de bevolking in lagen die intern homogeen en relatief heterogeen zijn ten aanzien van bepaalde relevante kenmerken, onbetaalbaar is.

In een dergelijke situatie kan de onderzoeker ervoor kiezen om een ​​grote, eenvoudige willekeurige steekproef te selecteren en de hoge kosten te compenseren door de totale omvang van de steekproef (via een groot willekeurig eenvoudig willekeurig monster) te verhogen en gevaren te vermijden die gepaard gaan met stratificatie.

Het moet duidelijk zijn dat stratificatie nauwelijks iets te maken heeft met het maken van het monster een replica van de bevolking.

In feite hangen de kwesties die samenhangen met de beslissing of stratificatie moet worden uitgevoerd, primair samen met de verwachte homogeniteit van de gedefinieerde strata met betrekking tot de kenmerken die worden bestudeerd en de vergelijkende kosten van verschillende methoden voor het bereiken van precisie. Gestratificeerde aselecte steekproeven zoals de eenvoudige aselecte steekproeven, omvatten representatieve steekproefplannen.

We gaan nu over tot het bespreken van de belangrijkste vormen of gestratificeerde steekproeven. Het aantal gevallen dat in elk stratum wordt geselecteerd, kan evenredig zijn aan de sterkte van het stratum of onevenredig daaraan.

Het aantal gevallen kan hetzelfde zijn van stratum tot stratum of variëren van het ene stratum tot het andere, afhankelijk van het samplingplan. We zullen deze twee vormen nu kort in overweging nemen, namelijk evenredige en onevenredige gestratificeerde steekproeven.

Type # Proportionele Gestratificeerde Sampling :

In evenredige bemonstering worden gevallen van elk stratum in dezelfde verhouding getrokken als ze in het universum voorkomen. Stel dat we weten dat 60% van de 'bevolking' mannelijk is en 40% ervan vrouwelijk. Proportionele gestratificeerde steekproeven met verwijzing naar deze 'populatie', zou erin bestaan ​​een steekproef te trekken op een manier dat dezelfde verdeling onder geslachten wordt weerspiegeld, dat wil zeggen, 60:40 in de steekproef.

Als de systematische bemonsteringsprocedure wordt gebruikt in een onderzoek, bepaalt de basis waarop de lijst is gemaakt of het resulterende monster al dan niet een proportioneel gestratificeerd monster is. Als elke 7de naam bijvoorbeeld in een normale volgorde uit een lijst met alfabetisch geordende namen wordt geselecteerd, moet de resulterende sample ongeveer 1/7 van de namen bevatten die beginnen met elke letter van het alfabet.

Het resulterende monster in dit geval zou een proportioneel gestratificeerd alfabetisch monster zijn. Natuurlijk, als de alfabetische opstelling volledig onafhankelijk is en niet relevant voor het probleem dat wordt bestudeerd, kan het monster worden beschouwd als een willekeurig monster met bepaalde beperkingen die kenmerkend zijn voor de hierboven besproken systematische monsters.

Verschillende redenen kunnen worden aangevoerd voor het bemonsteren van de verschillende lagen in ongelijke of ongelijksoortige verhoudingen. Soms is het nodig om de uit de strata bemonsterde proportie met een klein aantal cases te verhogen om een ​​garantie te hebben dat deze strata überhaupt worden bemonsterd.

Als u bijvoorbeeld een studie plant van de detailhandel in kleding in een bepaalde stad op een bepaald tijdstip, geeft een eenvoudige willekeurige steekproef van kledingwinkels niet ons een nauwkeurige schatting van het totale verkoopvolume, aangezien een klein aantal aantal vestigingen met een zeer groot deel van de totale omzet, kan toevallig uitgesloten worden van de steekproef.

In dit geval zou men er verstandig aan doen de bevolking van kledingwinkels te stratiseren in termen van enkele stoffenwinkels die een zeer groot verkoopvolume hebben, vormen de bovenste laag. De onderzoeker zou er goed aan doen om ze allemaal in zijn steekproef op te nemen.

Dat wil zeggen, hij kan soms goed doen om een ​​steekproef van 100% uit dit stratum te nemen en een veel kleiner percentage van de gevallen uit de andere strata die een groot aantal winkels vertegenwoordigen (met een laag of matig volume ommekeer). Een dergelijke onevenredige bemonstering alleen al zal hoogstwaarschijnlijk betrouwbare schattingen opleveren met betrekking tot de populatie.

Een andere reden om een ​​groter deel van de gevallen van één stratum in plaats van van andere te nemen, is dat de onderzoeker mogelijk cases in elk stratum wil onderverdelen voor verdere analyse.

De aldus verkregen deelstrategieën bevatten mogelijk niet altijd voldoende aantal te bemonsteren gevallen en in dezelfde verhouding als de andere substrata, en zouden daarom niet voldoende gevallen bieden om als een adequate basis voor verdere analyse te dienen. Als dit het geval is, moet mogelijk een groter deel van de gevallen uit de sublaag worden onderzocht.

In algemene bewoordingen kan worden gesteld dat de grootste nauwkeurigheid en representatie kan worden verkregen als monsters uit de verschillende lagen voldoende hun relatieve variabiliteit weergeven met betrekking tot de kenmerken die worden bestudeerd, in plaats van hun relatieve omvang in de 'populatie' aan te geven.

Het is raadzaam om zwaarder te bemonsteren in strata waarbij de onderzoeker een reden heeft om te geloven dat de variabiliteit over een bepaald kenmerk, bijvoorbeeld attitudes of participatie, groter zou zijn.

Vandaar dat in een studie die wordt uitgevoerd om de uitkomst van de nationale verkiezingen te voorspellen met behulp van de methode van gestratificeerde steekproeven, met staten als basis voor stratificatie, een zwaardere steekproef moet worden genomen uit de gebieden of regio's waar de uitkomst ernstig vertroebeld is en zeer twijfelachtig .

Type # 5. Onevenredige Stratified Sampling :

We hebben al gewezen op de kenmerken van de onevenredige bemonstering en ook een deel van het grote voordeel van deze bemonsteringsprocedure. Het is duidelijk dat een gestratificeerd monster waarin het aantal elementen uit verschillende lagen onafhankelijk is van de grootten van deze lagen, een onevenredig gestratificeerd monster kan worden genoemd.

Ditzelfde effect kan ook worden bereikt door uit elk stratum een ​​gelijk aantal gevallen te trekken, ongeacht hoe sterk of laag de laag in de populatie is.

Als uitvloeisel van de manier waarop het wordt geselecteerd, heeft een voordeel van onevenredige gestratificeerde steekproeven te maken met het feit dat alle strata even betrouwbaar zijn vanuit het oogpunt van de grootte van het monster. Een nog belangrijker voordeel is de economie.

Dit type monster is economisch omdat de onderzoekers de moeite hoeven te besparen om een ​​onnodig groot volume aan informatie te verzamelen van de meest voorkomende groepen in de populatie.

Een dergelijk monster kan echter ook de gecombineerde nadelen van ongelijk aantal gevallen verraden, namelijk kleinheid en niet-representativiteit. Bovendien vereist een onevenredige steekproef diepgaande kennis van pertinente kenmerken van de verschillende lagen.

Type 6. Optimale toewijzingssteekproef :

In deze bemonsteringsprocedure is de grootte van het monster dat uit elk stratum wordt getrokken, evenredig aan zowel de grootte als de spreiding van waarden binnen een gegeven stratum. Een precies gebruik van deze bemonsteringsprocedure houdt in dat bepaalde statistische concepten worden gebruikt die nog niet voldoende of overtuigend zijn geïntroduceerd.

We weten nu iets over de gestratificeerde aselecte steekproeven en de verschillende manifestaties ervan. Laten we nu kijken hoe de variabelen of criteria voor stratificatie gepland moeten worden.

De volgende overwegingen komen idealiter voor in de selectie van besturingselementen voor stratificatie:

(a) De informatie die relevant is voor het instellen van strata moet up-to-date, accuraat en volledig zijn, van toepassing op de populatie en beschikbaar voor de onderzoeker.

Veel kenmerken van de populatie kunnen niet als controles worden gebruikt, omdat er geen bevredigende statistieken over beschikbaar zijn. In een zeer dynamische samenleving die wordt gekenmerkt door grote omwentelingen in de bevolking, loopt de onderzoeker die de strategie van stratificatie gebruikt, meestal het risico dat hij volkomen verkeerd gaat in zijn schattingen over de omvang van de lagen die hij in zijn steekproef beïnvloedt.

(b) De onderzoeker moet redenen hebben om aan te nemen dat de factoren of criteria die voor stratificatie worden gebruikt significant zijn in het licht van het probleem dat wordt bestudeerd.

(c) Tenzij het bestudeerde stratum groot genoeg is en daarom hebben de monsternemer en veldwerkers niet veel moeite om kandidaten hiervoor te vinden, het moet niet worden gebruikt.

(d) Bij het selecteren van gevallen voor stratificatie, zou de onderzoeker moeten proberen die te kiezen die homogeen zijn met betrekking tot de kenmerken die significant zijn voor het onderzochte probleem. Zoals eerder gezegd, is stratificatie effectief in de mate dat de elementen in de stratum op elkaar lijken en tegelijkertijd anders zijn ten opzichte van de elementen in andere lagen.

Laten we nu eens kijken naar de voordelen en beperkingen van gestratificeerde aselecte steekproeven op een algemene manier:

(1) Door gebruik te maken van de gestratificeerde aselecte steekproefprocedure, kan de onderzoeker ervan verzekerd zijn dat geen essentiële groepen of categorieën van het monster zullen worden uitgesloten. Een grotere representativiteit van het monster is aldus verzekerd en de occasionele ongelukken die optreden bij eenvoudige willekeurige bemonstering worden aldus vermeden.

(2) In het geval van meer homogene populaties, kan grotere nauwkeurigheid worden bereikt met minder gevallen.

(3) Vergeleken met de eenvoudige willekeurige, zijn gestratificeerde steekproeven geografisch meer geconcentreerd, waardoor de kosten in termen van tijd, geld en energie in het interviewen van respondenten worden verminderd.

(4) De steekproeven die een interviewer kiest, kunnen representatiever zijn indien zijn quotum wordt toegewezen door de onpersoonlijke procedure van stratificatie dan wanneer hij zijn eigen oordeel gebruikt (zoals bij het nemen van quota).

De belangrijkste beperking van gestratificeerde aselecte steekproeven is dat de onderzoeker, om de maximale voordelen ervan te behalen in de loop van een studie, veel moet weten over het probleem van onderzoek en de relatie ervan tot andere factoren. Zo'n kennis komt niet altijd en vaak is het wachten lang.

Er dient te worden herinnerd dat het gezichtspunt van de theorie van waarschijnlijkheidsbemonstering in essentie irrelevant is of stratificatie wordt geïntroduceerd tijdens de procedure van bemonstering of tijdens de analyse van gegevens, behalve in zoverre dat de eerste het mogelijk maakt om de grootte van de steekproef te controleren. monster verkregen uit elk stratum en aldus de efficiëntie van het ontwerp van de bemonstering te verhogen.

Met andere woorden, de procedure van het tekenen van een eenvoudige willekeurige steekproef en het vervolgens verdelen in strata is equivalent aan het tekenen van een gestratificeerde willekeurige steekproef met als het steekproefkader binnen elk stratum, de .populatie van die stratum die is opgenomen in de gegeven eenvoudige willekeurig voorbeeld.

Type # 7. Clusterbemonstering :

Gewoonlijk brengen eenvoudige willekeurige bemonstering en gestratificeerde aselecte bemonstering enorme kosten met zich mee wanneer het gaat om grote en ruimtelijk of geografisch verspreide populaties.

Bij de bovengenoemde soorten monsterneming kunnen de elementen die in de steekproef worden gekozen zo wijd verspreid zijn dat het ondervragen van hen mogelijk zware kosten met zich meebrengt, een groter deel van de niet-productieve tijd (doorgebracht tijdens reizen), een grotere kans op een gebrek aan uniformiteit onder de interviewers ' ondervragingen, opnames en tenslotte zware uitgaven voor het toezicht op het veldpersoneel.

Er zijn ook andere praktische factoren van die bemonstering. Het kan bijvoorbeeld als minder onaangenaam en dus toelaatbaar worden beschouwd om een ​​vragenlijst aan drie of vier afdelingen van een fabriek of kantoor te geven in plaats van deze op een steekproef uit alle afdelingen toe te dienen op een eenvoudige of gestratificeerde willekeurige basis, aangezien deze laatste procedure kan veel meer storend zijn voor de fabrieksroutines.

Om enkele van deze redenen maken grootschalige enquêtestudies zelden gebruik van eenvoudige of gestratificeerde willekeurige steekproeven; in plaats daarvan maken ze gebruik van de methode van clusterbemonstering.

Bij clusterbemonstering samplet de sampler eerst uit de populatie, bepaalde grote groepen, dwz 'cluster'. Deze clusters kunnen stadswijken, huishoudens of verschillende geografische of sociale eenheden zijn. De bemonstering van clusters uit de populatie wordt gedaan door eenvoudige of gestratificeerde willekeurige bemonsteringsmethoden. Uit deze geselecteerde clusters worden de samenstellende elementen bemonsterd door een beroep te doen op procedures die willekeur garanderen.

Stel bijvoorbeeld dat een onderzoeker een voorbeeldstudie wil uitvoeren naar de problemen van studenten in hogescholen in Maharashtra.

Hij kan als volgt verder gaan:

(a) Eerst bereidt hij een lijst voor van alle universiteiten in de staat en selecteert hij een steekproef van de universiteiten op een 'willekeurige' basis.

(b) Voor elk van de universiteiten van de staat, inclusief de steekproef, maakt hij een lijst van colleges onder zijn jurisdictie en neemt hij een steekproef van colleges op een 'willekeurige' basis.

(c) Voor elk van de colleges die toevallig in de steekproef worden opgenomen, maakt hij een lijst van alle niet-gegradueerde studenten die ermee zijn ingeschreven. Uit deze studenten selecteert hij een steekproef van de gewenste grootte op een 'willekeurige' basis (eenvoudig of gestratificeerd).

Op deze manier krijgt de onderzoeker een waarschijnlijkheid of willekeurige steekproef van elementen, meer of minder geconcentreerd, geografisch. Op deze manier kan hij zware uitgaven vermijden die anders zouden zijn gemaakt als hij zijn toevlucht had genomen tot eenvoudige of gelaagde willekeurige steekproeven, en toch hoeft hij de principes en voordelen van waarschijnlijkheidssteekproeven niet op te offeren.

Kenmerkend is dat deze bemonsteringsprocedure een reeks fasen doorloopt. Vandaar dat het in zekere zin een 'uit meerdere fasen bestaande' steekproef is en soms ook bij deze naam bekend is. Deze bemonsteringsprocedure gaat geleidelijk van de meer inclusieve naar de minder inclusieve steekproefeenheden, de onderzoeker komt uiteindelijk aan bij die elementen van de populatie die zijn gewenste steekproef vormen.

Opgemerkt moet worden dat bij clusterbemonstering het niet langer zo is dat elke combinatie van het gewenste aantal elementen in de populatie even waarschijnlijk wordt geselecteerd als de steekproef van de populatie. Vandaar dat het soort effecten dat we zagen in onze analyse van eenvoudige willekeurige steekproeven, dat wil zeggen, de populatie-waarde de meest waarschijnlijke steekproefwaarde is, hier niet te zien is.

But such effects do materialize in a more complicated way, though, of course, the sampling efficiency is hampered to some extent. It has been found that on a per case basis, the cluster sampling is much less efficient in getting information than comparably effective stratified random sampling.

Relatively speaking, in the cluster sampling, the margin of error is much greater. This handicap, however, is more than balanced by associated economies, which permit the sampling of a sufficiently large number of cases at a smaller total cost.

Depending on the specific features of the sampling plan attendant upon the objects of survey, cluster sampling may be more or less efficient than simple random sampling. The economies associated with cluster sampling generally tilt the balance in favour of employing cluster sampling in large-scale surveys, although compared to simple random sampling, more cases are needed for the same level of accuracy.

Type # 8. Multi-Phase Sampling:

It is sometimes convenient to confine certain questions about specific aspects of the study to a fraction of the sample, while other information is being collected from the whole sample. This procedure is known as 'multi-phase sampling.'

The basic information recorded from the whole sample makes it possible to compare certain characteristics of the sub-sample with that of the whole sample.

One additional point that merits mention is that multi-phase sampling facilitates stratification of the sub-sample since the information collected from the first phase sample can sometimes be gathered before the sub-sampling process takes place. It will be remembered that panel studies involve multi-phase sampling.