Glavni » algoritmično trgovanje » Stratificirano naključno vzorčenje

Stratificirano naključno vzorčenje

algoritmično trgovanje : Stratificirano naključno vzorčenje
Kaj je stratificirano naključno vzorčenje?

Stratificirano naključno vzorčenje je metoda vzorčenja, ki vključuje delitev populacije na manjše podskupine, znane kot sloji. Pri stratificiranem naključnem vzorčenju ali stratifikaciji se sloji oblikujejo na podlagi skupnih lastnosti ali značilnosti članov, kot so dohodek ali izobrazba.

Stratificirano naključno vzorčenje imenujemo tudi sorazmerno naključno vzorčenje ali naključno vzorčenje s kvotami.

[Pomembno: Stratificirano vzorčenje se uporablja za poudarjanje razlik med skupinami v populaciji, v nasprotju s preprostim naključnim vzorčenjem, ki obravnava vse člane populacije kot enake, z enako verjetnostjo vzorčenja.]

1:40

Stratificirano naključno vzorčenje

Kako deluje stratificirano naključno vzorčenje

Ko zaključi analizo ali raziskavo na skupini subjektov s podobnimi značilnostmi, lahko raziskovalec ugotovi, da je velikost prebivalstva prevelika, da bi lahko zaključili raziskave. Da bi prihranili čas in denar, se lahko analitik loti bolj izvedljivega pristopa z izbiro majhne skupine med prebivalstvom. Majhna skupina je navedena kot velikost vzorca, ki je podmnožica populacije, ki se uporablja za predstavljanje celotne populacije. Vzorec je mogoče izbrati iz populacije na več načinov, od katerih je ena stratificirana metoda naključnega vzorčenja.

Stratificirano naključno vzorčenje vključuje delitev celotne populacije na homogene skupine, imenovane strata (množina za stratum). Nato se iz vsakega stratuma izberejo naključni vzorci. Na primer, razmislite o akademskem raziskovalcu, ki bi želel izvedeti število študentov MBA v letu 2007, ki so v treh mesecih po diplomi dobili ponudbo za zaposlitev.

Kmalu bo ugotovil, da je bilo za to leto skoraj 200.000 diplomantov MBA. Lahko se bo odločil za samo naključni vzorec 50.000 diplomantov in opravil anketo. Še bolje, lahko je prebivalstvo razdelil na sloje in odvzel naključni vzorec iz slojev. V ta namen bi ustvaril skupine prebivalstva na podlagi spola, starostnega obdobja, rase, države državljanstva in poklicne pripadnosti. Naključni vzorec iz vsakega sloja se odvzame v številu, sorazmernem z velikostjo sloja v primerjavi s populacijo. Te podskupine slojev se nato združijo, da tvorijo naključni vzorec.

Ključni odvzemi

  • Stratificirano naključno vzorčenje omogoča raziskovalcem, da dobijo vzorčno populacijo, ki najbolje predstavlja celotno populacijo, ki se preučuje.
  • Stratificirano naključno vzorčenje vključuje delitev celotne populacije na homogene skupine, imenovane strata.
  • Stratificirano naključno vzorčenje se razlikuje od preprostega naključnega vzorčenja, ki vključuje naključno izbiro podatkov iz celotne populacije, zato je vsak verjeten vzorec enak.

Primer stratificiranega naključnega vzorčenja

Recimo, da želi raziskovalna skupina določiti skupne ocene študentov v ZDA. Raziskovalna skupina ima težave pri zbiranju podatkov od vseh 21 milijonov študentov; odloči se, da bo s pomočjo 4.000 študentov vzel naključni vzorec populacije.

Zdaj pa predpostavimo, da ekipa preučuje različne lastnosti vzorčnih udeležencev in se sprašuje, ali obstajajo razlike v splošnih splošnih ocenah in študijskih smernicah. Recimo, da je ugotovljeno, da je 560 študentov angleških smeri, 1.135 je naravoslovnih, 800 računalniških računalniških, 1.090 tehniških, 415 pa matematičnih. Skupina želi uporabiti sorazmerni stratificirani naključni vzorec, kjer je sloj vzorca sorazmeren z naključnim vzorcem v populaciji.

Predpostavimo, da skupina raziskuje demografijo študentov na univerzah v ZDA in ugotovi odstotek tistega, kar imajo študentje 12% večin v angleščini, 28% v znanosti, 24% v računalništvu, 21% v inženirstvu in 15% iz matematike. Tako nastane pet slojev iz stratificiranega postopka naključnega vzorčenja.

Nato mora ekipa potrditi, da je sloj populacije sorazmeren s slojem v vzorcu; vendar se jim zdi, da razmerja niso enaka. Ekipa mora nato ponovno vzorčiti 4.000 študentov iz populacije in naključno izbrati 480 angleščine, 1.120 znanosti, 960 računalništva, 840 inženirjev in 600 študentov matematike.

Z njimi ima sorazmeren stratificiran naključni vzorec študentov, ki omogoča boljšo zastopanost študentskih fakultet v ZDA. Nato lahko raziskovalci poudarijo določen sloj, opazujejo različne študije ameriških študentov in opazujejo različna povprečja točk .

Enostavni naključni in stratificirani naključni vzorci

Enostavni naključni vzorci in stratificirani naključni vzorci so statistično orodje za merjenje. Za predstavitev celotne populacije podatkov se uporablja preprost naključni vzorec. Stratificirani naključni vzorec razdeli populacijo na manjše skupine ali sloje na podlagi skupnih značilnosti.

Preprost naključni vzorec se pogosto uporablja, kadar je na voljo zelo malo informacij o populaciji podatkov, kadar ima populacija podatkov veliko preveč razlik za razdelitev na različne podvrste ali kadar je med populacijo podatkov le ena značilna značilnost.

Na primer, družba za sladkarije bo morda želela preučiti nakupne navade svojih kupcev, da bi določila prihodnost svoje linije izdelkov. Če je 10.000 strank, lahko izbere 100 teh strank kot naključni vzorec. Nato lahko vse, kar najde, od teh 100 kupcev uporabi za preostanek svoje baze. Za razliko od stratifikacije bo vzorčilo 100 članov naključno, ne glede na njihove značilnosti.

Sorazmerna in nesorazmerna stratifikacija

Stratificirano naključno vzorčenje zagotavlja, da je vsaka podskupina določene populacije ustrezno zastopana v celotni populaciji vzorcev v raziskovalni študiji. Stratifikacija je lahko sorazmerna ali nesorazmerna. Pri sorazmerni stratificirani metodi je velikost vzorca vsakega sloja sorazmerna z velikostjo populacije v sloju.

Na primer, če bi raziskovalec želel vzorec 50.000 diplomantov z uporabo starostnega obdobja, bo pridobil sorazmerni stratificirani naključni vzorec po tej formuli: (velikost vzorca / velikost populacije) x velikost sloja. Spodnja tabela predvideva število prebivalcev 180.000 MBA diplomantov na leto.

Starostna skupina


24–28


29–33


34-37


Skupaj


Število ljudi v stratumu


90.000


60.000


30.000


180.000


Velikost vzorca plasti


25.000


16.667


8, 333


50.000


Velikost vzorca slojev za diplomante MBA v starostnem obdobju od 24 do 28 let se izračuna kot (50.000 / 180.000) x 90.000 = 25.000. Ista metoda se uporablja za druge starostne skupine. Zdaj, ko je znana velikost vzorca plasti, lahko raziskovalec izvede preprosto naključno vzorčenje v vsakem sloju, da izbere svoje udeležence v raziskavi. Povedano drugače, 25.000 diplomantov starostne skupine med 24 in 28 leti bo izbranih naključno iz celotne populacije, 16.667 diplomantov starostnega obdobja od 29 do 33 let bo izbranih iz populacije naključno in tako naprej.

V nesproporcionalnem stratificiranem vzorcu velikost vsakega sloja ni sorazmerna z njegovo velikostjo v populaciji. Raziskovalec se lahko odloči za vzorčenje 1/2 diplomantov v starostni skupini od 34 do 37 let in 1/3 diplomantov v starostni skupini od 29 do 33 let.

Pomembno je opozoriti, da se ena oseba ne more vključiti v več slojev. Vsak subjekt se mora prilegati le v enem sloju. Zaradi prekrivajočih se podskupin pomeni, da bodo nekateri posamezniki imeli večje možnosti, da bodo izbrani za anketo, kar koncept stratificiranega vzorčenja kot vrste verjetnostnega vzorčenja popolnoma izniči.

[Pomembno: Upravljavci portfelja lahko uporabijo stratificirano naključno vzorčenje za ustvarjanje portfeljev s kopiranjem indeksa, kot je indeks obveznic.]

Prednosti stratificiranega naključnega vzorčenja

Glavna prednost stratificiranega naključnega vzorčenja je, da zajame ključne značilnosti populacije v vzorcu. Podobno kot tehtano povprečje tudi ta način vzorčenja v vzorcu daje lastnosti, ki so sorazmerne celotni populaciji. Stratificirano naključno vzorčenje deluje dobro za populacije z različnimi atributi, vendar je drugače neučinkovito, če ni mogoče oblikovati podskupin.

Stratifikacija daje manjšo napako pri oceni in večjo natančnost kot enostavna metoda naključnega vzorčenja. Večje kot so razlike med sloji, večji je natančnost.

Slabosti stratificiranega naključnega vzorčenja

Na žalost te metode raziskovanja ni mogoče uporabiti v vsaki študiji. Pomanjkljivost metode je, da mora biti za pravilno uporabo izpolnjenih več pogojev. Raziskovalci morajo identificirati vsakega člana populacije, ki se preučuje, in vsakega od njih razvrstiti v eno in samo eno podpopulacijo. Zato je stratificirano naključno vzorčenje neugodno, če raziskovalci ne morejo samozavestno razvrstiti vsakega člana populacije v podskupino. Tudi iskanje izčrpnega in dokončnega seznama celotne populacije je lahko izziv.

Prekrivanje je lahko težava, če obstajajo predmeti, ki spadajo v več podskupin. Če se izvaja preprosto naključno vzorčenje, je večja verjetnost, da bodo izbrani tisti, ki so v več podskupinah. Rezultat je lahko napačna predstavitev ali netočen odraz prebivalstva.

Zgornji primeri olajšajo: dodiplomske, podiplomske, moške in ženske so jasno določene skupine. V drugih situacijah pa je lahko veliko težje. Predstavljajte si, da vključuje značilnosti, kot so rasa, narodnost ali vera. Postopek razvrščanja postane težji, stratificirano naključno vzorčenje postane neučinkovita in manj kot idealna metoda.

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Vzorec Vzorec je manjša, obvladljiva različica večje skupine. Vzorci se uporabljajo pri statističnem testiranju, kadar je velikost prebivalstva prevelika. več Kako delujejo preprosti naključni vzorci Preprost naključni vzorec je podmnožica statistične populacije, v kateri ima vsak član podskupine enako verjetnost, da bo izbran. Preprost naključni vzorec naj bi bil nepristranski prikaz skupine. več Reprezentativni vzorec se pogosto uporablja za ekstrapoliranje širših občutkov Reprezentativni vzorec je podmnožica populacije, ki odraža značilnosti celotne populacije. več Vsled in izhodi sistematičnega vzorčenja Sistematično vzorčenje je metoda verjetnostnega vzorčenja, pri kateri se izbere naključni vzorec iz večje populacije. več Opredelitev vzorčenja Vzorčenje je postopek, ki se uporablja pri statističnih analizah, v katerem skupina opazovanj izvleče večjo populacijo. več Opredelitev T-testa T-test je vrsta inferencialne statistike, ki se uporablja za ugotavljanje, ali obstaja pomembna razlika med sredstvi dveh skupin, ki sta lahko v določenih značilnostih povezani. več partnerskih povezav
Priporočena
Pustite Komentar