Principal » tranzacționarea algoritmică » Eșantionare aleatorie stratificată

Eșantionare aleatorie stratificată

tranzacționarea algoritmică : Eșantionare aleatorie stratificată
Ce este eșantionarea aleatorie stratificată?

Eșantionarea randomizată stratificată este o metodă de eșantionare care implică divizarea unei populații în subgrupuri mai mici cunoscute sub numele de straturi. În eșantionarea sau stratificarea aleatorie stratificată, straturile sunt formate pe baza atributelor sau caracteristicilor comune ale membrilor, cum ar fi venitul sau atingerea educațională.

Eșantionarea aleatorie stratificată se mai numește eșantionare aleatorie proporțională sau eșantionare aleatorie de cote.

[Important: Eșantionarea stratificată este utilizată pentru a evidenția diferențele dintre grupurile dintr-o populație, spre deosebire de eșantionarea simplă la întâmplare, care tratează toți membrii unei populații ca fiind egali, cu o probabilitate egală de eșantionare.]

01:40

Eșantionare aleatorie stratificată

Cum funcționează eșantionarea aleatorie stratificată

Când finalizează analiza sau cercetarea asupra unui grup de entități cu caracteristici similare, un cercetător poate constata că dimensiunea populației este prea mare pentru a finaliza cercetarea. Pentru a economisi timp și bani, un analist poate adopta o abordare mai posibilă, selectând un grup mic din populație. Grupul mic este denumit o mărime de eșantion, care este un subset al populației care este utilizat pentru a reprezenta întreaga populație. Un eșantion poate fi selectat dintr-o populație printr-o serie de moduri, dintre care una este metoda de eșantionare aleatorie stratificată.

O eșantionare aleatorie stratificată implică împărțirea întregii populații în grupuri omogene numite straturi (plural pentru strat). Probele aleatorii sunt apoi selectate din fiecare strat. De exemplu, ia în considerare un cercetător academic care ar dori să cunoască numărul de studenți MBA în 2007 care au primit o ofertă de muncă în termen de trei luni de la absolvire.

El va afla în curând că au fost aproape 200.000 de absolvenți de MBA pe an. El ar putea decide să ia doar un simplu eșantion de 50.000 de absolvenți și să conducă un sondaj. Mai bine, el putea împărți populația în straturi și să ia un eșantion aleatoriu din straturi. Pentru a face acest lucru, el ar crea grupuri de populație în funcție de sex, gamă de vârstă, rasă, țara de naționalitate și fondul carierei. Un eșantion aleatoriu din fiecare strat este prelevat într-un număr proporțional cu dimensiunea stratului în comparație cu populația. Aceste subseturi de straturi sunt apoi reunite pentru a forma un eșantion aleatoriu.

Cheie de luat cu cheie

  • Eșantionarea randomizată stratificată permite cercetătorilor să obțină o populație de eșantion care să reprezinte cel mai bine întreaga populație studiată.
  • Eșantionarea aleatorie stratificată implică împărțirea întregii populații în grupuri omogene numite straturi.
  • Eșantionarea aleatorie stratificată diferă de eșantionarea aleatorie simplă, care implică selecția aleatorie de date dintr-o întreagă populație, astfel încât fiecare eșantion posibil să aibă loc la fel de probabil.

Exemplu de eșantionare aleatorie stratificată

Să presupunem că o echipă de cercetare dorește să determine GPA-ul studenților din universități din SUA Echipa de cercetare are dificultăți în colectarea datelor de la toți cei 21 de milioane de studenți; decide să ia un eșantion aleatoriu al populației folosind 4.000 de studenți.

Acum presupunem că echipa analizează diferitele atribute ale participanților la eșantion și se întreabă dacă există diferențe în GPA-uri și majori ai studenților. Să presupunem că constată că 560 de studenți sunt studenți englezi, 1.135 sunt studii de știință, 800 sunt studii de informatică, 1.090 sunt studii de inginerie și 415 sunt studii de matematică. Echipa dorește să utilizeze un eșantion randomizat stratificat proporțional în care stratul eșantionului este proporțional cu eșantionul aleatoriu din populație.

Presupunem că echipa cercetează demografia studenților colegiului din SUA și găsește procentul din ceea ce studenții sunt majori în 12% major în engleză, 28% în știință, 24% în știința computerelor, 21% în inginerie și 15% majori în matematică. Astfel, cinci straturi sunt create în urma procesului de eșantionare aleatoriu stratificat.

Echipa trebuie apoi să confirme că stratul populației este proporțional cu stratul din eșantion; cu toate acestea, ei consideră că proporțiile nu sunt egale. Echipa trebuie apoi să reconstituie 4.000 de studenți din populație și să aleagă la întâmplare 480 de engleze, 1.120 de științe, 960 de informatică, 840 de inginerie și 600 de studenți de matematică.

Cu acestea, are un eșantionat proporțional stratificat aleatoriu de studenți, care oferă o reprezentare mai bună a studenților majori ai colegiului din SUA Cercetătorii pot evidenția apoi stratul specific, observa diferitele studii ale studenților universitari din SUA și observă diferitele medii punctuale. .

Simplu aleatoriu versus probe aleatoare stratificate

Eșantioane simple aleatorii și eșantioane aleatorii stratificate sunt instrumente statistice de măsurare. Un simplu eșantion simplu este utilizat pentru a reprezenta întreaga populație de date. Un eșantion stratificat aleator împarte populația în grupuri mai mici sau straturi, pe baza caracteristicilor comune.

Eșantionul simplu aleatoriu este adesea folosit atunci când există foarte puține informații disponibile despre populația de date, când populația de date are prea multe diferențe pentru a se împărți în diverse subseturi sau când există o singură caracteristică distinctă între populația de date.

De exemplu, o companie de bomboane poate dori să studieze obiceiurile de cumpărare ale clienților săi pentru a determina viitorul gamei sale de produse. În cazul în care există 10.000 de clienți, este posibil să folosească 100 dintre acești clienți ca eșantion aleatoriu. Apoi poate aplica ceea ce găsește de la cei 100 de clienți la restul bazei sale. Spre deosebire de stratificare, acesta va testa 100 de membri pur la întâmplare, fără a ține cont de caracteristicile lor individuale.

Stratificare proporțională și disproporționată

Eșantionarea aleatorie stratificată asigură că fiecare subgrup al unei populații date este reprezentat în mod adecvat în cadrul întregului număr de populație dintr-un studiu de cercetare. Stratificarea poate fi proporțională sau disproporționată. Într-o metodă proporțională stratificată, dimensiunea eșantionului fiecărui strat este proporțională cu dimensiunea populației stratului.

De exemplu, dacă cercetătorul dorea un eșantion de 50.000 de absolvenți folosind intervalul de vârstă, eșantionul proporțional stratificat aleatoriu va fi obținut utilizând această formulă: (mărimea eșantionului / dimensiunea populației) x dimensiunea stratului. Tabelul de mai jos presupune o dimensiune a populației de 180.000 de absolvenți MBA pe an.

Grupă de vârstă


24-28


29-33


34-37


Total


Număr de persoane aflate în strat


90.000


60.000


30.000


180000


Dimensiunea eșantionului straturilor


25.000


16667


8333


50.000


Mărimea eșantionului de straturi pentru absolvenții MBA în vârsta cuprinsă între 24 și 28 de ani este calculată ca (50.000 / 180.000) x 90.000 = 25.000. Aceeași metodă este folosită și pentru celelalte grupe de vârstă. Acum că dimensiunea eșantionului stratului este cunoscută, cercetătorul poate efectua eșantionare aleatorie simplă în fiecare strat pentru a-și selecta participanții la sondaj. Cu alte cuvinte, 25.000 de absolvenți din grupul de vârstă 24-28 de ani vor fi selectați la întâmplare din întreaga populație, 16.667 absolvenți de la vârsta de 29-33 de ani vor fi selectați la întâmplare, etc.

Într-un eșantion stratificat disproporționat, mărimea fiecărui strat nu este proporțională cu dimensiunea sa în populație. Cercetătorul poate decide să preleveze 1/2 dintre absolvenții din grupa de vârstă 34-37 de ani și 1/3 dintre absolvenții din grupa de vârstă 29-33 de ani.

Este important să rețineți că o persoană nu se poate încadra în mai multe straturi. Fiecare entitate trebuie să se încadreze într-un singur strat. Având subgrupuri suprapuse înseamnă că unii indivizi vor avea șanse mai mari de a fi selectați pentru sondaj, ceea ce anulează complet conceptul de eșantionare stratificat ca tip de eșantionare de probabilitate.

[Important: Managerii de portofoliu pot utiliza eșantionare aleatorie stratificată pentru a crea portofolii prin replicarea unui indice, cum ar fi un indice de obligațiuni.]

Avantajele eșantionării aleatorii stratificate

Principalul avantaj al eșantionării aleatorii stratificate este că surprinde caracteristicile cheie ale populației în eșantion. Similar cu o medie ponderată, această metodă de prelevare produce caracteristici în eșantion care sunt proporționale cu populația totală. Eșantionarea la întâmplare stratificată funcționează bine pentru populațiile cu o varietate de atribute, dar este altfel ineficientă dacă nu se pot forma subgrupuri.

Stratificarea dă o eroare mai mică în estimare și o precizie mai mare decât metoda de eșantionare aleatorie simplă. Cu cât diferențele dintre straturi sunt mai mari, cu atât câștigul de precizie este mai mare.

Dezavantajele eșantionării aleatorii stratificate

Din păcate, această metodă de cercetare nu poate fi utilizată în fiecare studiu. Dezavantajul metodei este că trebuie îndeplinite mai multe condiții pentru ca acesta să fie utilizat în mod corespunzător. Cercetătorii trebuie să identifice fiecare membru al unei populații care este studiat și să-i clasifice pe fiecare într-o singură subpobulare și doar una. Drept urmare, eșantionarea aleatorie stratificată este dezavantajoasă atunci când cercetătorii nu pot clasifica cu încredere fiecare membru al populației într-un subgrup. De asemenea, găsirea unei liste exhaustive și definitive a unei întregi populații poate fi dificilă.

Suprapunerea poate fi o problemă dacă există subiecți care se încadrează în mai multe subgrupuri. Atunci când se efectuează eșantionarea simplă la întâmplare, cei care se află în mai multe subgrupuri au mai multe șanse să fie aleși. Rezultatul ar putea fi o reprezentare greșită sau o reflectare inexactă a populației.

Exemplele de mai sus ușurează: studenții de licență, absolvenții, bărbații și femeile sunt grupuri clar definite. Cu toate acestea, în alte situații, poate fi mult mai dificil. Imaginați-vă că includeți caracteristici precum rasa, etnia sau religia. Procesul de sortare devine mai dificil, făcând eșantionarea aleatorie stratificată o metodă ineficientă și mai mică decât cea ideală.

Compararea conturilor de investiții Denumirea furnizorului Descrierea divulgatorului de publicitate × Ofertele care apar în acest tabel provin din parteneriate de la care Investopedia primește compensații.

Termeni înrudiți

Eșantion Un eșantion este o versiune mai mică și ușor de gestionat a unui grup mai mare. Probele sunt utilizate în testarea statistică atunci când dimensiunile populației sunt prea mari. mai mult Cum funcționează probe aleatorii simple Un eșantion simplu aleatoriu este un subset al unei populații statistice în care fiecare membru al subsetului are o probabilitate egală de a fi ales. Un eșantion simplu aleatoriu este menit să fie o reprezentare imparțială a unui grup. mai mult Eșantionul reprezentativ este adesea folosit pentru a extrapola sentimentul mai larg Un eșantion reprezentativ este un subset de populație care reflectă caracteristicile întregii populații. mai mult Ins și eșantionul prelevării sistematice Eșantionarea sistematică este o metodă de eșantionare a probabilității în care este selectat un eșantion aleatoriu dintr-o populație mai mare. mai multe Definiție de prelevare Eșantionarea este un proces utilizat în analiza statistică în care un grup de observații este extras dintr-o populație mai mare. mai mult Definiția testului T Un test t este un tip de statistică inferențială utilizată pentru a determina dacă există o diferență semnificativă între mijloacele a două grupuri, care pot fi legate în anumite caracteristici. mai multe link-uri partenere
Recomandat
Lasă Un Comentariu