Distribuția eșantionării
Ce este o distribuție de eșantionare?
O distribuție de eșantionare este o distribuție de probabilitate a unei statistici obținută dintr-un număr mai mare de eșantioane extrase dintr-o anumită populație. Distribuția prin eșantionare a unei populații date este distribuirea frecvențelor dintr-o serie de rezultate diferite care ar putea apărea pentru o statistică a unei populații.
În statistici, o populație este întregul fond din care este extras un eșantion statistic . O populație se poate referi la un întreg grup de persoane, obiecte, evenimente, vizite la spital sau măsurători. Se poate spune astfel că o populație este o observație agregată a subiecților grupați împreună după o trăsătură comună.
- O distribuție de eșantionare este o statistică care se obține prin eșantionare repetată de la o populație mai mare.
- Acesta descrie o serie de rezultate posibile ca ale unei statistici, cum ar fi media sau modul unei variabile, deoarece există cu adevărat o populație.
- Majoritatea datelor analizate de cercetători sunt de fapt extrase din eșantioane, nu din populații.
Înțelegerea distribuției eșantionării
O mulțime de date extrase și utilizate de academicieni, statistici, cercetători, specialiști în marketing, analiști etc. sunt de fapt eșantioane, nu populații. Un eșantion este un subset al unei populații. De exemplu, un cercetător medical care a dorit să compare greutatea medie a tuturor bebelușilor născuți în America de Nord din 1995 până în 2005 cu cei născuți în America de Sud în aceeași perioadă de timp nu poate extrage datele pentru întreaga populație din peste un milion de nașteri care au avut loc în decursul a zece ani. În schimb, el va folosi doar greutatea a, să zicem, 100 de bebeluși, pe fiecare continent, pentru a face o concluzie. Greutatea a 200 de bebeluși utilizați este eșantionul și greutatea medie calculată este media eșantionului.
Acum, să presupunem că, în loc să ia doar un eșantion de 100 de greutăți nou-născuți de pe fiecare continent, cercetătorul medical preia probe repetate aleatorii din populația generală și calculează media eșantionului pentru fiecare grup de eșantion. Deci, pentru America de Nord, el extrage date pentru 100 de greutăți nou-născuți înregistrate în SUA, Canada și Mexic după cum urmează: patru 100 de probe din anumite spitale din SUA, cinci 70 de probe din Canada și trei 150 de înregistrări din Mexic, pentru un total din 1200 de greutăți ale nou-născuților grupate în 12 seturi. De asemenea, el colectează un eșantion de date de 100 de greutăți la naștere din fiecare dintre cele 12 țări din America de Sud.
Fiecare eșantion are propria medie a eșantionului și distribuția eșantionului este cunoscută sub numele de distribuție a eșantionului.
Greutatea medie calculată pentru fiecare set de eșantioane este distribuția eșantionării mediei. Nu doar media poate fi calculată dintr-un eșantion. Alte statistici, cum ar fi abaterea standard, varianța, proporția și intervalul pot fi calculate din datele eșantionului. Abaterea standard și varianța măsoară variabilitatea distribuției de eșantionare.
Numărul de observații dintr-o populație, numărul de observații dintr-un eșantion și procedura utilizată pentru extragerea seturilor de eșantioane determină variabilitatea unei distribuții de eșantionare. Abaterea standard a unei distribuții de eșantionare se numește eroare standard. În timp ce media unei distribuții de eșantionare este egală cu media populației, eroarea standard depinde de deviația standard a populației, de mărimea populației și de mărimea eșantionului.
Știind cât de răspândite media fiecărui set de eșantioane sunt una de cealaltă și față de media populației, veți da o indicație a cât de aproape este media eșantionului de media populației. Eroarea standard a distribuției eșantionării scade odată cu creșterea dimensiunii eșantionului.
consideratii speciale
O populație sau un eșantion de numere vor avea o distribuție normală. Cu toate acestea, deoarece o distribuție de eșantionare include mai multe seturi de observații, nu va avea neapărat o formă curbată de clopot.
Urmând exemplul nostru, greutatea medie a populației bebelușilor din America de Nord și America de Sud are o distribuție normală, deoarece unii bebeluși vor fi subponderali (sub medie) sau supraponderali (peste medie), majoritatea bebelușilor scăzând între ). În cazul în care greutatea medie a nou-născuților din America de Nord este de șapte lire sterline, greutatea medie a eșantionului în fiecare dintre cele 12 seturi de eșantioane de observații înregistrate pentru America de Nord se va apropia și de șapte lire sterline.
Cu toate acestea, dacă graficați fiecare dintre mediile calculate în fiecare dintre cele 1.200 de grupuri de eșantioane, forma rezultată poate avea ca rezultat o distribuție uniformă, dar este dificil de prezis cu certitudine care va fi forma reală. Cu cât cercetătorul folosește mai multe eșantioane din populația de peste un milion de cifre de greutate, cu atât graficul va începe să formeze o distribuție normală.