1 mai 2021 14:33

Bunătatea potrivită

Ce este Goodness-Of-Fit?

Testul bunătății de potrivire este un test de ipoteză statistică pentru a vedea cât de bine se potrivesc datele eșantionului unei distribuții dintr-o populație cu o distribuție normală. Altfel spus, acest test arată dacă datele eșantionului dvs. reprezintă datele pe care v-ați aștepta să le găsiți în populația reală sau dacă sunt cumva distorsionate. Goodness-of-fit stabilește discrepanța dintre valorile observate și cele care ar fi de așteptat de la model într-un caz de distribuție normal.

Există mai multe metode pentru determinarea bunătății de potrivire. Unele dintre cele mai populare metode utilizate în statistici includ chi-pătratul, testul Kolmogorov-Smirnov, testul Anderson-Darling și testul Shipiro-Wilk.

Chei de luat masa

  • Testele de bună-potrivire sunt teste statistice care au scopul de a determina dacă un set de valori observate se potrivește cu cele așteptate în cadrul modelului aplicabil.
  • Există mai multe tipuri de teste de bună-potrivire, dar cel mai frecvent este testul chi-pătrat.
  • Chi-pătratul determină dacă există o relație între datele categorice.
  • Testul Kolmogorov-Smirnov – utilizat pentru eșantioane mari – determină dacă un eșantion provine dintr-o distribuție specifică a unei populații.
  • Testele de bună-potrivire vă pot arăta dacă datele eșantionului se potrivesc unui set de date așteptat dintr-o populație cu distribuție normală.

Înțelegerea bunătății

Testele de bună-potrivire sunt metode statistice utilizate adesea pentru a face inferențe despre valorile observate. Aceste teste determină modul în care valorile reale sunt corelate cu valorile prezise într-un model și, atunci când sunt utilizate în luarea deciziilor, testele de bună-potrivire pot ajuta la prezicerea tendințelor și modelelor viitoare.

Cel mai frecvent test de bunătate a potrivirii este testul chi-pătrat, utilizat de obicei pentru distribuții discrete. Testul chi-pătrat este utilizat exclusiv pentru datele plasate în clase (pubele) și necesită o dimensiune suficientă a eșantionului pentru a produce rezultate exacte.



Testele de bună-potrivire sunt utilizate în mod obișnuit pentru a testa normalitatea reziduurilor sau pentru a determina dacă două probe sunt colectate din distribuții identice.

Tipuri de teste de bunătate

Testul Chi-Square

Testul chi-pătrat, cunoscut și sub numele de test chi-pătrat pentru independență, este o metodă statistică inferențială care testează validitatea unei afirmații făcute despre o populație pe baza unui eșantion aleatoriu. Cu toate acestea, nu indică tipul sau intensitatea relației. De exemplu, nu concluzionează dacă relația este pozitivă sau negativă.



Pentru a se califica la testul chi-pătrat pentru independență, variabilele trebuie să se excludă reciproc.

Pentru a calcula o bunătate de potrivire chi-pătrat, este necesar să setați nivelul de semnificație alfa dorit (de exemplu, dacă nivelul de încredere este de 95% sau 0,95, atunci alfa este de 0,05), identificați variabilele categorice la testați și definiți afirmații de ipoteză despre relațiile dintre ele. Ipoteza nulă afirmă că nu există o relație între variabile, și ipoteza alternativă presupune că există o relație. Frecvența valorilor observate este măsurată și ulterior utilizată cu valorile așteptate și cu gradele de libertate pentru a calcula chi-pătrat. Dacă rezultatul este mai mic decât alfa, ipoteza nulă este invalidă, indicând o relație între variabile.

Testul Kolmogorov-Smirnov

D=max⁡1≤eu≤N(F(Daeu)-eu-1N,euN-F(Daeu))D = \ max \ limits_ {1 \ leq i \ leq N} \ bigg (F (Y_i) – \ frac {i-1} {N}, \ frac {i} {N} -F (Y_i) \ bigg)D=1≤i≤Nmax(…)( F(Yeu(…))-N

Numit după matematicienii ruși Andrey Kolmogorov și Nikolai Smirnov, testul Kolmogorov-Smirnov (cunoscut și sub numele de testul KS) este o metodă statistică care determină dacă un eșantion provine dintr-o distribuție specifică într-o populație. Testul Kolmogorov-Smirnov – recomandat pentru eșantioane mari (de exemplu, peste 2000) – nu este parametric, ceea ce înseamnă că nu se bazează pe nicio distribuție pentru a fi validă. Se concentrează Scopul este de a demonstra ipoteza nulă, care este eșantionul distribuției normale.

Contrar testului chi-pătrat, testul Kolmogorov-Smirnov se aplică distribuțiilor continue. La fel ca chi-pătratul, folosește o ipoteză nulă și alternativă și un nivel alfa de semnificație. Nul indică faptul că datele urmează o distribuție specifică în cadrul populației, iar alternativa indică faptul că datele nu au urmat o distribuție specifică în cadrul populației. Alfa este utilizat pentru a determina valoarea critică utilizată în test.

Statistica de test calculată, des denotată ca D, determină dacă ipoteza nulă este acceptată sau respinsă. Dacă D este mai mare decât valoarea critică la alfa, ipoteza nulă este respinsă. Dacă D este mai mic decât valoarea critică, se acceptă ipoteza nulă, indicând

Test Shipiro-Wilk

Testul Shipiro-Wilk determină dacă o probă urmează o distribuție normală. Folosind un eșantion cu o variabilă de date continue, testul Shipiro-Wilk verifică doar normalitatea. Este recomandat pentru eșantioane mici până în 2000. La fel ca celelalte, folosește alfa și formează două ipoteze: nulă și alternativă. Ipoteza nulă afirmă că eșantionul provine din distribuția normală, în timp ce ipoteza alternativă afirmă că eșantionul nu provine din distribuția normală.

Testul Shipiro-Wilk folosește un grafic de probabilitate numit graficul QQ. Acest diagramă de dispersie afișează vizual două seturi de cuantile pe axa y, aranjate de la cel mai mic la cel mai mare. Dacă fiecare cuantilă a provenit din aceeași distribuție, diagrama de dispersie va afișa o serie liniară de grafice. Testul Shipiro-Wilk folosește graficul QQ pentru a estima varianța. Folosind varianța graficului QQ împreună cu varianța estimată a populației, se poate determina dacă eșantionul aparține unei distribuții normale. Dacă coeficientul ambelor varianțe este egal sau este apropiat de 1, atunci ipoteza nulă poate fi acceptată. Dacă este considerabil mai mic decât 1, acesta poate fi respins.

Exemplu de test al bunătății

De exemplu, o mică sală de gimnastică comunitară ar putea funcționa presupunând că are cea mai mare frecvență în zilele de luni, marți și sâmbătă, frecvență medie miercurea și joi și cea mai mică frecvență în zilele de vineri și duminică. Pe baza acestor ipoteze, sala de sport angajează în fiecare zi un anumit număr de membri ai personalului pentru a se înregistra, pentru a curăța facilitățile, pentru a oferi servicii de instruire și pentru a preda cursuri.

Cu toate acestea, sala de sport nu are performanțe financiare bune, iar proprietarul dorește să știe dacă aceste ipoteze de prezență și nivelul de personal sunt corecte. Proprietarul decide să numere numărul participanților la sala de sport în fiecare zi timp de șase săptămâni. Apoi, poate compara prezența presupusă a sălii de sport cu frecvența observată a acesteia, folosind, de exemplu, un test chi-pătrat de bunătate. Cu noile date, el poate stabili cum să gestioneze cel mai bine sala de sport și să îmbunătățească profitabilitatea.

Întrebări frecvente despre bunătate

Ce înseamnă bunătatea potrivirii?

Goodness-of-Fit este un test de ipoteză statistică utilizat pentru a vedea cât de atent sunt datele observate, date care se așteaptă. Testele Goodness-of-Fit pot ajuta la determinarea dacă un eșantion urmează o distribuție normală, dacă variabilele categorice sunt corelate sau dacă eșantioanele provin din aceeași distribuție.

De ce este importantă bunăvoința?

Testele Goodness-of-Fit vă ajută să determinați dacă datele observate se aliniază la ceea ce este așteptat. Deciziile pot fi luate pe baza rezultatului testului de ipoteză efectuat. De exemplu, un comerciant cu amănuntul vrea să știe ce ofertă de produse îi atrage pe tineri. Retailerul analizează un eșantion aleatoriu de tineri și bătrâni pentru a identifica ce produs este preferat. Folosind chi-pătrat, ei identifică faptul că, cu încredere de 95%, există o relație între produsul A și tineri. Pe baza acestor rezultate, s-ar putea determina că acest eșantion reprezintă populația de adulți tineri. Comercianții cu amănuntul pot folosi acest lucru pentru a-și reforma campaniile.

Ce este bunitatea potrivirii în testul Chi-Square?

Testul chi-pătrat testează dacă există relații între variabilele categorice și dacă eșantionul reprezintă întregul. Se estimează cât de aproape datele observate reflectă datele așteptate sau cât de bine se potrivesc.

Cum faceți testul bunătății?

Testul Goodness-of-FIt constă din diferite metode de testare. Scopul testului va ajuta la determinarea metodei de utilizat. De exemplu, dacă scopul este de a testa normalitatea pe un eșantion relativ mic, testul Shipiro-Wilk poate fi adecvat. Dacă doriți să stabiliți dacă un eșantion a provenit dintr-o distribuție specifică în cadrul unei populații, va fi utilizat testul Kolmogorov-Smirnov. Fiecare test folosește propria formulă unică. Cu toate acestea, acestea au puncte comune, cum ar fi o ipoteză nulă și un nivel de semnificație.

Linia de fund

Testele de bună calitate se determină cât de bine se potrivesc datele eșantionului cu ceea ce se așteaptă de la o populație. Din datele eșantionului, se colectează o valoare observată și se compară cu valoarea estimată calculată folosind o măsură de discrepanță. Există diferite teste de ipoteză a bunătății potrivite disponibile, în funcție de rezultatul pe care îl căutați.

Alegerea testului corect al bunătății depinde în mare măsură de ceea ce doriți să știți despre un eșantion și de cât de mare este eșantionul. De exemplu, dacă doriți să știți dacă valorile observate pentru datele categorice se potrivesc cu valorile așteptate pentru datele categorice, utilizați chi-pătrat. Dacă doriți să știți dacă un eșantion mic urmează o distribuție normală, testul Shipiro-Wilk ar putea fi avantajos. Există multe teste disponibile pentru a determina bunătatea potrivirii.