Chi-Square (χ2) Definiție statistică - KamilTaylan.blog
1 mai 2021 10:46

Chi-Square (χ2) Definiție statistică

Ce este o statistică Chi-Square?

O statistică chi-pătrat ( χ 2 ) este un test care măsoară modul în care un model se compară cu datele reale observate. Datele utilizate la calcularea unei statistici chi-pătrat trebuie să fie aleatorii, brute, excludente reciproc, extrase din variabile independente și extrase dintr-un eșantion suficient de mare. De exemplu, rezultatele aruncării unei monede corecte îndeplinesc aceste criterii.

Testele Chi-pătrat sunt adesea utilizate în testarea ipotezelor. Statistica chi-pătrat compară mărimea oricăror discrepanțe între rezultatele așteptate și rezultatele reale, având în vedere dimensiunea eșantionului și numărul de variabile din relație. Pentru aceste teste, se utilizează grade de libertate pentru a determina dacă o anumită  ipoteză nulă  poate fi respinsă pe baza numărului total de variabile și eșantioane din cadrul experimentului. Ca și în cazul oricărei statistici, cu cât eșantionul este mai mare, cu atât rezultatele sunt mai fiabile.

Chei de luat masa

  • O statistică chi-pătrat ( χ 2 ) este o măsură a diferenței dintre frecvențele observate și așteptate ale rezultatelor unui set de evenimente sau variabile.
  • χ 2 depinde de mărimea diferenței dintre valorile reale și observate, de gradele de libertate și de mărimea eșantioanelor.
  • χ 2 poate fi utilizat pentru a testa dacă două variabile sunt corelate sau independente una de alta sau pentru a testa bunătatea potrivirii dintre o distribuție observată și o distribuție teoretică a frecvențelor.

Formula pentru Chi-Square este

Ce îți spune o statistică Chi-Square?

Există două tipuri principale de teste chi-pătrat: testul independenței, care pune o întrebare de relație, cum ar fi „Există o relație între sexul elevului și alegerea cursului?”; și  testul bunătății de potrivire, care întreabă ceva de genul „Cât de bine se potrivește moneda din mâna mea cu o monedă corectă teoretic?”

Independenţă

Atunci când se ia în considerare sexul elevilor și alegerea cursului, ar putea fi folosit un test de independență χ 2. Pentru a face acest test, cercetătorul ar colecta date cu privire la cele două variabile alese (sex și cursuri alese) și apoi va compara frecvențele la care studenții bărbați și femei selectează printre clasele oferite folosind formula dată mai sus și un tabel statistic χ 2.

Dacă nu există nicio relație între sex și selecția cursului (adică, dacă acestea sunt independente), atunci frecvențele reale la care studenții de sex masculin și feminin selectează fiecare curs oferit ar trebui să fie aproximativ egale sau, invers, proporția de bărbați și studentele la orice curs selectat ar trebui să fie aproximativ egal cu proporția de studenți bărbați și femei din eșantion. Un χ 2 test pentru independenta ne poate spune cât de probabil este ca șansă aleatoare poate explica orice diferență observată între frecvențele reale din datele și aceste așteptări teoretice.

Bunătatea potrivită

χ 2 oferă o modalitate de a testa cât de bine se potrivește un eșantion de date cu caracteristicile (cunoscute sau presupuse) ale populației mai mari pe care eșantionul este destinat să îl reprezinte. Dacă datele eșantionului nu se potrivesc cu proprietățile așteptate ale populației care ne interesează, atunci nu am dori să folosim acest eșantion pentru a trage concluzii despre populația mai mare.

De exemplu, luați în considerare o monedă imaginară cu exact 50/50 șanse de a ateriza capete sau cozi și o monedă reală pe care o aruncați de 100 de ori. Dacă această monedă reală are o valoare corectă, atunci va avea, de asemenea, o probabilitate egală de a ateriza pe ambele părți, iar rezultatul așteptat al aruncării monedei de 100 de ori este că capetele vor crește de 50 de ori și cozile vor crește de 50 de ori. În acest caz, χ 2 ne poate spune cât de bine se compară rezultatele efective ale 100 de flipuri de monede cu modelul teoretic conform căruia o monedă echitabilă va da rezultate 50/50. Aruncarea efectivă ar putea apărea cu 50/50 sau 60/40 sau chiar 90/10. Cu cât rezultatele efective ale celor 100 de aruncări sunt mai îndepărtate de la 50/50, cu atât ajustarea acestui set de aruncări este mai puțin bună față de așteptările teoretice de 50/50 și cu atât mai probabil am putea concluziona că această monedă nu este de fapt o echitabilă monedă.