T-Test - KamilTaylan.blog
1 mai 2021 22:41

T-Test

Ce este un test T?

Un test t este un tip de statistică inferențială utilizat pentru a determina dacă există o diferență semnificativă între mijloacele a două grupuri, care pot fi legate de anumite caracteristici. Se folosește mai ales atunci când seturile de date, cum ar fi setul de date înregistrat ca rezultat al răsturnării unei monede de 100 de ori, ar urma o distribuție normală și ar putea avea varianțe necunoscute. Un test t este utilizat ca instrument de testare a ipotezelor, care permite testarea unei ipoteze aplicabile unei populații. 

Un test t analizează statistica t, valorile distribuției t și gradele de libertate pentru a determina semnificația statistică. Pentru a efectua un test cu trei sau mai multe mijloace, trebuie să utilizați o  analiză a varianței.

Chei de luat masa

  • Un test t este un tip de statistică inferențială utilizat pentru a determina dacă există o diferență semnificativă între mijloacele a două grupuri, care pot fi legate de anumite caracteristici.
  • Testul t este unul dintre multele teste utilizate în scopul testării ipotezelor în statistici.
  • Calculul unui test t necesită trei valori cheie ale datelor. Acestea includ diferența dintre valorile medii din fiecare set de date (numită diferența medie), abaterea standard a fiecărui grup și numărul de valori ale datelor din fiecare grup.
  • Există mai multe tipuri diferite de teste t care pot fi efectuate în funcție de datele și tipul de analiză necesară.

Explicarea testului T.

În esență, un test t ne permite să comparăm valorile medii ale celor două seturi de date și să determinăm dacă acestea provin din aceeași populație. În exemplele de mai sus, dacă ar fi să luăm un eșantion de elevi din clasa A și un alt eșantion de elevi din clasa B, nu ne-am aștepta ca aceștia să aibă exact aceeași medie și abatere standard. În mod similar, probele prelevate din grupul de control alimentat cu placebo și cele prelevate din grupul prescris pentru medicamente ar trebui să aibă o medie și o abatere standard ușor diferite.

Matematic, testul t ia un eșantion din fiecare dintre cele două seturi și stabilește enunțul problemei prin presupunerea unei ipoteze nule că cele două medii sunt egale. Pe baza formulelor aplicabile, anumite valori sunt calculate și comparate cu valorile standard, iar ipoteza nulă presupusă este acceptată sau respinsă în consecință.

Dacă ipoteza nulă se califică pentru a fi respinsă, indică faptul că citirile datelor sunt puternice și probabil că nu se datorează întâmplării. Testul t este doar unul dintre multele teste utilizate în acest scop. Statisticienii trebuie să utilizeze suplimentar alte teste decât testul t pentru a examina mai multe variabile și teste cu dimensiuni mai mari ale eșantionului. Pentru un eșantion mare, statisticienii folosesc un  test z. Alte opțiuni de testare includ testul chi-pătrat și testul f.

Există trei tipuri de teste t și sunt clasificate ca teste dependente și independente.

Rezultate de testare ambigue

Luați în considerare faptul că un producător de medicamente dorește să testeze un medicament nou inventat. Urmează procedura standard de încercare a medicamentului pe un grup de pacienți și administrarea unui placebo unui alt grup, numit grupul de control. Placebo dat grupului de control este o substanță fără valoare terapeutică intenționată și servește drept punct de reper pentru a măsura modul în care celălalt grup, căruia i se administrează medicamentul efectiv, răspunde.

După studiul cu droguri, membrii grupului de control alimentat cu placebo au raportat o creștere a speranței de viață medii de trei ani, în timp ce membrii grupului cărora li se prescrie noul medicament raportează o creștere a speranței de viață medii de patru ani. Observarea instantanee poate indica faptul că medicamentul funcționează într-adevăr, deoarece rezultatele sunt mai bune pentru grupul care utilizează medicamentul. Cu toate acestea, este, de asemenea, posibil ca observația să se datoreze unei întâmplări întâmplătoare, în special o surpriză surprinzătoare. Un test t este util pentru a concluziona dacă rezultatele sunt de fapt corecte și aplicabile întregii populații.

Într-o școală, 100 de elevi din clasa A au obținut în medie 85%, cu o abatere standard de 3%. Alți 100 de elevi aparținând clasei B au obținut în medie 87% cu o abatere standard de 4%. În timp ce media clasei B este mai bună decât cea a clasei A, este posibil să nu fie corect să ajungem la concluzia că performanța generală a elevilor din clasa B este mai bună decât cea a elevilor din clasa A. Acest lucru se datorează faptului că există variabilitate naturală în scorurile testelor la ambele clase, astfel încât diferența ar putea fi cauzată doar de șansă. Un test t poate ajuta la determinarea faptului dacă o clasă s-a descurcat mai bine decât cealaltă.

Ipoteze T-Test

  1. Prima ipoteză făcută cu privire la testele t se referă la scara măsurării. Presupunerea pentru un test t este că scala de măsurare aplicată datelor colectate urmează o scală continuă sau ordinală, cum ar fi scorurile pentru un test IQ.
  2. A doua ipoteză făcută este aceea a unui eșantion simplu aleatoriu, că datele sunt colectate dintr-o porțiune reprezentativă, selectată aleatoriu din populația totală.
  3. A treia presupunere este că datele, atunci când sunt reprezentate grafic, au ca rezultat o distribuție normală, curbă de distribuție în formă de clopot.
  4. Ipoteza finală este omogenitatea varianței. Varianța omogenă sau egală există atunci când abaterile standard ale eșantioanelor sunt aproximativ egale.

Calculul T-Tests

Calculul unui test t necesită trei valori cheie ale datelor. Acestea includ diferența dintre valorile medii din fiecare set de date (numită diferența medie), abaterea standard a fiecărui grup și numărul de valori ale datelor din fiecare grup.

Rezultatul testului t produce valoarea t. Această valoare t calculată este apoi comparată cu o valoare obținută dintr-un tabel de valori critice (numit Tabelul de distribuție T ). Această comparație ajută la determinarea efectului singur al întâmplării asupra diferenței și dacă diferența se află în afara intervalului respectiv. Testul t pune întrebări dacă diferența dintre grupuri reprezintă o diferență reală în studiu sau dacă este posibil o diferență aleatorie fără sens.

Tabelele de distribuție

T-Distribution Table este disponibil în formate cu o coadă și cu două cozi. Primul este utilizat pentru evaluarea cazurilor care au o valoare sau un interval fix cu o direcție clară (pozitivă sau negativă). De exemplu, care este probabilitatea ca valoarea de ieșire să rămână sub -3 sau să obțină mai mult de șapte când se aruncă o pereche de zaruri? Acesta din urmă este utilizat pentru analiza legată de interval, cum ar fi întrebarea dacă coordonatele se situează între -2 și +2.

Calculele pot fi efectuate cu programe software standard care acceptă funcțiile statistice necesare, precum cele găsite în MS Excel.

Valori T și grade de libertate

Testul t produce două valori ca ieșire: valoarea t și gradele de libertate. Valoarea t este un raport dintre diferența dintre media celor două seturi de eșantioane și variația care există în cadrul seturilor de eșantioane. În timp ce valoarea numărătorului (diferența dintre media celor două seturi de eșantioane) este simplă de calculat, numitorul (variația care există în seturile de eșantioane) poate deveni puțin complicat în funcție de tipul valorilor de date implicate. Numitorul raportului este o măsurare a dispersiei sau variabilității. Valori mai mari ale valorii t, numite și scor t, indică faptul că există o diferență mare între cele două seturi de eșantioane. Cu cât valoarea t este mai mică, cu atât există mai multe asemănări între cele două seturi de eșantioane.

  • Un scor t mare indică faptul că grupurile sunt diferite.
  • Un mic scor t indică faptul că grupurile sunt similare.

Gradele de libertate se referă la valorile dintr-un studiu care are libertatea de a varia și sunt esențiale pentru evaluarea importanței și validității ipotezei nule. Calculul acestor valori depinde de obicei de numărul de înregistrări de date disponibile în setul de eșantioane.

Test T corelat (sau asociat)

Testul t corelat se efectuează atunci când probele constau în mod obișnuit din perechi potrivite de unități similare sau când există cazuri de măsuri repetate. De exemplu, pot exista cazuri în care aceiași pacienți sunt testați în mod repetat – înainte și după ce au primit un anumit tratament. În astfel de cazuri, fiecare pacient este utilizat ca probă de control împotriva sa.

Această metodă se aplică și cazurilor în care eșantioanele sunt legate într-un fel sau au caracteristici potrivite, cum ar fi o analiză comparativă care implică copii, părinți sau frați. Testele t corelate sau asociate sunt de tip dependent, deoarece acestea implică cazuri în care cele două seturi de probe sunt legate.

Formula pentru calcularea valorii t și a gradelor de libertate pentru un test t asociat este:

Celelalte două tipuri aparțin testelor t independente. Eșantioanele acestor tipuri sunt selectate independent unul de celălalt – adică seturile de date din cele două grupuri nu se referă la aceleași valori. Acestea includ cazuri precum un grup de 100 de pacienți care sunt împărțiți în două seturi de câte 50 de pacienți. Unul dintre grupuri devine grupul de control și i se administrează un placebo, în timp ce celălalt grup primește tratamentul prescris. Aceasta constituie două grupuri eșantion independente care nu sunt împerecheate între ele.

Varianță egală (sau grupată) T-Test

Testul t pentru varianță egală este utilizat atunci când numărul eșantioanelor din fiecare grup este același sau dacă varianța celor două seturi de date este similară. Următoarea formulă este utilizată pentru calcularea valorii t și a gradelor de libertate pentru testul t de varianță egală:

T-value=meAn1-meAn2(n1-1)