Analiza varianței (ANOVA) - KamilTaylan.blog
1 mai 2021 8:35

Analiza varianței (ANOVA)

Ce este Analiza Varianței (ANOVA)?

Analiza varianței (ANOVA) este un instrument de analiză utilizat în statistici care împarte o variabilitate agregată observată găsită în interiorul unui set de date în două părți: factori sistematici și factori aleatori. Factorii sistematici au o influență statistică asupra setului de date date, în timp ce factorii aleatori nu. Analiștii folosesc testul ANOVA pentru a determina influența pe care o au variabilele independente asupra variabilei dependente într-un studiu de regresie.

Metodele de testare t și z dezvoltate în secolul al XX-lea au fost utilizate pentru analize statistice până în 1918, când Ronald Fisher a creat metoda analizei varianței.1  ANOVA se mai numește și analiza Fisher a varianței și este extensia testelor t- și z. Termenul a devenit cunoscut în 1925, după ce a apărut în cartea lui Fisher, „Metode statistice pentru cercetătorii”.  A fost folosit în psihologia experimentală și ulterior sa extins la subiecte care erau mai complexe.

Formula pentru ANOVA este:

Ce relevă analiza varianței?

Testul ANOVA este pasul inițial în analizarea factorilor care afectează un set de date dat. Odată terminat testul, un analist efectuează teste suplimentare asupra factorilor metodici care contribuie măsurabil la inconsecvența setului de date. Analistul utilizează rezultatele testului ANOVA într-un test f pentru a genera date suplimentare care se aliniază cu modelele de regresie propuse.

Testul ANOVA permite o comparație a mai mult de două grupuri în același timp pentru a determina dacă există o relație între ele. Rezultatul formulei ANOVA, statistica F (numită și raportul F), permite analiza mai multor grupuri de date pentru a determina variabilitatea între eșantioane și în cadrul eșantioanelor.

Dacă nu există o diferență reală între grupurile testate, care se numește ipoteza nulă, rezultatul statisticii raportului F al ANOVA va fi aproape de 1. Distribuția tuturor valorilor posibile ale statisticii F este distribuția F. Acesta este de fapt un grup de funcții de distribuție, cu două numere caracteristice, numite gradele de libertate ale numărătorului și gradele de libertate ale numitorului.

Chei de luat masa

  • Analiza varianței sau ANOVA este o metodă statistică care separă datele de varianță observate în diferite componente pentru a fi utilizate pentru teste suplimentare.
  • Un ANOVA unidirecțional este utilizat pentru trei sau mai multe grupuri de date, pentru a obține informații despre relația dintre variabilele dependente și independente.
  • Dacă nu există o varianță adevărată între grupuri, raportul F al ANOVA ar trebui să fie aproape de 1.

Exemplu de utilizare a ANOVA

Un cercetător ar putea, de exemplu, să testeze studenții din mai multe colegii pentru a vedea dacă studenții din unul dintre colegii depășesc în mod constant elevii din celelalte colegii. Într-o aplicație de afaceri, un cercetător în cercetare și dezvoltare ar putea testa două procese diferite de creare a unui produs pentru a vedea dacă un proces este mai bun decât celălalt în ceea ce privește eficiența costurilor.

Tipul testului ANOVA utilizat depinde de o serie de factori. Se aplică atunci când datele trebuie să fie experimentale. Analiza varianței este utilizată dacă nu există acces la software-ul statistic, rezultând calcularea manuală a ANOVA. Este simplu de utilizat și este cel mai potrivit pentru eșantioane mici. Cu multe modele experimentale, dimensiunile eșantionului trebuie să fie aceleași pentru diferitele combinații de nivel de factor.

ANOVA este util pentru testarea a trei sau mai multe variabile. Este similar cu mai multe teste t cu două eșantioane. Cu toate acestea, rezultă mai puține erori de tip I și este adecvat pentru o serie de probleme. ANOVA grupează diferențele prin compararea mijloacelor fiecărui grup și include răspândirea varianței în diverse surse. Este utilizat cu subiecți, grupuri de testare, între grupuri și în cadrul grupurilor.

ANOVA unidirecțional versus ANOVA bidirecțional

Există două tipuri principale de ANOVA: unidirecțional (sau unidirecțional) și unidirecțional. Există, de asemenea, variații ale ANOVA. De exemplu, MANOVA (ANOVA multivariată) diferă de ANOVA ca primele teste pentru mai multe variabile dependente simultan, în timp ce acesta din urmă evaluează o singură variabilă dependentă la un moment dat. Unidirecțional sau bidirecțional se referă la numărul de variabile independente din testul de analiză a varianței. Un ANOVA unidirecțional evaluează impactul unui singur factor asupra unei singure variabile de răspuns. Determină dacă toate eșantioanele sunt la fel. ANOVA unidirecțional este utilizat pentru a determina dacă există diferențe semnificative statistic între mijloacele a trei sau mai multe grupuri independente (fără legătură).

Un ANOVA cu două căi este o extensie a ANOVA cu un singur sens. Cu un singur sens, aveți o variabilă independentă care afectează o variabilă dependentă. Cu un ANOVA cu două căi, există doi independenți. De exemplu, un ANOVA bidirecțional permite unei companii să compare productivitatea lucrătorilor pe baza a două variabile independente, cum ar fi salariul și setul de competențe. Este utilizat pentru a observa interacțiunea dintre cei doi factori și pentru a testa efectul a doi factori în același timp.