2 mai 2021 0:14

Factorul de inflație a variației (VIF)

Ce este un factor de inflație a variației (VIF)?

Factorul de inflație a variației (VIF) este o măsură a cantității de  multicoliniaritate  într-un set de  variabile de regresie multiple . Din punct de vedere matematic, VIF pentru o variabilă de model de regresie este egal cu raportul dintre varianța generală a modelului   și varianța unui model care include doar acea variabilă independentă unică. Acest raport este calculat pentru fiecare variabilă independentă. Un VIF ridicat indică faptul că variabila independentă asociată este foarte coliniară cu celelalte variabile din model.

Chei de luat masa

  • Un factor de variație a inflației (VIF) oferă o măsură a multicoliniarității între variabilele independente într-un model de regresie multiplă.
  • Detectarea multicoliniarității este importantă deoarece, în timp ce multicoliniaritatea nu reduce puterea explicativă a modelului, reduce semnificativitatea statistică a variabilelor independente. 
  • Un factor de inflație de variație mare (VIF) pe o variabilă independentă indică o relație foarte coliniară cu celelalte variabile care ar trebui luate în considerare sau ajustate în structura modelului și selectarea variabilelor independente.

Înțelegerea unui factor de inflație a variației (VIF)

Un factor de inflație a varianței este un instrument care ajută la identificarea gradului de multicoliniaritate. O regresie multiplă este utilizată atunci când o persoană dorește să testeze efectul mai multor variabile asupra unui anumit rezultat. Variabila dependentă este rezultatul pe care îl acționează variabilele independente – intrările în model. Multicoliniaritatea există atunci când există o relație liniară sau o corelație între una sau mai multe dintre variabilele sau intrările independente.

Multicoliniaritatea creează o problemă în regresia multiplă, deoarece intrările se influențează reciproc. Prin urmare, ele nu sunt de fapt independente și este dificil să se testeze cât de mult afectează combinația variabilelor independente variabila dependentă sau rezultatul, în cadrul modelului de regresie. În termeni statistici, un model de regresie multiplă în care există multicolinearitate ridicată va face mai dificilă estimarea relației dintre fiecare dintre variabilele independente și variabila dependentă. Modificări mici în datele utilizate sau în structura ecuației modelului pot produce modificări mari și neregulate în coeficienții estimate pe variabilele independente.

Pentru a vă asigura că modelul este specificat corect și funcționează corect, există teste care pot fi executate pentru multicoliniaritate. Factorul de inflație a variației este un astfel de instrument de măsurare. Utilizarea factorilor de inflație a varianței ajută la identificarea gravității oricăror probleme de multicoliniaritate, astfel încât modelul să poată fi ajustat. Factorul de inflație a variației măsoară cât de mult este influențat sau umflat comportamentul (varianța) unei variabile independente de interacțiunea / corelația sa cu celelalte variabile independente. Factorii de inflație de variație permit o măsură rapidă a cantității care contribuie la o variabilă la eroarea standard în regresie. Atunci când există probleme semnificative de multicoliniaritate, factorul de inflație a varianței va fi foarte mare pentru variabilele implicate. După identificarea acestor variabile, pot fi utilizate mai multe abordări pentru a elimina sau combina variabilele coliniare, rezolvând problema multicoliniarității.

consideratii speciale

Multicoliniaritate

În timp ce multicoliniaritatea nu reduce puterea predictivă generală a unui model, poate produce estimări ale coeficienților de regresie care nu sunt semnificative statistic. Într-un anumit sens, poate fi gândit ca un fel de contorizare dublă în model. Când două sau mai multe variabile independente sunt strâns legate sau măsoară aproape același lucru, atunci efectul de bază pe care îl măsoară este contabilizat de două ori (sau mai multe) între variabile. Devine dificil sau imposibil de spus care variabilă influențează cu adevărat variabila independentă. Aceasta este o problemă, deoarece scopul multor modele econometrice este de a testa exact acest tip de relație statistică între variabilele independente și variabila dependentă.

De exemplu, să presupunem că un economist vrea să testeze dacă există o relație semnificativă statistic între rata șomajului (variabilă independentă) și rata inflației (variabilă dependentă). Includerea unor variabile independente suplimentare care sunt legate de rata șomajului, astfel de noi cereri inițiale de șomaj, ar fi probabil de a introduce multicolinearitatea în model. Modelul general ar putea prezenta o putere explicativă puternică, statistic suficientă, dar nu va putea identifica dacă efectul se datorează în principal ratei șomajului sau noilor cereri inițiale de șomaj. Aceasta este ceea ce VIF ar detecta și ar sugera posibil să renunțe la una dintre variabile din model sau să găsească o modalitate de a le consolida pentru a capta efectul lor comun în funcție de ipoteza specifică pe care cercetătorul este interesat să o testeze.