Regresie liniară multiplă (MLR)
Ce este regresia liniară multiplă (MLR)?
Regresia liniară multiplă (MLR), cunoscută și sub numele de regresie multiplă, este o tehnică statistică care utilizează mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns. Scopul regresiei liniare multiple (MLR) este de a modela relația liniară între variabilele explicative (independente) și variabila de răspuns (dependentă).
În esență, regresie multiplă este extinderea celor mai mici pătrate (OLS) de regresie, deoarece implică mai mult de o variabilă explicativă.
Chei de luat masa
- Regresia liniară multiplă (MLR), cunoscută și sub numele de regresie multiplă, este o tehnică statistică care utilizează mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns.
- Regresia multiplă este o extensie a regresiei liniare (OLS) care utilizează o singură variabilă explicativă.
- MLR este utilizat pe scară largă în econometrie și inferență financiară.
Formula și calcularea regresiei liniare multiple
Ce vă poate spune regresia liniară multiplă
Regresia liniară simplă este o funcție care permite unui analist sau statistician să facă predicții despre o variabilă pe baza informațiilor cunoscute despre o altă variabilă. Regresia liniară poate fi utilizată numai atunci când una are două variabile continue – o variabilă independentă și o variabilă dependentă. Variabila independentă este parametrul care este utilizat pentru a calcula variabila dependentă sau rezultatul. Un model de regresie multiplă se extinde la mai multe variabile explicative.
Modelul de regresie multiplă se bazează pe următoarele ipoteze:
- Există o relație liniară între variabilele dependente și variabilele independente
- Variabilele independente nu sunt prea strâns corelate între ele
- y i observațiile sunt selectate independent și aleatoriu din populație
- Reziduurile trebuie distribuite în mod normal cu o medie de 0 și varianța σ
Coeficientul de determinare (R-pătrat) este o valoare statistică, care este utilizat pentru a măsura cât de mult din variația rezultatelor poate fi explicată prin variația variabilelor independente. R 2 crește întotdeauna pe măsură ce se adaugă mai mulți predictori la modelul MLR, chiar dacă predictorii nu pot fi legați de variabila de rezultat.
R2 în sine nu poate fi astfel utilizat pentru a identifica ce predictori ar trebui incluși într-un model și care ar trebui excluși. R2 poate fi doar între 0 și 1, unde 0 indică faptul că rezultatul nu poate fi prezis de niciuna dintre variabilele independente și 1 indică faptul că rezultatul poate fi prezis fără erori din variabilele independente.
Când se interpretează rezultatele regresiei multiple, coeficienții beta sunt valabili în timp ce mențin constant toate celelalte variabile („toate celelalte egale”). Ieșirea dintr-o regresie multiplă poate fi afișată orizontal ca o ecuație sau vertical sub formă de tabel.
Exemplu de utilizare a regresiei liniare multiple
De exemplu, un analist poate dori să știe cum mișcarea pieței afectează prețul ExxonMobil (XOM). În acest caz, ecuația lor liniară va avea valoarea indicelui S&P 500 ca variabilă independentă sau predictor, iar prețul XOM ca variabilă dependentă.
În realitate, există mai mulți factori care prezic rezultatul unui eveniment. De exemplu, mișcarea prețurilor ExxonMobil depinde de mai mult decât de performanțele pieței generale. Alți factori predictivi, cum ar fi prețul petrolului, ratele dobânzii și mișcarea prețurilor la viitorul petrolului, pot afecta prețul XOM și prețurile acțiunilor altor companii petroliere. Pentru a înțelege o relație în care sunt prezente mai mult de două variabile, se utilizează regresia liniară multiplă.
Regresia liniară multiplă (MLR) este utilizată pentru a determina o relație matematică între un număr de variabile aleatorii.În alți termeni, MLR examinează modul în care mai multe variabile independente sunt legate de o variabilă dependentă. Odată ce fiecare dintre factorii independenți a fost determinat să prezică variabila dependentă, informațiile privind variabilele multiple pot fi utilizate pentru a crea o predicție exactă asupra nivelului de efect pe care îl au asupra variabilei de rezultat. Modelul creează o relație sub forma unei linii drepte (liniare) care aproxima cel mai bine toate punctele de date individuale.
Referindu-ne la ecuația MLR de mai sus, în exemplul nostru:
- y i = variabilă dependentă – prețul XOM
- x i1 = ratele dobânzii
- x i2 = prețul petrolului
- x i3 = valoarea indicelui S&P 500
- x i4 = prețul viitorului petrolului
- B 0 = interceptarea y la ora zero
- B 1 = coeficient de regresie care măsoară o modificare a unității în variabila dependentă când se modifică x i1 – modificarea prețului XOM atunci când se modifică ratele dobânzii
- B 2 = valoarea coeficientului care măsoară o modificare a unității în variabila dependentă când se modifică x i2 – modificarea prețului XOM atunci când se modifică prețurile petrolului