Regresie liniară multiplă (MLR) - KamilTaylan.blog
1 mai 2021 18:10

Regresie liniară multiplă (MLR)

Ce este regresia liniară multiplă (MLR)?

Regresia liniară multiplă (MLR), cunoscută și sub numele de regresie multiplă, este o tehnică statistică care utilizează mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns. Scopul regresiei liniare multiple (MLR) este de a modela relația liniară între variabilele explicative (independente) și variabila de răspuns (dependentă).

În esență, regresie multiplă este extinderea celor mai mici pătrate (OLS) de regresie, deoarece implică mai mult de o variabilă explicativă.

Chei de luat masa

  • Regresia liniară multiplă (MLR), cunoscută și sub numele de regresie multiplă, este o tehnică statistică care utilizează mai multe variabile explicative pentru a prezice rezultatul unei variabile de răspuns.
  • Regresia multiplă este o extensie a regresiei liniare (OLS) care utilizează o singură variabilă explicativă.
  • MLR este utilizat pe scară largă în econometrie și inferență financiară.

Formula și calcularea regresiei liniare multiple

Ce vă poate spune regresia liniară multiplă

Regresia liniară simplă este o funcție care permite unui analist sau statistician să facă predicții despre o variabilă pe baza informațiilor cunoscute despre o altă variabilă. Regresia liniară poate fi utilizată numai atunci când una are două variabile continue – o variabilă independentă și o variabilă dependentă. Variabila independentă este parametrul care este utilizat pentru a calcula variabila dependentă sau rezultatul. Un model de regresie multiplă se extinde la mai multe variabile explicative.

Modelul de regresie multiplă se bazează pe următoarele ipoteze:

  • Există o relație liniară între variabilele dependente și variabilele independente
  • Variabilele independente nu sunt prea strâns corelate între ele
  • y i observațiile sunt selectate independent și aleatoriu din populație
  • Reziduurile trebuie distribuite în mod normal cu o medie de 0 și varianța σ

Coeficientul de determinare (R-pătrat) este o valoare statistică, care este utilizat pentru a măsura cât de mult din variația rezultatelor poate fi explicată prin variația variabilelor independente. R 2 crește întotdeauna pe măsură ce se adaugă mai mulți predictori la modelul MLR, chiar dacă predictorii nu pot fi legați de variabila de rezultat.

R2 în sine nu poate fi astfel utilizat pentru a identifica ce predictori ar trebui incluși într-un model și care ar trebui excluși. R2 poate fi doar între 0 și 1, unde 0 indică faptul că rezultatul nu poate fi prezis de niciuna dintre variabilele independente și 1 indică faptul că rezultatul poate fi prezis fără erori din variabilele independente.

Când se interpretează rezultatele regresiei multiple, coeficienții beta sunt valabili în timp ce mențin constant toate celelalte variabile („toate celelalte egale”). Ieșirea dintr-o regresie multiplă poate fi afișată orizontal ca o ecuație sau vertical sub formă de tabel.

Exemplu de utilizare a regresiei liniare multiple

De exemplu, un analist poate dori să știe cum mișcarea pieței afectează prețul ExxonMobil (XOM). În acest caz, ecuația lor liniară va avea valoarea indicelui S&P 500 ca variabilă independentă sau predictor, iar prețul XOM ca variabilă dependentă.

În realitate, există mai mulți factori care prezic rezultatul unui eveniment. De exemplu, mișcarea prețurilor ExxonMobil depinde de mai mult decât de performanțele pieței generale. Alți factori predictivi, cum ar fi prețul petrolului, ratele dobânzii și mișcarea prețurilor la viitorul petrolului, pot afecta prețul XOM și prețurile acțiunilor altor companii petroliere. Pentru a înțelege o relație în care sunt prezente mai mult de două variabile, se utilizează regresia liniară multiplă.

Regresia liniară multiplă (MLR) este utilizată pentru a determina o relație matematică între un număr de variabile aleatorii.În alți termeni, MLR examinează modul în care mai multe variabile independente sunt legate de o variabilă dependentă. Odată ce fiecare dintre factorii independenți a fost determinat să prezică variabila dependentă, informațiile privind variabilele multiple pot fi utilizate pentru a crea o predicție exactă asupra nivelului de efect pe care îl au asupra variabilei de rezultat. Modelul creează o relație sub forma unei linii drepte (liniare) care aproxima cel mai bine toate punctele de date individuale.

Referindu-ne la ecuația MLR de mai sus, în exemplul nostru:

  • y i = variabilă dependentă – prețul XOM
  • x i1 = ratele dobânzii
  • x i2 = prețul petrolului
  • x i3 = valoarea indicelui S&P 500
  • x i4 = prețul viitorului petrolului
  • B 0 = interceptarea y la ora zero
  • B 1 = coeficient de regresie care măsoară o modificare a unității în variabila dependentă când se modifică x i1 – modificarea prețului XOM atunci când se modifică ratele dobânzii
  • B 2 = valoarea coeficientului care măsoară o modificare a unității în variabila dependentă când se modifică x i2 – modificarea prețului XOM atunci când se modifică prețurile petrolului

Estimările celor mai mici pătrate, B 0, B 1, B 2… B p, sunt de obicei calculate de software statistice. În modelul de regresie pot fi incluse cât mai multe variabile în care fiecare variabilă independentă este diferențiată cu un număr – 1,2, 3, 4… p. Modelul de regresie multiplă permite unui analist să prezică un rezultat pe baza informațiilor furnizate pe mai multe variabile explicative.

Totuși, modelul nu este întotdeauna perfect corect, deoarece fiecare punct de date poate diferi ușor de rezultatul prezis de model. Valoarea reziduală, E, care este diferența dintre rezultatul real și rezultatul prezis, este inclusă în model pentru a ține cont de astfel de ușoare variații.

Presupunând că rulăm modelul nostru de regresie a prețului XOM printr-un software de calcul statistic, care returnează această ieșire:

Un analist ar interpreta această ieșire în sensul că dacă alte variabile sunt menținute constante, prețul XOM va crește cu 7,8% dacă prețul petrolului pe piețe crește cu 1%. Modelul arată, de asemenea, că prețul XOM va scădea cu 1,5%, după o creștere a ratei dobânzii cu 1%. R 2 indică faptul că 86,5% din variațiile prețului acțiunilor Exxon Mobil pot fi explicate prin modificări ale ratei dobânzii, prețului petrolului, contractelor futures asupra petrolului și indicelui S&P 500.

Diferența dintre regresia liniară și cea multiplă

Regresia pătratelor liniare ordinare (OLS) compară răspunsul unei variabile dependente, având în vedere o modificare a unor variabile explicative. Cu toate acestea, este rar ca o variabilă dependentă să fie explicată de o singură variabilă. În acest caz, un analist folosește regresia multiplă, care încearcă să explice o variabilă dependentă folosind mai multe variabile independente. Regresiile multiple pot fi liniare și neliniare.

Regresiile multiple se bazează pe presupunerea că există o relație liniară între variabilele dependente și independente. De asemenea, nu presupune nicio corelație majoră între variabilele independente.

întrebări frecvente

Ce face ca o regresie multiplă să fie „multiplă”?

O regresie multiplă are în vedere efectul mai multor variabile explicative asupra anumitor rezultate ale interesului. Evaluează efectul relativ al acestor variabile explicative sau independente asupra variabilei dependente atunci când se mențin constante toate celelalte variabile din model.

De ce s-ar folosi o regresie multiplă peste o simplă regresie OLS?

Este rar ca o variabilă dependentă să fie explicată de o singură variabilă. În astfel de cazuri, un analist folosește regresia multiplă, care încearcă să explice o variabilă dependentă folosind mai multe variabile independente. Modelul presupune însă că nu există corelații majore între variabilele independente.

Pot face o regresie multiplă manual?

Probabil ca nu. Modelele de regresie multiplă sunt complexe și devin cu atât mai mari când există mai multe variabile incluse în model sau când cantitatea de date de analizat crește. Pentru a rula o regresie multiplă, va trebui probabil să utilizați programe statistice specializate sau funcții în cadrul programelor de afaceri precum Excel.

Ce înseamnă ca o regresie multiplă să fie „liniară”?

Într-o regresie liniară multiplă, modelul calculează linia de potrivire cea mai bună care minimizează variațiile fiecăreia dintre variabilele incluse în raport cu variabila dependentă. Deoarece se potrivește unei linii, este un model liniar. Există, de asemenea, modele de regresie neliniară care implică mai multe variabile, cum ar fi regresia logistică, regresia pătratică și modelele probit.

Cum se utilizează modele de regresie multiplă în finanțe?

Orice model econometric care privește mai multe variabile poate fi o regresie multiplă. Modelele factoriale, de exemplu, compară doi sau mai mulți factori pentru a analiza relațiile dintre variabile și performanța rezultată. Modul Fama și francez cu trei factori este un astfel de model care se extinde pe modelul de stabilire a prețurilor activelor de capital (CAPM) prin adăugarea factorilor de risc de mărime și de valoare la factorul de risc de piață din CAPM (care este el însuși un model de regresie). Prin includerea acestor doi factori suplimentari, modelul se ajustează pentru această tendință care depășește performanța, care este considerată a fi un instrument mai bun pentru evaluarea performanței managerilor.