1 mai 2021 15:13

Crearea unui model de regresie liniară în Excel

Ce este regresia liniară?

Regresia liniară este un grafic de date care prezintă grafic relația liniară  dintre o variabilă independentă și una dependentă. Se folosește de obicei pentru a arăta vizual puterea relației și dispersia rezultatelor – totul în scopul explicării comportamentului variabilei dependente.

Să presupunem că am vrut să testăm puterea relației dintre cantitatea de înghețată consumată și obezitate. Am lua variabila independentă, cantitatea de înghețată și o raportăm la variabila dependentă, obezitatea, pentru a vedea dacă a existat o relație. Având în vedere o regresie este o afișare grafică a acestei relații, cu cât variabilitatea datelor este mai mică, cu atât relația este mai puternică și cu atât mai strânsă se potrivește cu linia de regresie.   

Chei de luat masa

  • Regresia liniară modelează relația dintre o variabilă (variabile) dependentă și independentă.
  • Analiza de regresie poate fi realizată dacă variabilele sunt independente, nu există heteroscedasticitate și termenii de eroare ai variabilelor nu sunt corelați.
  • Modelarea regresiei liniare în Excel este mai ușoară cu Instrumentul de analiză a datelor.

Considerații importante

Există câteva ipoteze critice despre setul de date care trebuie să fie adevărate pentru a continua cu o analiză de regresie :

  1. Variabilele trebuie să fie cu adevărat independente (folosind un test Chi-pătrat ).
  2. Datele nu trebuie să aibă varianțe de eroare diferite (aceasta se numește heteroskedasticitate (de asemenea, heteroscedasticitate scrisă)).
  3. Termenii de eroare ai fiecărei variabile trebuie să fie necorelați. Dacă nu, înseamnă că variabilele sunt  corelate în serie.

Dacă aceste trei lucruri par complicate, sunt. Dar efectul uneia dintre aceste considerații care nu este adevărat este o estimare părtinitoare. În esență, ați declara greșit relația pe care o măsurați.

Afișarea unei regresii în Excel

Primul pas în rularea analizei de regresie în Excel este să verificați de două ori dacă este instalat pluginul Excel gratuit Data Analysis ToolPak. Acest plugin face calcularea unei game de statistici foarte ușoară. Este Nu  este necesar să traseze o linie de regresie liniară, dar face crearea tabelelor cu statistici mai simple. Pentru a verifica dacă este instalat, selectați „Date” din bara de instrumente. Dacă „Analiza datelor” este o opțiune, funcția este instalată și gata de utilizare. Dacă nu este instalat, puteți solicita această opțiune făcând clic pe butonul Office și selectând „Opțiuni Excel”.

Folosind Instrumentul de analiză a datelor, crearea unei ieșiri de regresie este doar câteva clicuri.



Variabila independentă se încadrează în intervalul X.

Având în vedere randamentele S&P 500 , spuneți că vrem să știm dacă putem estima puterea și relația randamentelor acțiunilor Visa (

  1. Selectați „Date” din bara de instrumente. Se afișează meniul „Date”.
  2. Selectați „Analiza datelor”. Se afișează caseta de dialog Analiză date – Instrumente de analiză.
  3. Din meniu, selectați „Regresie” și faceți clic pe „OK”.
  4. În caseta de dialog Regresie, faceți clic pe caseta „Intrare Y Range” și selectați datele variabile dependente (Visa (V) returnează stocul).
  5. Faceți clic pe caseta „Intrare X Range” și selectați datele variabile independente (returnează S&P 500).
  6. Faceți clic pe „OK” pentru a rula rezultatele.

[Notă: dacă tabelul pare mic, faceți clic dreapta pe imagine și deschideți-o într-o filă nouă pentru o rezoluție mai mare.]

Interpretează rezultatele

Folosind aceste date (aceleași din articolul nostru cu pătratul R ), obținem următorul tabel:

Valoarea R 2, cunoscută și sub numele de coeficient de determinare, măsoară proporția variației în variabila dependentă explicată de variabila independentă sau cât de bine se potrivește modelul de regresie cu datele. Valoarea R 2 variază de la 0 la 1, iar o valoare mai mare indică o potrivire mai bună. Valoarea p sau valoarea probabilității variază de asemenea de la 0 la 1 și indică dacă testul este semnificativ. In contrast cu R 2 valoare, o valoare p mai mică este favorabilă deoarece indică o corelație între variabilele dependente și independente.

Graficarea unei regresii în Excel

Putem grafica o regresie în Excel evidențiind datele și graficându-le ca grafic scatter. Pentru a adăuga o linie de regresie, alegeți „Aspect” din meniul „Instrumente pentru diagrame”. În caseta de dialog, selectați „Trendline”, apoi „Linie de trend liniară”. Pentru a adăuga valoarea R 2, selectați „Mai multe opțiuni Trendline” din „Meniul Trendline. În cele din urmă, selectați„ Afișați valoarea pătrată R pe grafic ”. Rezultatul vizual rezumă forța relației, deși în detrimentul neprezentării la fel de multe detalii ca tabelul de mai sus.