1 mai 2021 22:34

Suma patratelor

Care este suma pătratelor?

Suma pătratelor este o tehnică statistică utilizată în analiza de regresie pentru a determina dispersia punctelor de date. Într-o analiză de regresie, scopul este de a determina cât de bine o serie de date poate fi adaptată unei funcții care ar putea ajuta la explicarea modului în care a fost generată seria de date. Suma de pătrate este utilizată ca modalitate matematică de a găsi funcția care se potrivește cel mai bine (variază cel mai puțin) din date.

Formula pentru suma de pătrate este

Suma de pătrate este, de asemenea, cunoscută sub numele de variație.

Ce îți spune Suma pătratelor?

Suma pătratelor este o măsură a abaterii de la medie. În statistici, media este media unui set de numere și este cea mai frecvent utilizată măsură a tendinței centrale. Media aritmetică este calculată simplu prin însumarea valorilor din setul de date și împărțirea la numărul de valori.

Să presupunem că prețurile de închidere ale Microsoft (MSFT) în ultimele cinci zile au fost de 74.01, 74.77, 73.94, 73.61 și 73.40 în dolari SUA. Suma prețurilor totale este de 369,73 USD, iar prețul mediu sau mediu al manualului ar fi astfel de 369,73 USD / 5 = 73,95 USD.

Dar cunoașterea medie a unui set de măsurători nu este întotdeauna suficientă. Uneori, este util să știm câtă variație există într-un set de măsurători. Cât de îndepărtate sunt valorile individuale de medie poate oferi o oarecare perspectivă asupra modului în care se potrivesc observațiile sau valorile cu modelul de regresie creat.

De exemplu, dacă un analist a dorit să știe dacă prețul acțiunilor MSFT se mișcă în tandem cu prețul Apple (AAPL), el poate enumera setul de observații pentru procesul ambelor acțiuni pentru o anumită perioadă, să zicem 1, 2, sau 10 ani și creați un model liniar cu fiecare dintre observațiile sau măsurătorile înregistrate. Dacă relația dintre ambele variabile (adică prețul AAPL și prețul MSFT) nu este o linie dreaptă, atunci există variații în setul de date care trebuie examinate.

În statistici, dacă linia din modelul liniar creat nu trece prin toate măsurătorile valorii, atunci o parte din variabilitatea care a fost observată la prețurile acțiunilor este inexplicabilă. Suma pătratelor este utilizată pentru a calcula dacă există o relație liniară între două variabile și orice variabilitate inexplicabilă este denumită suma reziduală a pătratelor.

Suma pătratelor este suma pătratului variației, unde variația este definită ca răspândirea dintre fiecare valoare individuală și medie. Pentru a determina suma pătratelor, distanța dintre fiecare punct de date și linia de potrivire cea mai bună este pătrată și apoi însumată. Linia de potrivire cea mai bună va minimiza această valoare.

Cum se calculează suma pătratelor

Acum puteți vedea de ce măsurarea se numește suma deviațiilor pătrate sau suma pătratelor pe scurt. Folosind exemplul MSFT de mai sus, suma pătratelor poate fi calculată ca:

  • SS = (74,01 – 73,95) 2 + (74,77 – 73,95) 2 + (73,94 – 73,95) 2 + (73,61 – 73,95) 2 + (73,40 – 73,95) 2
  • SS = (0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS = 1,0942

Adăugarea sumei abaterilor singure fără pătrat va duce la un număr egal sau aproape de zero, deoarece abaterile negative vor compensa aproape perfect abaterile pozitive. Pentru a obține un număr mai realist, suma deviațiilor trebuie să fie pătrată. Suma pătratelor va fi întotdeauna un număr pozitiv, deoarece pătratul oricărui număr, fie că este pozitiv sau negativ, este întotdeauna pozitiv.

Exemplu de utilizare a sumei pătratelor

Pe baza rezultatelor calculului MSFT, o sumă mare de pătrate indică faptul că majoritatea valorilor sunt mai departe de medie și, prin urmare, există o mare variabilitate în date. O sumă mică de pătrate se referă la o variabilitate redusă în setul de observații.

În exemplul de mai sus, 1.0942 arată că variabilitatea prețului acțiunilor MSFT în ultimele cinci zile este foarte scăzută și investitorii care doresc să investească în acțiuni caracterizate de stabilitate a prețurilor și volatilitate scăzută pot opta pentru MSFT.

Chei de luat masa

  • Suma pătratelor măsoară abaterea punctelor de date de la valoarea medie.
  • Un rezultat mai mare al sumei de pătrate indică un grad mare de variabilitate în cadrul setului de date, în timp ce un rezultat mai mic indică faptul că datele nu variază considerabil față de valoarea medie.

Limitări de utilizare a sumei de pătrate

Luarea unei decizii de investiție cu privire la ce stoc să cumpere necesită mult mai multe observații decât cele enumerate aici. Un analist poate fi nevoit să lucreze cu ani de date pentru a ști cu o certitudine mai mare cât de mare sau mică este variabilitatea unui activ. Pe măsură ce se adaugă mai multe puncte de date la set, suma pătratelor devine mai mare pe măsură ce valorile vor fi mai răspândite.

Cele mai utilizate măsurători ale variației sunt abaterea standard și varianța. Cu toate acestea, pentru a calcula oricare dintre cele două valori, mai întâi trebuie calculată suma pătratelor. Varianța este media sumei pătratelor (adică suma pătratelor împărțită la numărul de observații). Abaterea standard este rădăcina pătrată a varianței.

Există două metode de analiză a regresiei care utilizează suma pătratelor: metoda celor mai mici pătrate liniare și metoda celor mai puțin pătrate neliniare. Metoda celor mai mici pătrate se referă la faptul că funcția de regresie minimizează suma pătratelor varianței din punctele de date efective. În acest fel, este posibil să desenați o funcție care oferă statistic cea mai bună potrivire pentru date. Rețineți că o funcție de regresie poate fi fie liniară (o linie dreaptă), fie neliniară (o linie curbată).