Suma reziduală de pătrate (RSS)
Ce este suma reziduală de pătrate (RSS)?
O sumă reziduală de pătrate (RSS) este o tehnică statistică utilizată pentru a măsura cantitatea de varianță într-un set de date care nu este explicat de un model de regresie în sine. În schimb, estimează varianța reziduurilor sau termenul de eroare.
Regresia liniară este o măsurare care ajută la determinarea puterii relației dintre o variabilă dependentă și unul sau mai mulți alți factori, cunoscuți ca variabile independente sau explicative.
Chei de luat masa
- O sumă reziduală de pătrate (RSS) măsoară nivelul de varianță în termenul de eroare sau reziduuri ale unui model de regresie.
- În mod ideal, suma reziduurilor pătrate ar trebui să fie o valoare mai mică sau mai mică decât suma pătratelor din intrările modelului de regresie.
- RSS este utilizat de analiștii financiari în estimarea validității modelelor lor econometrice.
Formula pentru RSS este
ESS =
∑
n
i = 1 (
y i –
f (
x i ))
2
Unde:
- y i = a i- a valoare a variabilei care urmează să fie prezisă
- f (x i ) = valoarea prezisă a lui i i
- n = limita superioară a însumării
- y i = a i- a valoare a variabilei care urmează să fie prezisă
- f (x i ) = valoarea prezisă a lui i i
- n = limita superioară a însumării
Înțelegerea sumei reziduale de pătrate (RSS)
În termeni generali, suma pătratelor este o tehnică statistică utilizată în analiza de regresie pentru a determina dispersia punctelor de date. Într-o analiză de regresie, scopul este de a determina cât de bine o serie de date poate fi adaptată unei funcții care ar putea ajuta la explicarea modului în care a fost generată seria de date. Suma pătratelor este utilizată ca modalitate matematică de a găsi funcția care se potrivește cel mai bine (variază cel mai puțin) din date.
RSS măsoară cantitatea de eroare rămasă între funcția de regresie și setul de date după ce modelul a fost rulat. O sumă reziduală mai mică de pătrate reprezintă o funcție de regresie.
RSS – cunoscut și ca suma reziduurilor pătrate – determină în esență cât de bine explică sau reprezintă datele din model un model de regresie.
RSS vs. RSE
Eroare standard reziduală * RSE) este un alt termen statistic utilizat pentru a descrie diferența în abaterile standard ale valorilor observate față de valorile prezise, așa cum se arată în puncte într-o bună calitate, care poate fi utilizată pentru a analiza cât de bine se potrivește un set de puncte de date cu modelul real.
RSE se calculează împărțind RSS la numărul de observații din eșantion mai puțin 2 și apoi luând rădăcina pătrată: RSE = [RSS / (n-2)] 1/2
RSS, finanțe și econometrie
Piețele financiare au devenit din ce în ce mai orientate cantitativ; ca atare, în căutarea unui avantaj, mulți investitori folosesc tehnici statistice avansate pentru a ajuta la luarea deciziilor. Datele mari, învățarea automată și aplicațiile de inteligență artificială necesită în continuare utilizarea proprietăților statistice pentru a ghida strategiile de investiții contemporane. Suma reziduală de pătrate – sau statistici RSS – este una dintre numeroasele proprietăți statistice care se bucură de o renaștere.
Modelele statistice sunt utilizate de investitori și de administratorii de portofoliu pentru a urmări prețul unei investiții și pentru a utiliza aceste date pentru a prezice mișcările viitoare. Studiul – numit analiza de regresie – ar putea implica analiza relației în mișcările prețurilor dintre o marfă și stocurile companiilor angajate în producerea mărfii.
Orice model ar putea avea variații între valorile prezise și rezultatele reale. Deși varianțele ar putea fi explicate prin analiza de regresie, suma reziduală a pătratelor reprezintă varianțele sau erorile care nu sunt explicate.
Deoarece o funcție de regresie suficient de complexă poate fi făcută pentru a se potrivi cu aproape orice set de date, este necesar un studiu suplimentar pentru a determina dacă funcția de regresie este, de fapt, utilă în explicarea varianței setului de date. De obicei, totuși, o valoare mai mică sau mai mică pentru suma reziduală de pătrate este ideală în orice model, deoarece înseamnă că există mai puține variații în setul de date. Cu alte cuvinte, cu cât suma reziduurilor pătrate este mai mică, cu atât modelul de regresie este mai bun la explicarea datelor.