1 mai 2021 12:48

Definiția statistică a lui Durbin Watson

Ce este statistica Durbin Watson?

Statistica Durbin Watson (DW) este un test pentru autocorelație în reziduuri dintr-o analiză de regresie statistică. Statistica Durbin-Watson va avea întotdeauna o valoare cuprinsă între 0 și 4. O valoare 2.0 înseamnă că nu este detectată nicio autocorelație în eșantion. Valorile de la 0 la mai puțin de 2 indică autocorelația pozitivă și valorile de la 2 la 4 indică autocorelația negativă.

Un preț al acțiunilor care afișează o corelare automată pozitivă ar indica faptul că prețul de ieri are o corelație pozitivă față de prețul de astăzi – deci dacă stocul a scăzut ieri, este, de asemenea, probabil ca acesta să scadă astăzi. O garanție care are o autocorelație negativă, pe de altă parte, are o influență negativă asupra sa în timp – astfel încât, dacă a căzut ieri, există o probabilitate mai mare să crească astăzi.

Chei de luat masa

  • Statistica Durbin Watson este un test pentru autocorelare într-un set de date.
  • Statistica DW are întotdeauna o valoare între zero și 4,0.
  • O valoare de 2,0 înseamnă că nu este detectată nicio autocorelație în eșantion. Valorile de la zero la 2,0 indică autocorelația pozitivă și valorile de la 2,0 la 4,0 indică autocorelația negativă.
  • Autocorelarea poate fi utilă în analiza tehnică, care se preocupă cel mai mult de tendințele prețurilor de securitate folosind tehnici de graficare în locul sănătății sau managementului financiar al unei companii.

Bazele statisticii Durbin Watson

Autocorelația, cunoscută și sub numele de corelație serială, poate fi o problemă semnificativă în analiza datelor istorice, dacă nu se știe să fie atent. De exemplu, întrucât prețurile acțiunilor tind să nu se schimbe prea radical de la o zi la alta, prețurile de la o zi la alta ar putea fi puternic corelate, chiar dacă există puține informații utile în această observație. Pentru a evita problemele de autocorelare, cea mai ușoară soluție în finanțe este de a converti pur și simplu o serie de prețuri istorice într-o serie de modificări procentuale ale prețurilor de la o zi la alta.

Autocorelarea poate fi utilă pentru  analiza tehnică, care se preocupă cel mai mult de tendințele și relațiile dintre prețurile de securitate utilizând tehnici de graficare în locul sănătății sau managementului financiar al unei companii. Analiștii tehnici pot utiliza corelarea automată pentru a vedea cât de mult au un impact asupra prețurilor viitoare ale unui titlu.



Statistica Durbin Watson este numită după statisticienii James Durbin și Geoffrey Watson.

Autocorelația poate arăta dacă există un factor de impuls asociat cu un stoc. De exemplu, dacă știți că un stoc are o valoare de autocorelare pozitivă ridicată și ați asistat la obținerea unor câștiguri solide în ultimele zile, atunci s-ar putea să vă așteptați în mod rezonabil ca mișcările din următoarele câteva zile (prima serie de timp) să se potrivească cele din seria cronologică întârziată și să se deplaseze în sus.

Exemplu de statistică Durbin Watson

Formula pentru statistica Durbin Watson este destul de complexă, dar implică reziduurile dintr-o regresie obișnuită a celor mai mici pătrate pe un set de date. Următorul exemplu ilustrează modul de calcul al acestei statistici.

Să presupunem următoarele (x, y) puncte de date:

Folosind metodele de regresie a celor mai mici pătrate pentru a găsi „ linia cea mai potrivită ”, ecuația pentru cea mai bună linie de potrivire a acestor date este:

Da=-2.6268X+1,129.2Y = { – 2.6268} x + {1.129,2}Da=-2.6268 x+1,129.2

Acest prim pas în calcularea statisticii Durbin Watson este de a calcula valorile „y” așteptate folosind linia ecuației celei mai potrivite. Pentru acest set de date, valorile „y” așteptate sunt:

Next, the differences of the actual „y” values versus the expected „y” values, the errors, are calculated:

Error(1)=(1,100−1,102.9)=−2.9Error(2)=(1,200−1,076.7)=123.3Error(3)=(985−1,037.3)=−52.3Error(4)=(750−1,024.1)=−274.1Error(5)=(1,215−997.9)=217.1Error(6)=(1,000−1,011)=−11\begin{aligned} &\text{Error}\left({1}\right)=\left( {1,100}-{1,102.9} \right )={ -2.9}\\ &\text{Error}\left({2}\right)=\left( {1,200}-{1,076.7} \right )={123.3}\\ &\text{Error}\left({3}\right)=\left( {985}-{1,037.3} \right )={ -52.3}\\ &\text{Error}\left({4}\right)=\left( {750}-{1,024.1} \right )={ -274.1}\\ &\text{Error}\left({5}\right)=\left( {1,215}-{997.9} \right )={217.1}\\ &\text{Error}\left({6}\right)=\left( {1,000}-{1,011} \right )={ -11}\\ \end{aligned}​Error(1)=(1,100−1,102.9)=−2.9Error(2)=(1,200−1,076.7)=123.3Error(3)=(985−1,037.3)=−52.3Error(4)=(750−1,024.1)=−274.1Error(5)=(1,215−997.9)=217.1Error(6)=(1,000−1,011)=−11​

Next these errors must be squared and summed:

Next, the value of the error minus the previous error are calculated and squared:

Difference(1)=(123.3−(−2.9))=126.2Difference(2)=(−52.3−123.3)=−175.6Difference(3)=(−274.1−(−52.3))=−221.9Difference(4)=(217.1−(−274.1))=491.3Difference(5)=(−11−217.1)=−228.1Sum of Differences Square=389,406.71\begin{aligned} &\text{Difference}\left({1}\right)=\left( {123.3}-\left({ -2.9}\right) \right )={126.2}\\ &\text{Difference}\left({2}\right)=\left( { -52.3}-{123.3} \right )={ -175.6}\\ &\text{Difference}\left({3}\right)=\left( { -274.1}-\left({ -52.3}\right) \right )={ -221.9}\\ &\text{Difference}\left({4}\right)=\left( {217.1}-\left({ -274.1}\right) \right )={491.3}\\ &\text{Difference}\left({5}\right)=\left( { -11}-{217.1} \right )={ -228.1}\\ &\text{Sum of Differences Square}={389,406.71}\\ \end{aligned}​Difference(1)=(123.3−(−2.9))=126.2Difference(2)=(−52.3−123.3)=−175.6Difference(3)=(−274.1−(−52.3))=−221.9Difference(4)=(217.1−(−274.1))=491.3Difference(5)=(−11−217.1)=−228.1Sum of Differences Square=389,406.71​

Finally, the Durbin Watson statistic is the quotient of the squared values:

Durbin Watson=389,406.71/140,330.81=2.77\text{Durbin Watson}={389,406.71}/{140,330.81}={2.77}Durbin Watson=389,406.71/140,330.81=2.77

A rule of thumb is that test statistic values in the range of 1.5 to 2.5 are relatively normal. Any value outside this range could be a cause for concern. The Durbin–Watson statistic, while displayed by many regression analysis programs, is not applicable in certain situations. For instance, when lagged dependent variables are included in the explanatory variables, then it is inappropriate to use this test.