\(\color{deepskyblue}{\text{Бели шум}}\)

Бели шум је сваки случајни процес са независним вредностима, средње вредности 0 и дисперзије \(\sigma^2\). Није обавевезно да буде из нормалне расподеле. Ако јесте из нормалне расподеле, онда се назива Гаусов бели шум. Ово је идеални модел за резидуале.

Након што временску серију уклопимо у неки модел (моделе ћемо касније дефинисати), идеално је да разлика реализоване вредности и вредности предвиђене моделом буде бели шум.

w <- rnorm(100)
plot(w, type = "l")

x <- seq(-3,3, length = 1000)
hist(rnorm(100), prob = TRUE)
points(x, dnorm(x), type = "l") # funkcijom points na vec postojeci grafik dodajemo tacke
curve(dnorm(x),xlim=c(-3,3),add=TRUE) #ovo je drugi nacin za dodavanje linije na grafik

w <- rnorm(500,0,1) # 500 N(0,1) realizacija
# MA belog suma - izravnavanje serije
v <- filter(w, sides=2, rep(1/3,3)) # ova fja je mogla umesto rucno napravljene funkcije MA na prvom casu
v
## Time Series:
## Start = 1 
## End = 500 
## Frequency = 1 
##   [1]           NA  0.183982677 -0.046129064 -0.170177724 -0.186683414
##   [6]  0.621601081  1.076210817  0.605952012 -0.357052403 -0.755380600
##  [11] -0.342223464  0.588136143  1.163632688  0.832834422  0.206879027
##  [16] -0.444025448 -0.136087646 -0.226995858  0.106592005  0.180874073
##  [21]  0.717030957  0.508044965  0.498945955  0.174995891  0.441775306
##  [26]  0.432373965  0.226649056 -0.021105396 -0.074003378  0.228187940
##  [31] -0.130962392 -0.161902299 -0.363389264  0.114818067 -0.053691216
##  [36]  0.190214464  0.079692336  0.394324337 -0.258623947 -0.838186520
##  [41] -1.923434915 -1.679491823 -1.636936615 -0.461554139  0.189656999
##  [46]  0.430637879  0.297836359  0.001427260 -0.119828141 -0.498916232
##  [51] -0.306178355 -0.150709619 -0.547262710 -0.864038113 -0.973774903
##  [56]  0.102577349 -0.245029540  0.142821918 -0.433166614 -0.490067824
##  [61] -1.167766632 -0.891929493 -0.075375809  0.345221215  0.685533243
##  [66]  0.233864678  0.580000029 -0.538960780 -0.912542930 -1.224950368
##  [71] -0.654411356 -0.826245981 -0.226829856  0.215013346  0.567432410
##  [76]  0.257109254 -0.128476296 -0.295789829 -0.478543794 -0.125934174
##  [81] -0.079643758 -0.303241126 -0.379975499  0.307383064  0.640622209
##  [86]  0.766582274  0.099892130  0.360600508  0.620487117  0.195381051
##  [91] -0.149512622 -0.805348936 -0.244069110 -0.653988313  0.274753908
##  [96]  0.496766456  0.878043506 -0.146402601 -0.362574908 -0.686826351
## [101] -0.932372155 -1.278569831 -0.909948246 -0.374822582 -0.225344824
## [106] -0.061097127  0.202065257  0.496539497  0.408605455 -0.054348966
## [111] -0.262037280 -0.007363310  0.192988578 -0.214681457 -0.976017662
## [116] -0.468615819 -0.052710025 -0.326383700 -1.021418329 -0.059974844
## [121]  0.334127654  0.749308263 -0.255614602 -0.313870918 -0.660848347
## [126] -0.157013772  1.151600819  1.004844482 -0.029524659 -1.127969948
## [131] -1.362652377 -0.338319196 -0.129612083  0.930978505  1.189079289
## [136]  1.175961107  0.506001243 -0.010681128  0.536893464  0.613973864
## [141]  0.361696097 -0.693740462 -0.739588606 -0.644747241 -0.314251797
## [146] -0.113098426  0.428301081  0.093360686 -0.924182688 -1.284801839
## [151] -0.784689446  0.279623743  0.685974459  1.118732038  0.989644273
## [156]  0.216632096 -0.389233006 -1.233532816 -0.753168155 -0.086721428
## [161]  0.359078276 -0.254237828 -0.410306817 -0.328804535  0.113532966
## [166] -0.461437297 -0.425461886 -0.605385365 -0.123738491  0.148001163
## [171]  0.326879027  0.382288787  0.362897967  0.243983772 -0.198903370
## [176]  0.182154172  0.302100807 -0.301033853 -0.035237794 -0.081397551
## [181]  0.747131357 -0.115085005 -0.029240370 -0.086666264  0.086111374
## [186] -0.063552826  0.477083107 -0.032575426 -0.158461086 -0.922448741
## [191] -0.854153182 -0.308792813  0.063208602  0.492047279  0.517525591
## [196]  0.125475376  0.883239580  0.907866804  1.444082019  0.150762150
## [201] -0.725476785 -1.205585540 -1.217966219 -0.419045307  0.043366472
## [206]  0.638533401  0.259394178 -0.244081747 -0.066307991 -0.402393122
## [211] -0.062639682  0.184934341  0.953875638  0.827285979  0.061163229
## [216] -0.032292390  0.293304816  0.810783926  0.669190978  0.373937719
## [221] -0.233515508 -0.221514615 -0.500812104 -0.137282164 -0.553315387
## [226] -0.611016443 -0.018231291 -0.220368229  0.101874596  0.077436889
## [231]  0.575793481  0.165701079 -0.498333266 -0.095281961  0.299974677
## [236]  0.821762633  0.118671420 -0.167267713 -0.549957141 -0.027118614
## [241]  0.389944593  0.151062242 -0.133954795 -0.355682724  0.099809853
## [246]  0.574552747  0.150611190 -0.572645992 -1.368619496 -0.718121484
## [251] -0.403603727 -0.095964851 -0.050465273  0.436563367  0.108249025
## [256] -0.126275293 -0.200097650  0.096735386  0.089015703 -0.198586707
## [261]  0.093785126 -0.202717159 -0.031401134 -0.088460577 -0.113873955
## [266]  0.091652904  0.047240066  0.413249242 -0.245912555 -0.074368666
## [271] -0.224299065  0.134096828 -0.165760038 -0.319082633 -0.713618349
## [276] -0.542766921 -0.399230404 -0.039372220 -0.031604279  0.385624477
## [281]  0.285232860  0.223109927 -0.619670873 -0.617051119 -0.222516394
## [286]  0.661176668  0.847107290  0.873881365  0.466205756  0.170671987
## [291] -0.353457227 -0.684454680 -0.546028216  0.061274315  0.522733863
## [296]  0.445226069  0.032096545 -0.012699105  0.078855854 -0.319151351
## [301] -0.353525452 -0.124335098  0.199143119  0.359054187 -0.066344369
## [306] -0.519914598 -0.695715977 -0.008901449  0.558422508  1.113291828
## [311]  0.149505139 -0.358181425 -1.229787114 -0.651077104 -0.336745734
## [316] -0.579522636 -0.656476950 -0.326828245  0.229077880  0.567926216
## [321]  0.383806676  0.612395457  0.278251113 -0.166386863 -0.426995261
## [326] -0.164011494  0.259882898  0.314217904 -0.072041710 -0.269455675
## [331] -0.274274472 -0.817389173 -1.000203786 -0.425313724 -0.026789371
## [336]  0.459991384  0.271742059  0.539919125  0.124499806 -0.258216524
## [341] -1.013965788 -0.809628636 -0.710522944  0.329239847  0.279246451
## [346]  0.764975190  1.087965916  1.175505850  0.484124339 -0.308822686
## [351] -0.813121349 -0.610282893 -0.293075559  0.510606774  0.613213965
## [356]  0.870683548  0.564666359  1.155343849  0.972860256  0.764678971
## [361]  0.419942029  0.448139184  1.066207210  0.604090243  0.241135464
## [366] -1.078788856 -0.825764708 -1.044516675  0.023736992 -0.238793421
## [371]  0.580061696  0.100017325  0.417242920 -0.599404768 -0.650054009
## [376] -0.814958461  0.342371247  0.287893574  0.481596134 -0.135549822
## [381]  0.544395283  0.149508275  0.223199050 -0.331691237  0.042351242
## [386] -0.193235327  0.321378189 -0.515374685 -1.169239203 -1.864390857
## [391] -0.860144541  0.371431383  1.339677716  0.726663127  0.601414481
## [396]  0.502107912  0.350370131 -0.022516040  0.135642591  1.254686935
## [401]  0.767714077  0.273724162 -0.681631546  0.068954222 -0.147111709
## [406]  0.223822828  0.255511119  0.339714671 -0.077099076 -0.287216327
## [411] -0.430870266 -0.100354732  0.325586120  0.279076119  0.466754561
## [416]  0.413022951  0.673844422 -0.226579788 -0.706898009 -0.472533041
## [421]  0.182056712  0.102714041  0.621819872  0.310777306  0.477272812
## [426] -0.268374216  0.372318262  0.614799235  0.575347373  0.121455043
## [431]  0.296306022  0.762112513  1.283796636  0.852647049  0.525879065
## [436]  0.238926675  0.101680273 -0.249166027 -0.059145743 -0.264511312
## [441]  0.074350993 -0.554064483 -0.298167824 -0.697760001 -0.166920842
## [446] -0.126180001  0.469251084  0.781443316  1.083260986  1.149121545
## [451]  1.063242466  1.128243340  0.756357275 -0.010588988 -0.517318222
## [456] -0.478518927 -0.076218883 -0.203534384 -0.225134848 -0.363958559
## [461] -0.139593084 -0.221320123 -0.038267990  0.073533488  0.704035733
## [466]  0.311850512  0.904203224  0.147928118  0.863419188  0.214542970
## [471]  0.861578735  0.605567719  1.126844880  0.605116421  0.653786407
## [476]  0.249733586 -0.088554361 -0.452454509 -0.422507334 -0.095310304
## [481] -0.020260031  0.260450336  0.919665265  0.736974366  0.117852830
## [486] -0.056632020 -0.059036437  0.625510493  0.395836568  0.481547816
## [491]  0.327151405  0.405912317  1.206525529  0.260378980  0.074493369
## [496] -0.975409597 -0.082847572 -0.112220611  0.144683259           NA
plot.ts(w, main="white noise")

plot.ts(v, main="moving average")

Видимо да је друга временска серија мирнија по понашању.

\(\color{deepskyblue}{\text{Брауново кретање (Винеров процес)}}\)

У финансијској математици један од модела за цене акција је процес \(e^{W_t}\), где је \(W_t\) Брауново кретање. Овакав процес назива се геометријско Брауново кретање.

За симулацију Брауновог кретања користи се \(B_0=0\), својство независности прираштаја и расподела \(B_t-B_s\). Ако хоћемо да симулирамо, ограничени смо дискретним временом.

# u 1000 tacaka aproksimirati Braunovo kretanje na intervalu [0,1000]
# prirastaji na vremenskom intervalu duzine k imaju N(0,k) raspodelu
x <- w <- rnorm(1000)
for (t in 2:1000) x[t] <- x[t - 1] + w[t]
plot(x, type = "l")

# Braunovo kretanje na [0,1]
t <- seq(0,1,0.001) #1001 podeona tacka
B <- vector()
B[1] <- 0
for(i in 1:1000){
  B[i+1] <- B[i]+rnorm(1,0,0.001) # sada prirastaj izmedju susednih tacaka ima raspodelu N(0,0.001), a malopre je imao N(0,1)
}
plot(t,B, type="l")

\(\color{deepskyblue}{\text{Корелација}}\)

У моделима које ћемо касније изучавати важан је појам корелације, јер се у тим моделима претпоставља да садашња ведност зависи од вредности из прошлости. Ако одредимо ту корелацију, то нам може помоћи у прогнозирању и бољем уклапању модела. Коваријација две случајне величине је мера њихове линеарне зависности.

Herald <- read.delim("Herald.txt") 
Herald # koncentracije benzoapirena i ugljen monoksida u 16 uzoraka vazduha na Herald Square-u na Menhetnu, oba se nalaze u izduvnim gasovima automobila
##      CO Benzoa
## 1   2.8    0.5
## 2  15.5    0.1
## 3  19.0    0.8
## 4   6.8    0.9
## 5   5.5    1.0
## 6   5.6    1.1
## 7   9.6    3.9
## 8  13.3    4.0
## 9   5.5    1.3
## 10 12.0    5.7
## 11  5.6    1.5
## 12 19.5    6.0
## 13 11.0    7.3
## 14 12.8    8.1
## 15  5.5    2.2
## 16 10.5    9.5
attach(Herald)
x <- CO
y <- Benzoa
n <- length(x)
sum((x - mean(x))*(y - mean(y))) / (n - 1)
## [1] 5.511042
cov(x,y)
## [1] 5.511042
mean((x - mean(x))*(y - mean(y))) # formula za kovarijaciju i dve sl vel, uzoracke ocene
## [1] 5.166602
plot(x,y)

cov(x,y)/(sd(x)*sd(y)) # Koeficijent korelacije - deljenje proizvodom standarnih devijacija
## [1] 0.3550973
cor(x,y)
## [1] 0.3550973

Да ли је коваријација (односно корелација) \(r_t\) и \(r_{t-l}\) инваријантна у времену (по t)? Да ли зависи само од \(l\)? Да ли је корелациона функција, функција једног аргумента (lag на енглеском) који је природан број?

Познато је да слабо стационарни процеси имају константни функцију средње вредности.

Претпоставка строге стационарности је веома јака у тешко би било испитати да ли је нека серија реализација строго стационарног случајног процеса. Зато се испитује слаба стационарност. Од сада стационарним процесом зовемо слабо стационарне процесе.

Кажемо да временска серија није корелисана ако је аутокорелациона функција једнака 0 свуда, осим у нули где је по дефиницији једнака 1.

wave <- read.csv("wave.txt", sep="") # U date su razlike u vrednosti nivoa vode u sredini bunara koje su posledica simulatora talasa, merenja su vrsena na svakih 0.1s i poslednji trenutak je 39.7s 
attach(wave)
plot(ts(waveht)) 

plot(ts(waveht[1:60]))

Са графика видимо да нема фиксне фреквенције, али да су узастопне вредности релативно сличне.

Корелограм је график аутокорелационе функције. На \(x\) оси се налазе природни бројеви, а на \(y\) оси су вредности аутокорелационе функције са задршком k.

acf(waveht) 
acf(waveht)$acf # mozemo dobiti i odgovarajuci niz brojeva:

## , , 1
## 
##               [,1]
##  [1,]  1.000000000
##  [2,]  0.470256396
##  [3,] -0.262911528
##  [4,] -0.498917020
##  [5,] -0.378706643
##  [6,] -0.214992933
##  [7,] -0.037917306
##  [8,]  0.177644329
##  [9,]  0.269315275
## [10,]  0.130385337
## [11,] -0.074313293
## [12,] -0.079345616
## [13,]  0.028727319
## [14,]  0.070023128
## [15,]  0.063197459
## [16,] -0.009774170
## [17,] -0.101956108
## [18,] -0.125238283
## [19,] -0.108903118
## [20,] -0.047593090
## [21,]  0.077382508
## [22,]  0.164775681
## [23,]  0.124267904
## [24,]  0.049328615
## [25,] -0.004555037
## [26,] -0.065743573
acf(waveht)$acf[1] # vrednost autokorelacione funkcije u 0 je 1
## [1] 1
acf(waveht, type = "covariance")$acf[2] # vrednost autokovarijacione funkcije dobijemo kada funkciji acf dodamo jos jedan argument type

## [1] 33328.39

Као што смо рекли раније, вредност коефицијента корелације је мера линеарне зависности. осим вредности саме функције, можемо нацртати графике да бисмо се уверили у линеарну или неку другу зависност између вредности на растојању k временских тренутака. На пример, са задршком (lag) 1.

plot(waveht[1:396],waveht[2:397]) 

\(\color{deepskyblue}{\text{Особине корелограма}}\)

  1. Полиномијални тренд
y <- 1:100
y.ts<-ts(y)
acf(y.ts) 

y <- -y^2+y+5 # polinom drugog stepena
y
##   [1]     5     3    -1    -7   -15   -25   -37   -51   -67   -85  -105
##  [12]  -127  -151  -177  -205  -235  -267  -301  -337  -375  -415  -457
##  [23]  -501  -547  -595  -645  -697  -751  -807  -865  -925  -987 -1051
##  [34] -1117 -1185 -1255 -1327 -1401 -1477 -1555 -1635 -1717 -1801 -1887
##  [45] -1975 -2065 -2157 -2251 -2347 -2445 -2545 -2647 -2751 -2857 -2965
##  [56] -3075 -3187 -3301 -3417 -3535 -3655 -3777 -3901 -4027 -4155 -4285
##  [67] -4417 -4551 -4687 -4825 -4965 -5107 -5251 -5397 -5545 -5695 -5847
##  [78] -6001 -6157 -6315 -6475 -6637 -6801 -6967 -7135 -7305 -7477 -7651
##  [89] -7827 -8005 -8185 -8367 -8551 -8737 -8925 -9115 -9307 -9501 -9697
## [100] -9895
acf(y)

Видимо да су све корелације позитивне, статистички значајне и споро опадају. Генерално, за све строго монотоне временске серије, корелограм слично изгледа.

  1. Периодичне - тригонометријске
y <- seq(from=0,to=100,by=1)
acf(sin(y)) # oblik korelograma- kao cos

  1. Периодичне - понавњајучи низ бројева
y <- rep(1:10,40)
acf(y) # ponavlja se 10 brojeva, najvece su korelacije sa korakom 10*k

\(\color{deepskyblue}{\text{Пример 1}}\)

Испитујемо ово на временској серији AirPassengers која има и тренд и сезонску компоненту. Ова серија није стационарна, а видећемо како тренд и сезонска компонента утичу на корелограм.

data(AirPassengers)
AP <- AirPassengers
AP.ts <- ts(AP,freq=12,start=1958)
plot(AP.ts) 

acf(AP.ts) # izdvaja se autokorelacija sa korakom 12, zbog sezonske komponente

n <- (length(AP.ts)-6)
AP.decom <- decompose(AP.ts,type="mult")
plot(ts(AP.decom$random[7:138]))

Када смо склонили тренд и сезонску компоненту, видимо да је највећа позитивна корелација са кораком 12.

acf(AP.decom$random[7:138]) 

И овде видимо косинусни облик на корелограму што може да значи да је модел лош. Косинусни облик је карактеристичан за AR(2) модел (касније).

sd(AP[7:138])
## [1] 109.4187
sd(AP[7:138] - AP.decom$trend[7:138])
## [1] 41.11491
sd(AP.decom$random[7:138])
## [1] 0.0333884

Издвајање детерминистичких компоненти смањује дисперзију почетког процеса.

\(\color{deepskyblue}{\text{Пример 2}}\)

Fontdsdt <- read.csv("Fontdsdt.txt", sep="") # protok vode (m^3/s) (prosecno, mesecna serija, od 1.1909 do 12.1980)
attach(Fontdsdt) # prethodno je ocenjen trend i sezonska komponenta, a adflow predstavlja samo slucajnu komponentnu
plot(ts(adflow), ylab = 'adflow')

acf(adflow, xlab = 'lag (months)', main="")

Једино је статистички значајна корелација са кораком 1, што се може објаснити: у зависности од подземних вода чије се понашање тј. колико доприносе језеру споро мења, па су током узастопних месеци сличне вредности. Други начин на који се пуни језеро су падавине, а падавине у узастопним месецима нису корелисане. Овакав облик корелограма (експоненцијално опадање) је карактеристично за AR(1) модел.

\(\color{deepskyblue}{\text{Корелограм Гаусовог белог шума}}\)

acf(w) # w - Gausov beli sum N(0,1)

\(\color{deepskyblue}{\text{Задатак}}\)

  • Учитати временске серије vs1.txt и vs2.txt и графички их представити. Нацртати графике зависности између вредности са задршком (lag) 1. Нацртати корелограме за обе серије и донети закључке.

  • Нацртати корелограм случајне компоненте за временску серију Fontdsdt и упоредити график са корелограмом временске серије Fontdsdt.