Glavni » algoritmično trgovanje » Večplastna regresija - opredelitev MLR

Večplastna regresija - opredelitev MLR

algoritmično trgovanje : Večplastna regresija - opredelitev MLR
Kaj je večkratna linearna regresija - MLR?

Večkratna linearna regresija (MLR), znana tudi kot multipla regresija, je statistična tehnika, ki uporablja več pojasnjevalnih spremenljivk za napovedovanje izida spremenljivke odziva. Cilj večkratne linearne regresije (MLR) je modelirati linearno razmerje med pojasnjevalnimi (neodvisnimi) spremenljivkami in odzivno (odvisno) spremenljivko.

V bistvu je večkratna regresija podaljšek navadne regresije najmanjših kvadratov (OLS), ki vključuje več kot eno razlagalno spremenljivko.

Formula za več linearno regresijo je

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ, kjer je za i = n opazovanja: yi = odvisna spremenljivkaxi = ekspanzijske spremenljivkeβ0 = y-prestrezanje (stalen čas) βp = koeficienti naklona za vsako pojasnjevalno spremenljivkoϵ = izraz napake modela (znano tudi kot ostanki) \ začni {poravnano} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {kjer, za} i = n \ textbf {opažanja:} \\ & y_i = \ besedilo {odvisna spremenljivka} \\ & x_i = \ besedilo {razširljive spremenljivke} \\ & \ beta_0 = \ besedilo {y-prestrezanje (konstantno izraz)} \\ & \ beta_p = \ besedilo {koeficienti naklona za vsako pojasnjevalno spremenljivko} \\ & \ epsilon = \ besedilo {izraz napake modela (znan tudi kot ostanki)} \\ \ konec {poravnano} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ kjerkoli, za i = n opažanja: yi = odvisna spremenljivka = ekspanzijske spremenljivkeβ0 = y-prestrezanje (stalen izraz) βp = Koeficienti naklona za vsako pojasnjevalno spremenljivkoϵ = izraz napake modela (znan tudi kot ostanki)

Pojasnilo več linearne regresije

Preprosta linearna regresija je funkcija, ki omogoča analitiku ali statistiki, da oblikuje napovedi o eni spremenljivki na podlagi informacij, ki so znane o drugi spremenljivki. Linearno regresijo lahko uporabimo le, če imata dve neprekinjeni spremenljivki - neodvisno in odvisno spremenljivko. Neodvisna spremenljivka je parameter, ki se uporablja za izračun odvisne spremenljivke ali izida. Model večkratne regresije se razteza na več pojasnjevalnih spremenljivk.

Model večkratne regresije temelji na naslednjih predpostavkah:

  • Obstaja linearno razmerje med odvisnimi spremenljivkami in neodvisnimi spremenljivkami.
  • Neodvisne spremenljivke niso preveč medsebojno povezane.
  • y i opazovanja so izbrana neodvisno in naključno iz populacije.
  • Ostanki morajo biti običajno razporejeni s srednjo vrednostjo 0 in odstopanjem σ.

Koeficient določitve (R-kvadrat) je statistična metrika, ki se uporablja za merjenje, koliko različic izida je mogoče razložiti z variacijo neodvisnih spremenljivk. R2 se vedno poveča, saj je v model MLR dodano več prediktorjev, čeprav napovedovalci morda niso povezani z spremenljivko izida.

R2 sam po sebi torej ni mogoče uporabiti za določitev, kateri napovedovalci naj bodo vključeni v model in katere je treba izključiti. R2 je lahko le med 0 in 1, pri čemer 0 pomeni, da izida ni mogoče napovedati s katero od neodvisnih spremenljivk in 1 kaže, da je izid neodvisnih spremenljivk mogoče napovedati brez napak.

Pri razlagi rezultatov večkratne regresije so beta koeficienti veljavni, medtem ko imajo ostale spremenljivke konstantne ("vse ostalo enako"). Izhod iz večkratne regresije lahko prikažemo vodoravno kot enačbo ali navpično v obliki tabele.

Primer z uporabo več linearne regresije

Na primer, analitik bo morda želel vedeti, kako gibanje trga vpliva na ceno Exxon Mobil (XOM). V tem primeru bo njegova linearna enačba imela vrednost indeksa S&P 500 kot neodvisne spremenljivke ali napovedovalca in ceno XOM kot odvisne spremenljivke.

V resnici obstaja več dejavnikov, ki napovedujejo izid dogodka. Gibanje cen Exxon Mobila je na primer odvisno od uspešnosti celotnega trga. Drugi napovedovalci, kot so cena nafte, obrestne mere in gibanje cen naftnih rokov, lahko vplivajo na ceno XOM in delniške cene drugih naftnih podjetij. Za razumevanje razmerja, v katerem sta prisotni več kot dve spremenljivki, uporabimo več linearno regresijo.

Za določitev matematičnega razmerja med več naključnimi spremenljivkami se uporablja več linearna regresija (MLR). Z drugimi besedami, MLR preuči, kako je več neodvisnih spremenljivk povezanih z eno odvisno spremenljivko. Ko je vsak neodvisni dejavnik določen za napovedovanje odvisne spremenljivke, se lahko podatki o več spremenljivkah uporabijo za izdelavo natančne napovedi glede na učinek, ki ga imajo na izhodno spremenljivko. Model ustvari odnos v obliki premice (linearne), ki najbolje približa vse posamezne podatkovne točke.

Glede na zgornjo enačbo MLR v našem primeru:

  • y i = odvisna spremenljivka: cena XOM
  • x i1 = obrestne mere
  • x i2 = cena olja
  • x i3 = vrednost indeksa S&P 500
  • x i4 = cena naftnih pogodb
  • B 0 = y-prestrezanje v času nič
  • B 1 = regresijski koeficient, ki meri spremembo enote v odvisni spremenljivki, ko se x x1 spremeni - sprememba cene XOM, ko se obrestne mere spremenijo
  • B 2 = vrednost koeficienta, ki meri spremembo enote v odvisni spremenljivki, ko se x x2 spremeni - sprememba cene XOM, ko se cene nafte spremenijo

Ocene najmanjših kvadratov, B 0, B 1, B 2 … B p, običajno izračuna statistična programska oprema. V regresijski model lahko vključimo toliko spremenljivk, v katerih je vsaka neodvisna spremenljivka diferencirana s številom - 1, 2, 3, 4 ... p. Model večkratne regresije analitiku omogoča napovedovanje izida na podlagi informacij o več pojasnjevalnih spremenljivkah.

Kljub temu model ni vedno popolnoma natančen, saj se lahko vsaka podatkovna točka nekoliko razlikuje od rezultata, ki ga napoveduje model. Preostala vrednost, E, ki je razlika med dejanskim rezultatom in predvidenim rezultatom, je vključena v model za upoštevanje tako majhnih sprememb.

Ob predpostavki, da vodimo svoj model regresije cen XOM s pomočjo programske opreme za statistiko, ki vrne ta izhod:

Analitik bi to količino razlagal tako, da če se druge spremenljivke ohranjajo konstantne, se bo cena XOM zvišala za 7, 8%, če se cena nafte na trgih poveča za 1%. Model tudi kaže, da se bo cena XOM znižala za 1, 5% po zvišanju obrestnih mer za 1%. R 2 kaže, da je 86, 5% nihanj cene delnic Exxon Mobil mogoče razložiti s spremembami obrestne mere, cene nafte, terminov nafte in indeksa S&P 500.

Ključni odvzemi

  • Večkratna linearna regresija (MLR), znana tudi kot multipla regresija, je statistična tehnika, ki uporablja več pojasnjevalnih spremenljivk za napovedovanje izida spremenljivke odziva.
  • Večkratna regresija je podaljšek linearne (OLS) regresije, ki uporablja samo eno pojasnjevalno spremenljivko.
  • MLR se veliko uporablja pri ekonometriki in finančnih sklepih.

Razlika med linearno in večkratno regresijo

Linearna (OLS) regresija primerja odziv odvisne spremenljivke glede na spremembo neke pojasnjevalne spremenljivke. Vendar pa je redko, da je odvisna spremenljivka razložena le z eno spremenljivko. V tem primeru analitik uporablja več regresij, ki poskuša razložiti odvisno spremenljivko z več kot eno neodvisno spremenljivko. Več regresij je lahko linearnih in nelinearnih.

Več regresij temelji na predpostavki, da obstaja linearna povezava med odvisnimi in neodvisnimi spremenljivkami. Prav tako ne predvideva večje korelacije med neodvisnimi spremenljivkami.

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Kaj regresija meri Regression je statistična meritev, ki poskuša ugotoviti moč povezave med eno odvisno spremenljivko (običajno jo označujemo z Y) in vrsto drugih spremenljivih spremenljivk (znanih kot neodvisne spremenljivke). več Kaj je izraz napake "> Izraz napake je opredeljen kot spremenljivka v statističnem modelu, ki se ustvari, ko model ne predstavlja v celoti dejanskega razmerja med neodvisnimi in odvisnimi spremenljivkami. več Kako deluje metoda najmanjših kvadratov? Metoda kvadratov je statistična tehnika za določitev vrstice, ki je najbolj primerna za model, določena z enačbo z določenimi parametri za opazovane podatke. Več Econometrics: Kaj to pomeni in kako se uporablja Econometrics je uporaba statističnih in matematičnih modelov v ekonomskih podatki za namene preizkušanja teorij, hipotez in prihodnjih trendov. več R-kvadrat R-kvadrat je statistični ukrep, ki predstavlja delež variance odvisne spremenljivke, ki ga razloži neodvisna spremenljivka. več Kako deluje koeficient določitve Koeficient določitve je ukrep, ki se uporablja pri statistični analizi za oceno, kako dobro razloži model in napoveduje prihodnje rezultate. Več Pa rtner Povezave
Priporočena
Pustite Komentar