Glavni » algoritmično trgovanje » Prekomerno opremljanje

Prekomerno opremljanje

algoritmično trgovanje : Prekomerno opremljanje
Kaj je prekomerno opremljanje?

Prekomerno opremljanje je napaka modeliranja, ki se pojavi, ko je funkcija preveč tesno povezana z omejenim naborom podatkovnih točk. Prekomerno opremljanje modela je ponavadi v obliki preveč kompleksnega modela za razlago idiosinkrazije v študijskih podatkih.

V resnici imajo podatki, ki se pogosto preučujejo, v sebi določeno stopnjo napak ali naključnega hrupa. Tako lahko poskus, da bi model pregloboko ustrezal malce netočnim podatkom, okuži model s pomembnimi napakami in zmanjša njegovo napovedno moč.

[Pomembno: Finančni strokovnjaki se morajo vedno zavedati nevarnosti prekomernega opremljanja modela, ki temelji na omejenih podatkih.]

Razumevanje prekomernega opremljanja

Na primer, pogosta težava je uporaba računalniških algoritmov za iskanje obsežnih baz zgodovinskih tržnih podatkov, da bi našli vzorce. Ob zadostni študiji je pogosto mogoče razviti podrobne teoreme, za katere se zdi, da napovedujejo stvari, kot so donosnost na borzi, z natančno natančnostjo.

Če pa se uporabijo za podatke zunaj vzorca, se lahko takšni teoremi izkažejo kot zgolj prilagajanje modela tistemu, kar so bili v resnici le slučajni dogodki. V vseh primerih je pomembno, da se model testira na podatkih, ki niso iz vzorca, ki se uporablja za njegovo razvijanje.

Ključni odvzemi

  • Prekomerno opremljanje je napaka modeliranja, ki se pojavi, ko je funkcija preveč tesno povezana z omejenim naborom podatkovnih točk.
  • Finančni strokovnjaki se morajo vedno zavedati nevarnosti prekomernega opremljanja modela, ki temelji na omejenih podatkih.
Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Zakaj je pomembno statistično pomembnost Statistični pomen se nanaša na rezultat, ki se verjetno ne bo pojavil naključno, ampak bo verjetno pripisan določenemu vzroku. več Kako deluje glajenje podatkov, se glajenje podatkov izvaja z algoritmom za odstranjevanje hrupa iz podatkovnega niza. To omogoča, da izstopajo pomembni vzorci. Izravnava podatkov se lahko uporablja za napovedovanje trendov, kot so tisti, ki jih najdemo pri cenah vrednostnih papirjev. več Vzorec Vzorec je manjša, obvladljiva različica večje skupine. Vzorci se uporabljajo pri statističnem testiranju, kadar je velikost prebivalstva prevelika. več Heteroskedastičnost V statistiki se heteroskedastičnost zgodi, kadar standardni odkloni spremenljivke, ki jih spremljamo v določenem času, niso konstantni. več Branje v stratificirano naključno vzorčenje Stratificirano naključno vzorčenje je metoda vzorčenja, ki vključuje delitev populacije na manjše skupine, znane kot sloji. več Kako delujejo preprosti naključni vzorci Preprost naključni vzorec je podmnožica statistične populacije, v kateri ima vsak član podskupine enako verjetnost, da bo izbran. Preprost naključni vzorec naj bi bil nepristranski prikaz skupine. več partnerskih povezav
Priporočena
Pustite Komentar