Glavni » algoritmično trgovanje » Preizkušanje hipotez v financah: koncept in primeri

Preizkušanje hipotez v financah: koncept in primeri

algoritmično trgovanje : Preizkušanje hipotez v financah: koncept in primeri

Vaš investicijski svetovalec vam predlaga mesečni naložbeni načrt dohodka, ki obljublja spremenljiv donos vsak mesec. Vanj boste investirali le, če boste zagotovili povprečni mesečni dohodek v višini 180 dolarjev. Tudi vaš svetovalec vam pove, da je imela shema v zadnjih 300 mesecih donosnost naložb s povprečno vrednostjo 190 USD in standardnim odstopanjem 75 USD. Bi morali vlagati v to shemo? Pri takšnem odločanju na pomoč pride testiranje hipotez.

Ta članek predpostavlja bralce seznanjenost s koncepti običajne razpredelnice, formule, p-vrednosti in s tem povezane osnove statistike.

Kaj je testiranje hipotez?

Hipoteza ali pomembnostno testiranje je matematični model za preizkušanje trditve, ideje ali hipoteze o parametru, ki zanima v določenem nizu populacije, z uporabo podatkov, izmerjenih v vzorčnem naboru. Izračuni se izvedejo na izbranih vzorcih, da se zberejo odločnejše informacije o značilnostih celotne populacije, kar omogoča sistematičen preizkus trditev ali idej o celotnem naboru podatkov.

Tu je preprost primer: ravnateljica poroča, da učenci v njeni šoli v izpitih dobijo povprečno 7 od 10. Da bi preizkusili to "hipotezo", zabeležimo ocene približno 30 učencev (vzorec) iz celotne študentske populacije šole (recimo 300) in izračunamo srednjo vrednost tega vzorca. Nato lahko primerjamo (izračunano) povprečje vzorca s povprečno (poročano) populacijo in skušamo potrditi hipotezo.

Če upoštevamo še en primer, je letna donosnost posameznega vzajemnega sklada 8%. Predpostavimo, da vzajemni sklad obstaja že 20 let. Vzamemo naključni vzorec letnih donosov vzajemnega sklada za recimo pet let (vzorec) in izračunamo njegovo povprečje. Nato primerjamo (izračunano) vrednost vzorca s srednjo (zahtevano) populacijo, da preverimo hipotezo.

Merila odločanja morajo temeljiti na določenih parametrih nabora podatkov.

Za preskušanje hipotez obstajajo različne metodologije, vendar so vključeni isti štirje osnovni koraki:

1. korak: Določite hipotezo

Običajno je poročana vrednost (ali statistika zahtevka) navedena kot hipoteza in domneva, da je resnična. Za zgornje primere bo hipoteza:

  • Primer A: Učenci v šoli v izpitih dobijo povprečno 7 od 10.
  • Primer B: Letna donosnost vzajemnega sklada je 8% letno.

Ta navedeni opis predstavlja „ nično hipotezo (H 0 ) “ in se domneva, da je resničen - tako, kot se obtoženi v sojenju porotnikov šteje za nedolžnega, dokler ni dokazan na sodišču. Podobno se testiranje hipotez začne z navedbo in domnevo "nične hipoteze", nato pa postopek ugotovi, ali je domneva verjetno resnična ali napačna.

Pomembno je poudariti, da preizkušamo ničelno hipotezo, ker obstaja element dvoma o njeni veljavnosti. Kakršne koli informacije, ki nasprotujejo navedeni ničelni hipotezi, so zajete v alternativni hipotezi (H 1 ). Za zgornje primere bo alternativna hipoteza:

  • Študenti ocenjujejo povprečje, ki ni enako 7.
  • Letna donosnost vzajemnega sklada ni enaka 8% letno.

Z drugimi besedami, alternativna hipoteza je neposredno nasprotje ničelne hipoteze.

Kot v sojenju porota domneva obtoženčevo nedolžnost (nična hipoteza). Tožilec mora dokazati drugače (alternativna hipoteza). Prav tako mora raziskovalec dokazati, da je nična hipoteza resnična ali napačna. Če tožilec ne dokaže druge hipoteze, mora porota obdolženca izpustiti (odločitev temelji na nični hipotezi). Podobno, če raziskovalec ne dokaže alternativne hipoteze (ali preprosto ne stori ničesar), potem velja, da je nična hipoteza resnična.

2. korak: nastavite merila

Kriteriji odločanja morajo temeljiti na določenih parametrih nabora podatkov in tu pride na vrsto povezava z običajno distribucijo.

V skladu s standardnim statističnim statističnim podatkom o porazdelitvi vzorčenja "je pri vsaki velikosti vzorca n porazdelitev vzorčenja X̅ normalna, če je populacija X, iz katere je odvzet vzorec, običajno porazdeljena." Zato verjetnosti vseh drugih možnih vzorcev pomenijo, da lahko bi izbrali, so običajno razporejeni.

Na primer, določite, ali je povprečna dnevna donosnost delnic, ki kotirajo na borzi XYZ, okoli novoletnega dne večja od 2%.

H 0 : ničelna hipoteza: srednja vrednost = 2%

H 1 : Alternativna hipoteza: pomeni> 2% (to želimo dokazati)

Vzemite vzorec (recimo 50 zalog od skupno 500) in izračunajte srednjo vrednost vzorca.

Za normalno porazdelitev 95% vrednosti leži v dveh standardnih odstopanjih povprečne populacije. Zato nam ta običajna predpostavka o distribuciji in osrednji meji za podatkovni niz vzorcev omogoča, da določimo 5% kot stopnjo pomembnosti. Smiselno je, da je po tej predpostavki manj kot 5-odstotna verjetnost (100-95), da bodo odpuščeni presegli povprečna odstopanja od povprečne populacije. Glede na vrsto podatkovnih nizov se lahko druge stopnje pomembnosti merijo na 1%, 5% ali 10%. Za finančne izračune (vključno z vedenjskimi financami) je 5% splošno sprejeta meja. Če najdemo izračune, ki presegajo običajna dva standardna odstopanja, imamo močan primer odpuščanja, ki zavrača ničelno hipotezo.

Grafično je predstavljen na naslednji način:

V zgornjem primeru, če je povprečna vrednost vzorca veliko večja od 2% (recimo 3, 5%), zavračamo ničelno hipotezo. Sprejeta je alternativna hipoteza (srednja vrednost> 2%), kar potrjuje, da je povprečna dnevna donosnost zalog res nad 2%.

Če pa vrednost vzorca verjetno ne bo bistveno večja od 2% (in ostane pri recimo okoli 2, 2%), nične hipoteze NE SMO zavreči. Izziv je, kako odločiti o takih primerih iz bližnjega območja. Za sklep iz izbranih vzorcev in rezultatov je treba določiti stopnjo pomembnosti, ki omogoča sklep o ničelni hipotezi. Alternativna hipoteza omogoča določitev stopnje pomembnosti ali koncepta "kritične vrednosti" za odločanje o takih primerih iz bližnjega območja.

V skladu s standardno opredelitvijo učbenika je "Kritična vrednost mejna vrednost, ki določa meje, čez katere je mogoče pridobiti manj kot 5% vzorčnega sredstva, če je nična hipoteza resnična. Vzorčna sredstva, pridobljena zunaj kritične vrednosti, bodo povzročila odločitev o zavrnitvi ničelne hipoteze. "V zgornjem primeru, če smo kritično vrednost opredelili kot 2, 1%, izračunana srednja vrednost pa znaša 2, 2%, zavrnemo nično hipotezo Kritična vrednost vzpostavlja jasno razmejitev glede sprejetja ali zavrnitve.

3. korak: Izračunajte statistiko

Ta korak vključuje izračun potrebnih (-ih) številk (-ov), znanih kot preskusna statistika (npr. Srednja vrednost, z-ocena, p-vrednost itd.) Za izbrani vzorec. (Na to bomo prišli v naslednjem razdelku.)

4. korak: Pridobite zaključek

Z izračunanimi vrednostmi odločite o ničelni hipotezi. Če je verjetnost pridobitve povprečne vrednosti vzorca manjša od 5%, potem je treba ugotoviti, da ničelna hipoteza zavrne . V nasprotnem primeru sprejmi in obdrži nično hipotezo.

Vrste napak

Pri sprejemanju odločitev na podlagi vzorca so lahko štirje možni rezultati glede pravilne uporabnosti za celotno populacijo:

Odločitev o zadržku


Odločitev o zavrnitvi


Velja za celotno prebivalstvo


Pravilno


Nepravilno

(Napaka TIPA 1 - a)


Ne velja za celotno populacijo


Nepravilno

(Napaka TIPA 2 - b)


Pravilno


"Pravilni" primeri so tisti, v katerih so odločitve, sprejete na vzorcih, resnično uporabne za celotno populacijo. Primeri napak nastanejo, ko se človek odloči obdržati (ali zavrniti) ničelno hipotezo na podlagi vzorčnih izračunov, vendar ta odločitev v resnici ne velja za celotno populacijo. Ti primeri pomenijo napake tipa 1 (alfa) in tipa 2 (beta), kot je navedeno v zgornji tabeli.

Izbira pravilne kritične vrednosti omogoča odpravo alfa napak tipa 1 ali njihovo omejitev na sprejemljiv obseg.

Alpha označuje napako na stopnji pomembnosti in jo določi raziskovalec. Da bi ohranili standardno 5-odstotno pomembnost ali stopnjo zaupanja za verjetnostne izračune, se ta ohrani na 5%.

Glede na veljavna merila in opredelitve odločanja:

  • "Ta (alfa) kriterij je običajno nastavljen na 0, 05 (a = 0, 05) in primerjamo raven alfa s p-vrednostjo. Kadar je verjetnost napake tipa I manjša od 5% (p <0, 05), se odločimo za zavrnitev ničelne hipoteze; v nasprotnem primeru ohranimo nično hipotezo. "
  • Tehnični izraz, ki se uporablja za to verjetnost, je p-vrednost . Opredeljen je kot "verjetnost pridobitve vzorčnega rezultata, glede na to, da je vrednost, navedena v ničelni hipotezi, resnična. P-vrednost za pridobitev vzorčnega rezultata se primerja s stopnjo pomembnosti. "
  • Napaka tipa II ali beta napaka je opredeljena kot "verjetnost napačnega ohranitve ničelne hipoteze, če v resnici ni uporabna za celotno populacijo."

Še nekaj primerov bo pokazalo to in druge izračune.

Primer 1

Mesečna naložbena shema dohodka obstaja, ki obljublja spremenljive mesečne donose. Vlagatelj bo vanj vlagal le, če mu bo zagotovil povprečni mesečni dohodek v višini 180 USD. Ima vzorec 300 mesečnih donosov, ki znašajo 190 dolarjev in standardni odklon 75 dolarjev. Ali mora vlagati v to shemo ">

Nastavimo težavo. Investitor bo vlagal v shemo, če bo zagotovil želeni povprečni donos v višini 180 USD.

H 0 : Ničelna hipoteza: srednja vrednost = 180

H 1 : Alternativna hipoteza: srednje> 180

1. metoda: pristop kritične vrednosti

Za vzorčno srednjo določite kritično vrednost X L, ki je dovolj velika, da zavrne ničelno hipotezo - torej zavrne ničelno hipotezo, če vzorec pomeni> = kritična vrednost X L

P (prepoznajte alfa napako tipa I) = P (zavrnite H 0, če je H 0 resničen),

To bi dosegli, ko povprečna vrednost vzorca preseže kritične meje.

= P (glede na to, da je H 0 resničen) = alfa

Grafično se zdi, kot sledi:

Upoštevanje alfa = 0, 05 (tj. 5-odstotna stopnja pomembnosti), Z 0, 05 = 1, 645 (iz tabele Z ali običajne razpredelnice)

=> X L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Ker je povprečna vrednost vzorca (190) večja od kritične vrednosti (187, 12), se ničelna hipoteza zavrne in sklep je, da je povprečna mesečna donosnost res večja od 180 dolarjev, zato lahko vlagatelj razmisli o vlaganju v to shemo.

2. način: Uporaba standardiziranih statističnih preskusov

Lahko uporabimo tudi standardizirano vrednost z.

Statistika preskusa, Z = (povprečna vrednost vzorca - povprečna populacija) / (std-dev / sqrt (št. Vzorcev).

Nato območje zavrnitve postane naslednje:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Naše območje zavrnitve na 5-odstotni stopnji pomembnosti je Z> Z 0, 05 = 1, 645.

Ker je Z = 2.309 večji od 1.645, lahko ničelno hipotezo zavrnemo s podobnim sklepom, ki je bil omenjen zgoraj.

Metoda 3: Izračun P vrednosti

Naš cilj je identificirati P (vzorec srednja vrednost> = 190, ko je srednja vrednost = 180).

= P (Z> = (190– 180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0, 0084 = 0, 84%

Naslednja tabela za sklepanje izračunov p vrednosti kaže, da obstajajo potrjeni dokazi, da so povprečne mesečne donosnosti višje od 180:

p-vrednost


Sklepanje


manj kot 1%


Potrjeni dokazi, ki podpirajo alternativno hipotezo


med 1% in 5%


Močni dokazi, ki podpirajo alternativno hipotezo


med 5% in 10%


Slabi dokazi, ki podpirajo alternativno hipotezo


več kot 10%


Ni dokazov, ki bi podpirali alternativno hipotezo


Primer 2

Novi borzni posrednik (XYZ) trdi, da so njegove provizije za posredovanje nižje od plačil trenutnih borznih posrednikov (ABC). Podatki, ki so na voljo pri neodvisnem raziskovalnem podjetju, kažejo, da je povprečna in std-dev za vse odjemalce ABC posrednikov 18 USD oziroma 6 USD.

Vzame se vzorec 100 strank ABC, stroški posredovanja pa se izračunajo z novimi cenami posrednika XYZ. Če je povprečna vrednost vzorca 18, 75 USD in std-dev enak (6 USD), ali je mogoče sklepati na razliko v povprečnem računu za posredovanje med ABC in XYZ posrednikom ">

H 0 : Ničelna hipoteza: srednja vrednost = 18

H 1 : Alternativna hipoteza: pomeni 18 (to želimo dokazati.)

Območje zavrnitve: Z <= - Z 2.5 in Z> = Z 2.5 (ob predpostavki, da je stopnja pomembnosti 5%, na vsaki strani razdelite 2, 5).

Z = (povprečna vrednost vzorca - srednja vrednost) / (std-dev / sqrt (št. Vzorcev))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Ta izračunana vrednost Z spada med dve meji, ki sta določeni z:

- Z 2, 5 = -1, 96 in Z 2, 5 = 1, 96.

Iz tega izhaja, da ni dovolj dokazov, da bi bilo mogoče sklepati, da obstaja razlika med cenami vašega obstoječega posrednika in novega posrednika.

Lahko pa vrednost p = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, kar je večje od 0, 05 ali 5%, kar vodi do istega zaključka.

Grafično je predstavljeno z naslednjim:

Točke kritike za metodo hipotetičnega testiranja:

  • Statistična metoda, ki temelji na predpostavkah
  • Nagnjeni k napakam, kot je podrobno glede na alfa in beta napake
  • Razlaga p-vrednosti je lahko dvoumna, kar vodi v zmede rezultatov

Spodnja črta

Preizkušanje hipotez omogoča matematični model, da potrdi trditev ali idejo z določeno stopnjo zaupanja. Vendar pa ga, tako kot večino statističnih orodij in modelov, omejuje nekaj omejitev. Uporaba tega modela pri sprejemanju finančnih odločitev je treba obravnavati kritično in upoštevati vse odvisnosti. Za podobno analizo je vredno raziskati tudi alternativne metode, kot je Bayesian Inference.

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.
Priporočena
Pustite Komentar