Glavni » algoritmično trgovanje » Neparametrična statistika

Neparametrična statistika

Kaj so neparametrične statistike?

Neparametrična statistika se nanaša na statistično metodo, pri kateri podatki niso potrebni za normalno distribucijo. Neparametrična statistika uporablja podatke, ki so pogosto zaporedni, kar pomeni, da se ne zanaša na številke, temveč na razvrstitev ali vrstni red. Na primer, raziskovanje, ki prikazuje želje potrošnikov, ki segajo od všeč do neljubih, bi se štelo za redne podatke.

Neparametrična statistika vključuje neparametrične opisne statistike, statistične modele, sklepanje in statistične teste. Struktura modelov neparametričnih modelov ni določena vnaprej, temveč je določena iz podatkov. Izraz neparametrični ne pomeni, da takšni modeli popolnoma nimajo parametrov, temveč da sta število in narava parametrov prožna in ni vnaprej določena. Histogram je primer neparametrične ocene porazdelitve verjetnosti.

Razumevanje neparametrične statistike

V statistiki parametrična statistika vključuje parametre, kot so povprečje, mediana, standardni odklon, variance itd. Ta oblika statistike uporablja opažene podatke za oceno parametrov porazdelitve. V parametrični statistiki se domneva, da podatki ustrezajo normalni porazdelitvi z neznanimi parametri μ (povprečna populacija) in σ ² (odstopanje populacije), ki se nato ocenijo z uporabo vzorčne povprečja in odstopanja vzorca.

Neparametrična statistika ne predvideva o velikosti vzorca ali o tem, ali so opaženi podatki količinski.

Neparametrična statistika ne predvideva, da so podatki črpani iz običajne distribucije. Namesto tega se oblika porazdelitve ocenjuje s to obliko statističnega merjenja. Medtem ko obstaja veliko situacij, v katerih je mogoče predvideti normalno distribucijo, obstaja tudi nekaj scenarijev, v katerih ni mogoče določiti, ali bodo podatki normalno distribuirani.

Primeri neparametrične statistike

V prvem primeru razmislite o raziskovalcu, ki želi, da se ocena števila dojenčkov v Severni Ameriki, rojenih z rjavimi očmi, lahko odloči za vzorec 150.000 dojenčkov in izvede analizo nabora podatkov. Meritev, ki jo dobijo, bo uporabljena za oceno celotne populacije dojenčkov z rjavimi očmi, rojenih naslednje leto.

Za drugi primer razmislite o drugačnem raziskovalcu, ki želi vedeti, ali je odhod v posteljo zgodaj ali pozno povezan s tem, kako pogosto nekdo zboli. Ob predpostavki, da je bil vzorec izbran naključno iz populacije, se lahko šteje, da je porazdelitev velikosti vzorca po pogostosti bolezni normalna. Vendar pa za eksperiment, ki meri odpornost človeškega telesa na sev bakterij, ni mogoče domnevati, da ima normalno porazdelitev.

To je zato, ker so naključno izbrani vzorčni podatki lahko odporni proti sevu. Po drugi strani pa, če raziskovalec upošteva dejavnike, kot so genetska sestava in etnična pripadnost, lahko ugotovi, da velikost vzorca, izbrana s temi značilnostmi, morda ni odporna na sev. Zato ne moremo predvideti normalne porazdelitve.

Ta metoda je uporabna, kadar podatki nimajo jasne numerične interpretacije in je najbolje uporabiti pri podatkih, ki imajo razvrščanje. Na primer, test osebnostnega preizkusa ima lahko razvrstitev svojih meritev tako, da se močno ne strinja, ne strinja, ravnodušen, strinja in se močno strinja. V tem primeru je treba uporabiti neparametrične metode.

Posebna vprašanja

Neparametrična statistika je pridobila nastop zaradi svoje enostavne uporabe. Ko je potreba po parametrih olajšana, podatki postanejo bolj uporabni za večje število testov. Ta vrsta statistike se lahko uporablja brez povprečne velikosti, velikosti vzorca, standardnega odklona ali ocene drugih povezanih parametrov, če nobena od teh informacij ni na voljo.

Ker neparametrična statistika daje manj predpostavk o vzorčnih podatkih, je njegova uporaba širšega obsega kot parametrična statistika. V primerih, ko je parametrično testiranje primernejše, bodo neparametrične metode manj učinkovite. To je zato, ker imajo rezultati, dobljeni iz neparametrične statistike, nižjo stopnjo zaupanja, kot če bi bili rezultati dobljeni s pomočjo parametrične statistike.

Ključni odvzemi

Neparametrične statistike so preproste za uporabo, vendar ne ponujajo natančnosti drugih statističnih modelov.
Ta vrsta analize je najprimernejša pri preučevanju vrstnega reda nečesa, pri čemer pa bodo rezultati, čeprav se numerični podatki spremenijo, verjetno ostali enaki.

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Razumevanje porazdelitve T Porazdelitev AT je vrsta verjetnostne funkcije, ki je primerna za oceno populacijskih parametrov za majhne velikosti vzorca ali neznane variacije. več Kako deluje porazdelitev vzorčenja Porazdelitev vzorčenja je verjetnostna porazdelitev statistike, dobljena z velikim številom vzorcev, odvzetih iz določene populacije. več Kako se uporablja Wilcoxon test Wilcoxon test, ki se nanaša na test Rank Sum ali test s podpisanim Rankom, je neparametrični test, ki primerja dve seznanjeni skupini. več Neparametrična metoda Neparametrična metoda se nanaša na vrsto statistike, za katero ni potrebno, da podatki, ki se analizirajo, izpolnjujejo določene predpostavke ali parametre. več Opredelitev T-testa T-test je vrsta inferencialne statistike, ki se uporablja za ugotavljanje, ali obstaja pomembna razlika med sredstvi dveh skupin, ki sta lahko v določenih značilnostih povezani. več Interval zaupanja Interval zaupanja meri verjetnost, da bo populacijski parameter padel med dve nastavljeni vrednosti. več partnerskih povezav

← Definicija nazivne stopnje donosa

Minimalno mesečno plačilo →

Priporočena

Pustite Komentar