Neparametrična statistika
Kaj so neparametrične statistike?Neparametrična statistika se nanaša na statistično metodo, pri kateri podatki niso potrebni za normalno distribucijo. Neparametrična statistika uporablja podatke, ki so pogosto zaporedni, kar pomeni, da se ne zanaša na številke, temveč na razvrstitev ali vrstni red. Na primer, raziskovanje, ki prikazuje želje potrošnikov, ki segajo od všeč do neljubih, bi se štelo za redne podatke.
Neparametrična statistika vključuje neparametrične opisne statistike, statistične modele, sklepanje in statistične teste. Struktura modelov neparametričnih modelov ni določena vnaprej, temveč je določena iz podatkov. Izraz neparametrični ne pomeni, da takšni modeli popolnoma nimajo parametrov, temveč da sta število in narava parametrov prožna in ni vnaprej določena. Histogram je primer neparametrične ocene porazdelitve verjetnosti.
Razumevanje neparametrične statistike
V statistiki parametrična statistika vključuje parametre, kot so povprečje, mediana, standardni odklon, variance itd. Ta oblika statistike uporablja opažene podatke za oceno parametrov porazdelitve. V parametrični statistiki se domneva, da podatki ustrezajo normalni porazdelitvi z neznanimi parametri μ (povprečna populacija) in σ 2 (odstopanje populacije), ki se nato ocenijo z uporabo vzorčne povprečja in odstopanja vzorca.
Neparametrična statistika ne predvideva o velikosti vzorca ali o tem, ali so opaženi podatki količinski.
Neparametrična statistika ne predvideva, da so podatki črpani iz običajne distribucije. Namesto tega se oblika porazdelitve ocenjuje s to obliko statističnega merjenja. Medtem ko obstaja veliko situacij, v katerih je mogoče predvideti normalno distribucijo, obstaja tudi nekaj scenarijev, v katerih ni mogoče določiti, ali bodo podatki normalno distribuirani.
Primeri neparametrične statistike
V prvem primeru razmislite o raziskovalcu, ki želi, da se ocena števila dojenčkov v Severni Ameriki, rojenih z rjavimi očmi, lahko odloči za vzorec 150.000 dojenčkov in izvede analizo nabora podatkov. Meritev, ki jo dobijo, bo uporabljena za oceno celotne populacije dojenčkov z rjavimi očmi, rojenih naslednje leto.
Za drugi primer razmislite o drugačnem raziskovalcu, ki želi vedeti, ali je odhod v posteljo zgodaj ali pozno povezan s tem, kako pogosto nekdo zboli. Ob predpostavki, da je bil vzorec izbran naključno iz populacije, se lahko šteje, da je porazdelitev velikosti vzorca po pogostosti bolezni normalna. Vendar pa za eksperiment, ki meri odpornost človeškega telesa na sev bakterij, ni mogoče domnevati, da ima normalno porazdelitev.
To je zato, ker so naključno izbrani vzorčni podatki lahko odporni proti sevu. Po drugi strani pa, če raziskovalec upošteva dejavnike, kot so genetska sestava in etnična pripadnost, lahko ugotovi, da velikost vzorca, izbrana s temi značilnostmi, morda ni odporna na sev. Zato ne moremo predvideti normalne porazdelitve.
Ta metoda je uporabna, kadar podatki nimajo jasne numerične interpretacije in je najbolje uporabiti pri podatkih, ki imajo razvrščanje. Na primer, test osebnostnega preizkusa ima lahko razvrstitev svojih meritev tako, da se močno ne strinja, ne strinja, ravnodušen, strinja in se močno strinja. V tem primeru je treba uporabiti neparametrične metode.
Posebna vprašanja
Neparametrična statistika je pridobila nastop zaradi svoje enostavne uporabe. Ko je potreba po parametrih olajšana, podatki postanejo bolj uporabni za večje število testov. Ta vrsta statistike se lahko uporablja brez povprečne velikosti, velikosti vzorca, standardnega odklona ali ocene drugih povezanih parametrov, če nobena od teh informacij ni na voljo.
Ker neparametrična statistika daje manj predpostavk o vzorčnih podatkih, je njegova uporaba širšega obsega kot parametrična statistika. V primerih, ko je parametrično testiranje primernejše, bodo neparametrične metode manj učinkovite. To je zato, ker imajo rezultati, dobljeni iz neparametrične statistike, nižjo stopnjo zaupanja, kot če bi bili rezultati dobljeni s pomočjo parametrične statistike.
Ključni odvzemi
- Neparametrične statistike so preproste za uporabo, vendar ne ponujajo natančnosti drugih statističnih modelov.
- Ta vrsta analize je najprimernejša pri preučevanju vrstnega reda nečesa, pri čemer pa bodo rezultati, čeprav se numerični podatki spremenijo, verjetno ostali enaki.