Data Science
Kaj je podatkovna znanost?Podatkovna znanost ponuja pomembne informacije, ki temeljijo na velikih količinah zapletenih podatkov ali velikih podatkov. Podatkovna znanost ali znanost, ki temelji na podatkih, združuje različna področja dela v statistiki in računanju za razlago podatkov za namene odločanja.
Razumevanje podatkov o znanosti
Podatki se črpajo iz različnih sektorjev, kanalov in platform, vključno z mobilnimi telefoni, socialnimi mediji, spletnimi mesti za e-trgovino, raziskavami v zdravstvu in iskanjem po internetu. Povečanje količine razpoložljivih podatkov je odprlo vrata v novo področje preučevanja, ki temelji na velikih podatkih - množični nabor podatkov, ki prispevajo k ustvarjanju boljših operativnih orodij v vseh sektorjih.
Neprestano naraščajoč dostop do podatkov je mogoč zaradi napredka tehnologije in tehnik zbiranja. Posameznike, ki kupujejo vzorce in vedenje, lahko spremljate in napovedujete na podlagi zbranih informacij.
Vendar so vedno večji podatki nestrukturirani in zahtevajo razčlenitev za učinkovito odločanje. Ta postopek je za podjetja zahteven in dolgotrajen - torej nastanek podatkovne znanosti.
Podatkovna znanost ali znanost, ki temelji na podatkih, uporablja velike podatke in strojno učenje za interpretacijo podatkov za namene odločanja.
Kratka zgodovina znanosti o podatkih
Izraz podatkovna znanost je bil večji del zadnjih 30 let in je bil prvotno uporabljen kot nadomestek za "računalništvo" leta 1960. Približno 15 let pozneje je bil izraz uporabljen za določanje raziskovanja metod obdelave podatkov, ki se uporabljajo v različnih aplikacije. Leta 2001 je bila podatkovna znanost uvedena kot samostojna disciplina. Harvard Business Review je leta 2012 objavil članek, v katerem opisuje vlogo podatkovnega znanstvenika kot "najbolj seksi zaposlitve 21. stoletja."
Ključni odvzemi
- Napredek tehnologije, interneta, družbenih medijev in uporabe tehnologije so povečali dostop do velikih podatkov.
- Podatkovna znanost uporablja tehnike, kot sta strojno učenje in umetna inteligenca, za pridobivanje pomembnih informacij in za napovedovanje prihodnjih vzorcev in vedenj.
- Področje znanosti o naraščanju podatkov narašča, ko napreduje tehnologija in tehnike za zbiranje in analiziranje velikih podatkov postajajo bolj izpopolnjene.
Kako se uporablja podatkovna znanost
Podatkovna znanost vključuje orodja iz več disciplin za zbiranje nabora podatkov, obdelavo in pridobivanje vpogledov iz nabora podatkov, izvleče smiselne podatke iz nabora in jih razlaga za namene odločanja. Disciplinska področja, ki sestavljajo področje znanosti o podatkih, vključujejo rudarstvo, statistiko, strojno učenje, analitiko in programiranje.
Izvajanje podatkov uporablja algoritme za zapleteni nabor podatkov, da razkrije vzorce, ki se nato uporabljajo za pridobivanje uporabnih in ustreznih podatkov iz nabora. Statistični ukrepi ali napovedna analitika uporabljajo te pridobljene podatke za merjenje dogodkov, ki se bodo verjetno zgodili v prihodnosti, na podlagi tega, kar kažejo podatki, ki so se zgodili v preteklosti.
Strojno učenje je orodje za umetno inteligenco, ki obdeluje množične količine podatkov, ki jih človek v življenju ne bi mogel obdelati. Strojno učenje izpopolnjuje model odločanja, predstavljen s prediktivno analitiko, tako da primerja verjetnost, da se dogodek zgodi s tistim, kar se je dejansko zgodilo v predvidenem času.
S pomočjo analitike podatkovni analitik z algoritmi zbira in obdeluje strukturirane podatke iz stopnje strojnega učenja. Analitik tolmači, pretvori in povzame podatke v koheziven jezik, ki ga lahko razume skupina, ki sprejema odločitve. Podatkovna znanost se uporablja v praktično vseh kontekstih, in ko se bo vloga podatkovnega znanstvenika razvijala, se bo področje razširilo na področje arhitekture podatkov, podatkovnega inženiringa in upravljanja podatkov.
Hitro dejstvo
Po podatkih IBM-a naj bi se do leta 2020 povpraševanje po znanstvenikih po podatkih povečalo za 28%.
Določen znanstvenik
Znanstvenik podatkov zbira, analizira in interpretira velike količine podatkov, v večini primerov za izboljšanje poslovanja podjetja. Strokovnjaki, ki se ukvarjajo s podatki, razvijajo statistične modele, ki analizirajo podatke in zaznavajo vzorce, trende in razmerja v naborih podatkov. Te informacije se lahko uporabijo za napovedovanje vedenja potrošnikov ali za prepoznavanje poslovnih in operativnih tveganj. Znanstvenik podatkov je pogosto pripovedovalec, ki voditeljem odločanja predstavi vpogled v podatke na način, ki je razumljiv in uporaben za reševanje problemov.
Data Science Today
Podjetja uporabljajo velike podatke in znanost o podatkih v vsakodnevnih dejavnostih, da bi potrošnikom prinesla vrednost. Bančne institucije izkoriščajo velike podatke, da izboljšajo svoje uspehe pri odkrivanju goljufij. Podjetja za upravljanje premoženja uporabljajo velike podatke za napovedovanje verjetnosti premika cene vrednostnega papirja v določenem času navzgor ali navzdol.
Podjetja, kot je Netflix, pridobivajo velike podatke, da določijo, katere izdelke dostaviti svojim uporabnikom. Netflix uporablja tudi algoritme za ustvarjanje prilagojenih priporočil za uporabnike na podlagi njihove zgodovine ogledov. Podatkovna znanost se razvija hitro, njene aplikacije pa bodo še naprej spreminjale življenje v prihodnost.
Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.