Data Mining
Kaj je podatkovno rudarjenje?Pridobivanje podatkov je postopek, ki ga podjetja uporabljajo za pretvorbo surovih podatkov v koristne informacije. Z uporabo programske opreme za iskanje vzorcev v velikih serijah podatkov lahko podjetja izvedejo več o svojih kupcih, da razvijejo učinkovitejše tržne strategije, povečajo prodajo in zmanjšajo stroške. Izvajanje podatkov je odvisno od učinkovitega zbiranja podatkov, skladiščenja in računalniške obdelave.
Programi rudarjenja podatkov se uporabljajo za izdelavo modelov strojnega učenja, ki poganjajo aplikacije, vključno s tehnologijo iskalnikov in priporočevalnimi programi za spletna mesta.
Kako deluje podatkovni rudarjenje
Izvajanje podatkov vključuje raziskovanje in analizo velikih blokov informacij, da bi zbrali pomembne vzorce in trende. Uporablja se lahko na različne načine, kot so trženje baz podatkov, obvladovanje kreditnega tveganja, odkrivanje goljufij, filtriranje neželene pošte ali celo razkrivanje mnenj ali mnenj uporabnikov.
Postopek rudarjenja podatkov se razdeli na pet korakov. Najprej organizacije zbirajo podatke in jih naložijo v svoje podatkovne zbirke. Nato shranjujejo in upravljajo podatke bodisi na lastnih strežnikih bodisi v oblaku. Poslovni analitiki, vodstvene ekipe in strokovnjaki za informacijsko tehnologijo dostopajo do podatkov in določijo, kako jih želijo organizirati. Nato aplikacijska programska oprema razvrsti podatke glede na rezultate uporabnika in končni uporabnik podatke predstavi v obliki, ki jo je preprosto deliti, na primer v grafu ali tabeli.
Programska oprema za skladiščenje podatkov in rudarstvo
Programi za rudarjenje podatkov analizirajo razmerja in vzorce podatkov na podlagi tega, kar uporabniki zahtevajo. Na primer, podjetje lahko uporablja programsko opremo za rudarjenje podatkov za ustvarjanje razredov informacij. Za ponazoritev si predstavljajte, da želi restavracija s pomočjo podatkovnega rudarjenja določiti, kdaj naj ponudi določene specialitete. Pregleda informacije, ki jih je zbral, in ustvarja razrede glede na to, kdaj stranke obiščejo in kaj naročijo.
V drugih primerih rudarji podatkov poiščejo kopice informacij, ki temeljijo na logičnih odnosih, ali si ogledujejo povezave in zaporedne vzorce, s katerimi lahko sklepajo o trendih vedenja potrošnikov.
Skladiščenje je pomemben vidik pridobivanja podatkov. Skladiščenje je, ko podjetja centralizirajo svoje podatke v eno bazo podatkov ali program. S podatkovnim skladiščem lahko organizacija odcepi segmente podatkov, ki jih določeni uporabniki analizirajo in uporabljajo.
Vendar lahko analitiki v drugih primerih začnejo s podatki, ki jih želijo, in na podlagi teh specifikacij ustvarijo podatkovno skladišče. Ne glede na to, kako podjetja in drugi subjekti organizirajo svoje podatke, jih uporabljajo za podporo pri odločanju vodstva.
Primer podatkovnega rudarjenja
Trgovine z živili so dobro znani uporabniki tehnik rudarjenja podatkov. Mnogi supermarketi strankam ponujajo brezplačne kartice zvestobe, ki jim omogočajo dostop do znižanih cen, ki niso na voljo nečlanicam. Karte trgovinam olajšajo sledenje, kdo kaj kupuje, kdaj kupuje in po kakšni ceni. Po analizi podatkov lahko trgovine te podatke uporabijo, da kupcem ponudijo kupone, usmerjene v njihove nakupne navade, in se odločijo, kdaj bodo prodali izdelke ali kdaj jih prodali po polni ceni.
Pridobivanje podatkov je lahko zaskrbljujoče, če podjetje za dokazovanje določene hipoteze uporablja samo izbrane podatke, ki niso reprezentativni za celotno vzorčno skupino.
Ključni odvzemi
- Pridobivanje podatkov je postopek analiziranja velikega števila informacij, da se ugotovijo trendi in vzorci.
- Korporacije podatkov lahko korporacije uporabijo za vse, od spoznanja, kaj stranke zanima ali želijo kupiti, do odkrivanja goljufij in filtriranja neželene pošte.
- Programi rudarjenja podatkov razčlenjujejo vzorce in povezave v podatkih glede na to, kaj uporabniki zahtevajo ali posredujejo.