Razlika između rudarenja podataka i OLAP-a

Razlika između rudarenja podataka i OLAP-a
Razlika između rudarenja podataka i OLAP-a

Video: Razlika između rudarenja podataka i OLAP-a

Video: Razlika između rudarenja podataka i OLAP-a
Video: REVAN - THE COMPLETE STORY 2024, Studeni
Anonim

Podatkovno rudarenje u odnosu na OLAP

I rudarenje podataka i OLAP dvije su uobičajene tehnologije poslovne inteligencije (BI). Poslovna inteligencija odnosi se na računalne metode za prepoznavanje i izdvajanje korisnih informacija iz poslovnih podataka. Data mining je područje računalne znanosti koje se bavi izvlačenjem zanimljivih uzoraka iz velikih skupova podataka. Kombinira mnoge metode od umjetne inteligencije, statistike i upravljanja bazom podataka. OLAP (online analitička obrada) kao što naziv sugerira je kompilacija načina postavljanja upita višedimenzionalnim bazama podataka.

Rudarenje podataka također je poznato kao Otkrivanje znanja u podacima (KDD). Kao što je gore spomenuto, to je polje računalnih znanosti koje se bavi izvlačenjem prethodno nepoznatih i zanimljivih informacija iz neobrađenih podataka. Zbog eksponencijalnog rasta podataka, posebno u područjima kao što je poslovanje, rudarenje podataka postalo je vrlo važan alat za pretvaranje ovog velikog bogatstva podataka u poslovnu inteligenciju, jer je ručno izdvajanje uzoraka postalo naizgled nemoguće u posljednjih nekoliko desetljeća. Na primjer, trenutno se koristi za razne aplikacije kao što su analiza društvenih mreža, otkrivanje prijevara i marketing. Data mining se obično bavi sljedeća četiri zadatka: klasteriranje, klasifikacija, regresija i pridruživanje. Grupiranje je identificiranje sličnih grupa iz nestrukturiranih podataka. Klasifikacija su pravila učenja koja se mogu primijeniti na nove podatke i obično će uključivati sljedeće korake: pretprocesiranje podataka, dizajniranje modeliranja, učenje/odabir značajki i evaluacija/potvrda. Regresija je pronalaženje funkcija s minimalnom pogreškom za modeliranje podataka. A asocijacija traži odnose između varijabli. Rudarenje podataka obično se koristi za odgovaranje na pitanja poput toga koji su glavni proizvodi koji bi mogli pomoći u postizanju visokog profita sljedeće godine u Wal-Martu.

OLAP je klasa sustava koja daje odgovore na višedimenzionalne upite. Obično se OLAP koristi za marketing, proračun, predviđanje i slične aplikacije. Podrazumijeva se da su baze podataka koje se koriste za OLAP konfigurirane za složene i ad-hoc upite s ciljem brze izvedbe. Obično se matrica koristi za prikaz izlaza OLAP-a. Redovi i stupci formirani su prema dimenzijama upita. Oni često koriste metode agregacije na više tablica za dobivanje sažetaka. Na primjer, može li se pomoću njega saznati ovogodišnja prodaja u Wal-Martu u usporedbi s prošlom godinom? Kakva su predviđanja o prodaji u sljedećem kvartalu? Što se može reći o trendu gledajući postotnu promjenu?

Iako je očito da su rudarenje podataka i OLAP slični jer rade na podacima kako bi dobili inteligenciju, glavna razlika dolazi u tome kako rade na podacima. OLAP alati pružaju višedimenzionalnu analizu podataka i daju sažetke podataka, ali suprotno tome, rudarenje podataka fokusira se na omjere, obrasce i utjecaje u skupu podataka. To je OLAP odnos s agregacijom, koji se svodi na rad podataka putem "dodavanja", ali rudarenje podataka odgovara "dijeljenju". Druga značajna razlika je da dok alati za rudarenje podataka modeliraju podatke i vraćaju pravila koja se mogu izvršiti, OLAP će provoditi tehnike usporedbe i kontrasta duž poslovne dimenzije u stvarnom vremenu.

Preporučeni: