DBMS vs Data Mining
A DBMS (Database Management System) je cjeloviti sustav koji se koristi za upravljanje digitalnim bazama podataka koji omogućuje pohranu sadržaja baze podataka, kreiranje/održavanje podataka, pretraživanje i druge funkcionalnosti. S druge strane, Data Mining je područje računalne znanosti koje se bavi izvlačenjem dosad nepoznatih i zanimljivih informacija iz sirovih podataka. Obično se podaci koji se koriste kao ulaz za proces rudarenja podataka pohranjuju u baze podataka. Korisnici koji su skloni statistici koriste Data Mining. Oni koriste statističke modele za traženje skrivenih obrazaca u podacima. Rudari podataka zainteresirani su za pronalaženje korisnih odnosa između različitih elemenata podataka, što je u konačnici profitabilno za tvrtke.
DBMS
DBMS, koji se ponekad naziva samo upravitelj baze podataka, skup je računalnih programa koji je namijenjen za upravljanje (tj. organizaciju, pohranu i dohvaćanje) svih baza podataka koje su instalirane u sustavu (tj. tvrdom disku ili mreži). U svijetu postoje različite vrste sustava za upravljanje bazama podataka, a neki od njih su dizajnirani za pravilno upravljanje bazama podataka konfiguriranih za posebne svrhe. Najpopularniji komercijalni sustavi za upravljanje bazama podataka su Oracle, DB2 i Microsoft Access. Svi ovi proizvodi pružaju sredstva za dodjelu različitih razina povlastica za različite korisnike, omogućujući da DBMS centralno kontrolira jedan administrator ili da se dodijeli nekoliko različitih osoba. Postoje četiri važna elementa u svakom sustavu upravljanja bazom podataka. Oni su jezik modeliranja, strukture podataka, jezik upita i mehanizam za transakcije. Jezik modeliranja definira jezik svake baze podataka koja se nalazi u DBMS-u. Trenutačno je u praksi nekoliko popularnih pristupa kao što su hijerarhijski, mrežni, relacijski i objektni. Strukture podataka pomažu organizirati podatke kao što su pojedinačni zapisi, datoteke, polja i njihove definicije te objekte kao što su vizualni mediji. Jezik upita za podatke održava sigurnost baze podataka praćenjem podataka za prijavu, prava pristupa različitim korisnicima i protokola za dodavanje podataka u sustav. SQL je popularan upitni jezik koji se koristi u sustavima upravljanja relacijskim bazama podataka. Konačno, mehanizam koji omogućuje transakcije pomaže istodobnosti i višestrukosti. Taj mehanizam će osigurati da isti zapis neće biti modificiran od strane više korisnika u isto vrijeme, čime se održava integritet podataka netaknutim. Osim toga, DBMS također nudi sigurnosne kopije i druge mogućnosti.
Iskopavanje podataka
Rudarenje podataka također je poznato kao Otkrivanje znanja u podacima (KDD). Kao što je gore spomenuto, radi se o području računalne znanosti koje se bavi izvlačenjem dosad nepoznatih i zanimljivih informacija iz sirovih podataka. Zbog eksponencijalnog rasta podataka, posebno u područjima kao što je poslovanje, rudarenje podataka postalo je vrlo važan alat za pretvaranje ovog velikog bogatstva podataka u poslovnu inteligenciju, jer je ručno izdvajanje uzoraka postalo naizgled nemoguće u posljednjih nekoliko desetljeća. Na primjer, trenutno se koristi za razne aplikacije kao što su analiza društvenih mreža, otkrivanje prijevara i marketing. Data mining se obično bavi sljedeća četiri zadatka: klasteriranje, klasifikacija, regresija i pridruživanje. Grupiranje je identificiranje sličnih grupa iz nestrukturiranih podataka. Klasifikacija su pravila učenja koja se mogu primijeniti na nove podatke i obično će uključivati sljedeće korake: pretprocesiranje podataka, dizajniranje modeliranja, učenje/odabir značajki i evaluacija/potvrda. Regresija je pronalaženje funkcija s minimalnom pogreškom za modeliranje podataka. A asocijacija traži odnose između varijabli. Rudarenje podataka obično se koristi za odgovaranje na pitanja kao što su koji su glavni proizvodi koji bi mogli pomoći u postizanju visokog profita sljedeće godine u Wal-Martu?
Koja je razlika između DBMS-a i rudarenja podataka?
DBMS je potpuni sustav za smještaj i upravljanje skupom digitalnih baza podataka. Međutim, Data Mining je tehnika ili koncept u računalnoj znanosti, koji se bavi izvlačenjem korisnih i prethodno nepoznatih informacija iz neobrađenih podataka. U većini slučajeva ti su neobrađeni podaci pohranjeni u vrlo velikim bazama podataka. Stoga rudari podataka koriste postojeće funkcionalnosti DBMS-a za rukovanje, upravljanje i čak pretprocesiranje sirovih podataka prije i tijekom procesa rudarenja podataka. Međutim, samo DBMS sustav ne može se koristiti za analizu podataka. No, neki DBMS trenutno imaju ugrađene alate ili mogućnosti za analizu podataka.