Razlika između RDBMS-a i Hadoopa

Sadržaj:

Razlika između RDBMS-a i Hadoopa
Razlika između RDBMS-a i Hadoopa

Video: Razlika između RDBMS-a i Hadoopa

Video: Razlika između RDBMS-a i Hadoopa
Video: Опыты по химии. Получение этилена и опыты с ним 2024, Srpanj
Anonim

Ključna razlika između RDBMS-a i Hadoopa je u tome što RDBMS pohranjuje strukturirane podatke dok Hadoop pohranjuje strukturirane, polustrukturirane i nestrukturirane podatke.

RDBMS je sustav za upravljanje bazom podataka temeljen na relacijskom modelu. Hadoop je softver za pohranu podataka i pokretanje aplikacija na klasterima uobičajenog hardvera.

Slika
Slika

Što je RDBMS?

RDBMS je kratica za Sustav upravljanja relacijskom bazom podataka temeljen na relacijskom modelu. U RDBMS-u, tablice se koriste za pohranu podataka, a ključevi i indeksi pomažu u povezivanju tablica. Tablica je skup elemenata podataka, a oni su entiteti. Sadrži retke i stupce. Redovi predstavljaju jedan unos u tablici. Stupci predstavljaju atribute.

Na primjer, baza podataka o prodaji može imati entitete kupaca i proizvoda. Kupac može imati atribute kao što su customer_id, name, address, phone_no. Stavka može imati atribute kao što su product_id, name itd. Primarni ključ tablice kupaca je customer_id dok je primarni ključ tablice proizvoda product_id. Postavljanje product_id-a u tablicu kupaca kao stranog ključa povezuje ova dva entiteta. Isto tako, tablice su međusobno povezane. Oni pružaju integritet podataka, normalizaciju i još mnogo toga. Neki od uobičajenih RDBMS-a su MySQL, MSSQL i Oracle. Oni koriste SQL za upite.

Što je Hadoop?

Hadoop je okvir otvorenog koda Apache napisan u Javi. Pomaže u pohrani i obradi velike količine podataka u klasterima računala pomoću jednostavnih modela programiranja. Glavni cilj Hadoopa je pohraniti i obraditi Big Data, što se odnosi na veliku količinu složenih podataka. Propusnost Hadoopa, što je sposobnost obrade količine podataka u određenom vremenskom razdoblju, je visoka.

Razlika između RDBMS-a i Hadoopa
Razlika između RDBMS-a i Hadoopa

Postoje četiri modula u Hadoop arhitekturi. To su Hadoop common, YARN, Hadoop Distributed File System (HDFS) i Hadoop MapReduce. Zajednički modul sadrži Java biblioteke i pomoćne programe. Također ima datoteke za pokretanje Hadoopa. Hadoop YARN obavlja raspoređivanje poslova i upravljanje resursima klastera.

Nadalje, Hadoop Distributed File System (HDFS) je Hadoop sustav za pohranu. Koristi master-slave arhitekturu. Glavni čvor je NameNode i upravlja meta podacima datotečnog sustava. Ostala računala su slave čvorovi ili DataNodes. Oni pohranjuju stvarne podatke. S druge strane, Hadoop MapReduce vrši distribuirano izračunavanje. Ima algoritme za obradu podataka. U HDFS-u, glavni čvor ima praćenje poslova. Izvodi poslove smanjenja karte na podređenim čvorovima. Za svaki podređeni čvor postoji Task Tracker za dovršetak obrade podataka i slanje rezultata natrag u glavni čvor. Općenito, Hadoop pruža golemu pohranu podataka s velikom snagom obrade.

Koja je razlika između RDBMS-a i Hadoopa?

RDBMS vs Hadoop

RDBMS je sistemski softver za kreiranje i upravljanje bazama podataka koje se temelje na relacijskom modelu. Hadoop je zbirka softvera otvorenog koda koji povezuje mnoga računala za rješavanje problema koji uključuju veliku količinu podataka i računanja.
Raznolikost podataka
RDBMS pohranjuje strukturirane podatke. Hadoop pohranjuje strukturirane, polustrukturirane i nestrukturirane podatke.
Pohrana podataka
RDBMS pohranjuje prosječnu količinu podataka. Hadoop pohranjuje veliku količinu podataka nego RDBMS.
Brzina
U RDBMS-u, čitanja su brza. U Hadoopu, čitanje i pisanje su brzi.
Skalabilnost
RDBMS ima vertikalnu skalabilnost. Hadoop ima horizontalnu skalabilnost.
Hardver
RDBMS koristi vrhunske poslužitelje. Hadoop koristi standardni hardver.
Propusnost
RDBMS propusnost je veća. Hadoop propusnost je manja.

Sažetak – RDBMS vs Hadoop

Ovaj članak govori o razlici između RDBMS-a i Hadoopa. Ključna razlika između RDBMS-a i Hadoopa je u tome što RDBMS pohranjuje strukturirane podatke dok Hadoop pohranjuje strukturirane, polustrukturirane i nestrukturirane podatke.

Preporučeni: