Ključna razlika između klasifikacije i regresijskog stabla je da su u klasifikaciji zavisne varijable kategoričke i nesređene dok su u regresiji zavisne varijable kontinuirane ili uređene cijele vrijednosti.
Klasifikacija i regresija su tehnike učenja za stvaranje modela predviđanja iz prikupljenih podataka. Obje tehnike su grafički prikazane kao klasifikacijska i regresijska stabla, odnosno dijagrami toka s podjelom podataka nakon svakog koraka, odnosno „grananja“u stablu. Ovaj proces se naziva rekurzivno particioniranje. Polja kao što je rudarstvo koriste ove tehnike učenja klasifikacije i regresije. Ovaj se članak fokusira na klasifikacijsko stablo i regresijsko stablo.
Što je klasifikacija?
Klasifikacija je tehnika koja se koristi da bi se došlo do sheme koja prikazuje organizaciju podataka počevši od prethodne varijable. Zavisne varijable su ono što klasificira podatke.
Slika 01: Data Mining
Klasifikacijsko stablo počinje nezavisnom varijablom, koja se grana u dvije grupe kako je određeno postojećim ovisnim varijablama. Namijenjen je razjašnjavanju odgovora u obliku kategorizacije do kojih dovode zavisne varijable.
Što je regresija
Regresija je metoda predviđanja koja se temelji na pretpostavljenoj ili poznatoj numeričkoj izlaznoj vrijednosti. Ova izlazna vrijednost je rezultat niza rekurzivnih particija, pri čemu svaki korak ima jednu numeričku vrijednost i drugu grupu zavisnih varijabli koje se granaju na drugi par kao što je ovaj.
Regresijsko stablo počinje s jednom ili više prekursorskih varijabli i završava jednom konačnom izlaznom varijablom. Zavisne varijable su ili kontinuirane ili diskretne numeričke varijable.
Koja je razlika između klasifikacije i regresije?
Klasifikacija vs regresija |
|
Model stabla gdje ciljna varijabla može uzeti diskretni skup vrijednosti. | Model stabla gdje ciljna varijabla može poprimiti kontinuirane vrijednosti obično realne brojeve. |
Ovisna varijabla | |
Za klasifikacijsko stablo, zavisne varijable su kategoričke. | Za regresijsko stablo, zavisne varijable su numeričke. |
Vrijednosti | |
Ima postavljenu količinu neuređenih vrijednosti. | Ima diskretne, ali poredane vrijednosti ili indiskretne vrijednosti. |
Svrha izgradnje | |
Svrha konstruiranja regresijskog stabla je prilagoditi regresijski sustav svakoj grani determinante na način da se pojavi očekivana izlazna vrijednost. | Klasifikacijsko stablo se grana kako je određeno ovisnom varijablom izvedenom iz prethodnog čvora. |
Sažetak – Klasifikacija vs regresija
Regresijska i klasifikacijska stabla korisne su tehnike za mapiranje procesa koji ukazuje na proučavani ishod, bilo u klasifikaciji ili jednoj numeričkoj vrijednosti. Razlika između klasifikacijskog stabla i regresijskog stabla je njihova zavisna varijabla. Klasifikacijska stabla imaju ovisne varijable koje su kategoričke i neuređene. Regresijska stabla imaju ovisne varijable koje su kontinuirane vrijednosti ili uređene cijele vrijednosti.