Što znači parametar generalizacije ?
Na ovom poslužitelju možete birati vrijednosti parametra generalizacije u rasponu 0.1 do 100. Početno odabrana vrijednost je 1 i nju preporučamo kao vaš prvi izbor.
Visoka vrijednost parametra znači da želite modele koji pokrivaju mnogo pozitivnih primjera čak iako je rezultat da modeli pokrivaju i nekoliko negativnih primjera i klasificiraju ih kao pozitivne. Drugim riječima, visoka vrijednost parametra generalizacije znači da će inducirani modeli pokrivati mnogo primjera, da će medju njima biti mnogo pozitivnih primjera ali i nešto negativnih koji ne bi trebali biti u toj grupi. Visoka vrijednost parametra se savjetuje za probleme kod kojih se mogu očekivati nekorektno klasificirani primjeri u ulaznoj datoteci (šum) kao i za probleme kod kojih ne postoji jaka povezanost ciljnog atributa sa vrijednošću ulaznih atributa.
Preporučljivo je za svaki problem napraviti nekoliko pokusa sa raznim vrijednostima parametra generalizacije. Pri tom se ne može očekivati da će se za svaku vrijednost inducirati drugačiji modeli. Jednaka vrijednost ovog parametra ne mora biti optimalna za različite probleme. Problemi sa mnogo primjera tipično zahtijevaju višu vrijednost. Razumijevanje konkretnog problema i induciranih modela može značajno olakškati izbor optimalne vrijednosti parametra generalizacije.
Početno odabrana vrijednost jednaka 1 će tipično dovesti do vrlo specifičnih modela. To znači da će njihova specifičnost biti vrlo visoka, često 100%, ali se zato može očekivati da će njihovo pokrivanje pozitivnih primjera biti vrlo skromno. Vrijednosti parametra generalizacije ispod 1 će rijetko inducirati drugačije korisne modele dok vrijednosti iznad 10 mogu inducirati vrlo općenite modele koji opisuju globalna svojstva veze ciljnog atributa i vrijednosti ulaznih atributa.
© 2001 LIS - Institut Rudjer Bošković
Posljednja izmjena: September 08 2015 09:28:57.