Razumijevanje problema
Određivanje ciljeva
Prvi važan korak u čitavom procesu obrade podataka jest razumijevanje potrebe da se ovaj proces primjeni, odnosno razumijevanje problema koji želimo riješiti. To je konačni cilj obrade podataka. Konkretni problemi mogu biti vrlo različiti: optimiranje odziva kupaca u planiranju nove marketinške kampanje, prevencija zloupotrebe kreditnih kartica, detekcija hakerskih upada na računalni sistem, itd. Da bi mogli efikasno riješiti problem moramo:- razumjeti problem iz perspektive domene, t.j. ograničenja u njegovom rješavanju;
- otkriti važne čimbenike koji mogu utjecati na konačni rezultat obrade podataka.
Definiranje kriterija uspješnosti
Nakon što je sam problem definiran, bitno je i odrediti što predstavlja kriterij uspješnosti procesa obrade podataka. Taj kriterij može biti kvantitativno izražen: npr. povećanje broja detektiranih devijacija, povećan broj kupaca nekog produkta, povećan broj točnih dijagnoza pacijenata. Kriteriji mogu biti i subjektivni ili kvalitativni. U tom je slučaju uobičajeno da stručnjak iz čije domene problem dolazi sam ocijeni rezultate procesa obrade podataka s obzirom na postojeća saznanja u području. U tom slučaju rezultati moraju sadržavati neki novi i korisni uvid u odnose varijabli problema, dostupnih kroz skup podataka na raspoloaganju za obradu.Ocjena situacije
Definirajući osnovni problem i kriterije njegova uspješnog rješavanja, dolazimo na korak u kojem je potrebno ocijeniti sve praktične aspekte procesa obrade podataka.- koji je nivo znanja o problemu;
- budući da su podaci centralni dio procesa obrade podataka potrebno je provjeriti da li podaci sadrže dovoljno informacija za rješavanje problema;
- korisna je praksa prethodnog definiranja specifične terminologije (vezane uz konkretni problem ali i uz planirani proces obrade podataka), da bi se osigurala kvalitetnija komunikacija između stručnjaka za područje problema i stručnjaka za proces obrade podataka;
- poželjno je napraviti okvirnu procjenu trajanja odnosno koštanja projekta obrade podataka, te očekivanog dobitka od uspješno provedenog projekta, da bi se ocijenila njegova opravdanost.
Određivanje ciljeva procesa obrade podataka
Prethodno definirani problem i kriterij njegova uspješnog rješavanja potrebno je prevesti u terminologiju procesa obrade podataka. Ciljevi obrade podataka razlikuju se od onih specificiranih iz perspektive domene konkretnog problema. Kao ilustracija poslužit će nam slijedeća tablica:cilj iz perspektive domene problema | cilj obrade podataka |
povećanje prodaje produkta | odrediti svojstva kupaca s obzirom na njihovu kupovnu moć | prevencija zloupotrebe kartica |
pronaći kritične modele ponašanja prilikom zloupotrebe kreditnih kartica ili napraviti algoritam za automatsku detekciju zloupotrebe kreditnih kartica |
Definiranje problema i ciljeva obrade podataka direktno je vezano uz osnovnu podjelu na tipove problema iz perspektive procesa obrade podataka. Ovdje ih samo navodimo, dok je njihov detaljniji opis dan u poglavlju Modeliranje.
- opis i sumarni pregled podataka
- klasifikacija
- predikcija
- otkrivanje veza (povezanosti varijabli, asocijacija)
- analiza međuovisnosti
- segmentiranje
Konačni izlazni rezultat procesa obrade podataka razlikuje se zavisno od tipa problema i tehnika koje se kasnije odabiru za njihovo rješavanje. Poželjno je u tom smislu definirati željeni oblik konačnog rezultata procesa obrade podataka. Osim toga poželjno je definirati i mjeru uspješnosti takvog rješenja: npr. određeni minimalni nivo prediktivne točnosti rješenja (klasifikacijski ili predikcijski problem), ili pak definirati specifični kriterij za ocjenu kvalitete (odnosno informativnosti) modela, ukoliko se od rješenja traži novi uvid u odnose varijabli iz skupa podataka predviđenog za rješavanje problema.
Projektni plan
Svi prethodni koraci mogu poslužiti za stvaranje okvirnog plana za izvedbu procesa obrade podataka. U tom se planu predviđaju pojedine aktivnosti (dijelovi procesa) i rezultati na kraju tih aktivnosti, te tehnike koje treba primijeniti u pojedinim koracima procesa.© 2001 LIS - Institut Rudjer Bošković
Posljednja izmjena: September 08 2015 09:28:57.