Osnovna stranica





Kako treba izgledati datoteka ? (četvrti dio)

vrijednosti atributa

N - broj primjera .............. max. 250
M - broj ulaznih atributa ....... max. 50
W - broj znakova u nazivu atributa .... max. 30


Drugi do N+1 redak ulazne datoteke sadrže vrijednosti atributa razdvojene znakom razdvajanja. Za svaki primjer, poredak vrijednosti atributa mora odgovarati poretku naziva atributa iz prvog retka.

Nominalne vrijednosti atributa moraju počinjati slovom (a-z ili A-Z) ili znakom '_' (ASCII 95 decimalno). Preporuča se korištenje malih slova. Osim slova, nominalne vrijednosti atributa mogu sadržavati znamenke (0-9) i znak '_'. Razmaci su dozvoljeni ukoliko razmak nije znak razdvajanja. Vrijednost atributa može sadržavati najviše W znakova. Primjeri ispravnih vrijednosti su:
manji_od_45
zelen
težak

Kontinuirane vrijednosti atributa moraju počinjati znamenkom (0-9), decimalnom točkom '.', ili znakovima (+,-). Osim znamenki, mogu sadržavati samo decimalnu točku. Prihvatljive vrijednosti za kontinuirane atribute su u području od -1 000 000 do +1 000 000. Koristi se preciznost na dva decimalna mjesta. Poslužitelj ne prepoznaje brojeve u eksponencijalnom zapisu (npr. 1.0E-01). Primjeri ispravnih vrijednosti su:
50.678
232.2323
500000

Diskretne vrijednosti atributa moraju počinjati znamenkom (0-9), mogu uključivati samo znamenke a dozvoljene vrijednosti su 0 do 1000.
5
45
500

Svaka ulazna vrijednost atributa, bez obzira koje je vrste, može započeti znakom '?' iza kojeg eventualno slijede prihvatljivi znakovi (a-z, A-Z, 0-9, '_'). Značenje tako obilježene vrijednosti atributa je nepoznata vrijednost atributa ili vrijednost koja nedostaje. Primjer:
?xx

Vrijednosti ciljnog atributa su pozitivna (ciljna) ili negativna klasa. Vrijednosti ciljnog atributa koje pripadaju pozitivnoj klasi označavaju se uskličnikom (!) iza kojeg eventualno slijede prihvatljivi znakovi. Sve ostale vrijednosti predstavljaju negativnu klasu. Iznimka je ako vrijednost ciljnog atributa počinje znakom '?'. Značenje je nepoznata klasa što ima za posljedicu da je cijeli primjer isključen iz procesa analize podataka. Primjeri pravilno označenih vrijednosti ciljnog atributa su:
!velik (primjer za pozitivnu klasu)
malen (primjer za negativnu klasu)
?srednji53 (primjer za nepoznatu kalsu)

slijedeća stranica


© 2001 LIS - Institut Rudjer Bošković
Posljednja izmjena: September 08 2015 09:28:57.