1.

Osnove učenja pravil

Znanstvena monografija "Foundations of Rule Learning" (Springer 2012, 334 strani), katere vodilna avtorica je prof. dr. Nada Lavrač, je plod večletnega raziskovalnega dela na področju strojnega učenja. Monografija poda celovit pregled raziskovalnega dela s področja učenja pravil, predstavi pa tudi osnove, tehnike in izbrane aplikacije učenja pravil s področja klasičnega strojnega učenja in sodobnega podatkovnega rudarjenja. Knjiga se lahko uporablja tudi kot učbenik strojnega učenja in podatkovnega rudarjenja. Deli knjige so prosto dostopni na spletni strani založbe Springer http://link.springer.com/book/10.1007/9783 540751977/.

COBISS.SI-ID: 26327591

2.

Računsko napovedovanje funkcij proteinov

Razvili smo novo metodo za računsko napovedovanje funkcij genov oz. proteinov, ki jih geni kodirajo. (i) Metoda, ki temelji na principih homologije in filogenetskih profilov in uporablja ansamble dreves za hierarhično klasifikacijo, je bila objavljena v reviji PLOS Computational Biology. Bila je eksperimentalno ovrednotena v laboratoriju, pri čemer se je pokazalo, da omogoča realistične ocene napovedne moči in se lahko uporabi za usmerjanje bioloških poskusov za določanje funkcije genov. (ii) Metoda je bila vključena v prvo obsežno primerjavo metod za računsko napovedovanje funkcij proteinov, ki je bila objavljena v reviji Nature methods, v kateri so primerjali 54 sodobnih metod za napovedovanje funkcij proteinov na ciljni množici 866 proteinov iz 11 organizmov.

COBISS.SI-ID: 26510887

3.

Neuravnoteženi razredi in vplivne točke manjšinskega razreda

Razvili smo nov način obravnave visokodimenzionalnih podatkov, ki uspešno uporabi zvezdiščnost - tendenco visokodimenzionalnih podatkov, da vsebujejo posamezne točke v prostoru podatkov, ki so vplivne in se pogosto pojavljajo v soseščini drugih točk. Pokazali smo, da so pri klasifikaciji z metodo najbližjih sosedov vplivne točke iz manjšinskega razreda pogosto odgovorne za napačno klasifikacijo.

COBISS.SI-ID: 27022119

4.

Večciljna regresija z ansambli pravil

Razvili smo algoritem FIRE za večciljno regresijo, ki uporablja pristop ansamblov pravil. Točnost algoritma smo izboljšali z dodajanjem preprostih linearnih funkcij v ansambel. Rezultati obsežne evalvacijske študije kažejo, da so ansambli pravil npr. bolj točni kot večciljna regresijska drevesa, a manj točni kot večciljni naključni gozdovi. Prednost ansamblov pravil je, da so bistveno bolj razumljivi kot naključni gozdovi. Možno pa je zgraditi tudi kompaktne množice pravil, ki so manjše od posameznega regresijskega drevesa, toda še vedno primerljive točnosti.

COBISS.SI-ID: 26134055

5.

Nadzorovano učenje opisnih pravil: poenoten pregled odkrivanja kontrastnih množic, odkrivanja porajajočih se vzorcev in odkrivanja podskupin

V članku definiramo termin nadzorovano učenje opisnih pravil, v okvire katerega združimo odkrivanje podskupin, odkrivanje kontrastnih množic, odkrivanje porajajočih se vzorcev in druga sorodna področja. V skupnem teoretskem okviru poenotimo terminologijo, kar omogoči tudi poenotenje definicij. Prednost uporabe poenotenega teoretskega okvira je posplošitev vizualizacijskih metod, ki so bile razvite za odkrivanje podskupin, na nadzorovano učenje opisnih pravil.

COBISS.SI-ID: 22475303

P2-0103 — Zaključno poročilo

1.

Osnove učenja pravil

2.

Računsko napovedovanje funkcij proteinov

3.

Neuravnoteženi razredi in vplivne točke manjšinskega razreda

4.

Večciljna regresija z ansambli pravil

5.

Nadzorovano učenje opisnih pravil: poenoten pregled odkrivanja kontrastnih množic, odkrivanja porajajočih se vzorcev in odkrivanja podskupin