Članek opisuje metodologijo za razlago rezultatov metod za podatkovno rudarjenje. Uporabili smo obstoječo metodo za semantično odkrivanje podskupin, ki dobi kot vhod skupine primerov (izhod drugih metod), ontologijo dane domene, kot izhod pa vrne opisna pravila, ki opisujejo in razlagajo razlike med vhodnimi skupinami s pomočjo konjunktov ontoloških konceptov. V tej raziskavi smo uporabili prosto dostopno ontologijo Gene Ontology (GO), skupaj z eksperimentalnimi podatki raka na dojki (ekspresija genov). Ontologija kodira biološko domensko znanje o celicah organizmov. V prvi fazi so bili vzorci odkriti na nivoju posameznih genov, ki opisujejo podatke na najnižjem nivoju. V drugi fazi pa smo te vzorce razložili z uporabo konceptov iz GO. Ti višjenivojski opisi so tako sestavljeni iz biološkega znanja zakodiranega v GO in nudijo koristen in drugačen vpogled na iste podatke. Eksperiment smo implementirali v obliki ponovljivega delotoka v platformi Clowdflows, dostopnega na naslovu: http://clowdflows.org/workflow/911/.
COBISS.SI-ID: 27322407
Klasičen način za ročno izgradnjo dinamičnega modela lahko dopolnijo dodatni koraki, ki pospešijo in izboljšajo gradnjo modelov. Razvili smo novo metodologijo za gradnjo bioloških modelov, ki temelji na ekspertnem znanju in literaturi. To metodologijo smo uspešno uporabili za gradnjo modela obrambnega mehanizma rastlin, saj zaradi kompleksnosti obrambnega sistema uporaba izključno ročnih metod ni primerna. Tako smo težavno delo ročne gradnje modela dopolnili z dodatnimi avtomatskimi in pol-avtomatskimi koraki, ki obravnavajo strukturo modela z dodatno pomočjo tehnik procesiranja naravnega jezika, kot tudi dinamiko modela, kjer je optimizacija parametrov vodena z omejitvami, ki so jih določili domenski strokovnjaki.
COBISS.SI-ID: 28827175
Predstavljena raziskava je osredotočena na razvoj metode za inkrementalni razvoj bioloških omrežij. Inkrementalni pristop smo preizkusili na dveh praktičnih primerih. V prvem primeru smo v dveh inkrementalnih korakih razširili manjše ročno ustvarjeno omrežje obrambnega mehanizma rastlin v končni model s 183 relacijami. V drugem primeru pa smo z informacijami iz nedavno objavljenih znanstvenih člankov inkrementalno razširili kompleksno omrežje obrambnega mehanizma rastlin s 104 novimi relacijami. Rezultati kažejo, da je z uporabo metode inkrementalnega razvoja mogoče samodejno prepoznati novo znanje o izbranih bioloških relacijah v nedavno objavljeni znanstveni literaturi.
COBISS.SI-ID: 28591655
Članek opisuje prototipni sistem za semantično podatkovno rudarjenje g- SEGS. Pristop uporablja ontologije kot predznanje v učnem procesu in je posplošitev obstoječega sistem SEGS, ki pa je uporaben zgolj na področju genomike. g-SEGS je implementiran v obliki spletnega servisa in je tudi na voljo v platformi za podatkovno rudarjenje Orange4WS. Članek opiše tudi novo formulacijo problema semantičnega podatkovnega rudarjenja na način, ki omogoči reševanje tega problema s sistemom Aleph za induktivno logično programiranje. Oba pristopa sta bila eksperimentalno ovrednotena na dveh bioloških domenah.
COBISS.SI-ID: 28293671
Bistvo induktivnega logičnega programiranja in relacijskega podatkovnega rudarjenja je iskanje modelov in vzorcev v relacijskih podatkovnih bazah. Članek obravnava propozicionalizacijo, ki je uveljavljen pristop k relacijskemu podatkovnemu rudarjenju. Osnovna zamisel tega postopka je transformacija relacijske podatkovne baze v eno samo tabelo. Članek obravnava zbirko pristopov za propozicionalizacijo, ki smo jih vgradili v spletno okolje za podatkovno rudarjenje ClowdFlows. Okolje omogoča gradnjo in izvajanje delotokov z velikim naborom že vgrajenih gradnikov. V okviru te raziskave smo razvili gradnike za algoritme Aleph, RSD, RelF in Wordification, kot tudi delotoke za podporo njihove eksperimentalne primerjave in vizualizacijo z orodjem ViperCharts.
COBISS.SI-ID: 27937831