Članek obravnava izziv avtomatske izdelave delotokov za odkrivanje znanja, ob danih vhodnih in zahtevanih izhodnih podatkih procesa odkrivanja znanja. Naša metodologija je sestavljena iz dveh ključnih delov. Prvi del predstavlja opredelitev formalnega pojmovanja algoritmov podatkovnega rudarjenja s pomočjo ontologije za odkrivanje znanja. Drugi del pa predstavlja sestavljanje delotokov, ki je opredeljeno kot naloga načrtovanja z uporabo domenske ontologije in z opisi nalog. Razvili smo dve vrsti algoritma za načrtovanje z veriženjem naprej. Osnovna različica prikazuje ustreznost ontologije odkrivanje znanja za načrtovanje in uporablja Planning Domain Definition Language (PDDL) za opis algoritmov. Druga pa neposredno uporablja ontologijo preko mehanizma sklepanja. Predlagani pristop je bil preizkušen na dveh primerih uporabe, enem s področja genomike in drugem iz napredne tehnike. Rezultati kažejo možnost avtomatske gradnje delotokov s pomočjo integracije načrtovanja in uporabe ontologij.
COBISS.SI-ID: 23993639
Razvili smo novo servisno orientirano okolje za rudarjenje podatkov ter referenčno implementacijo Orange4WS (Orange for Web Services). Orange4WS temelji na obstoječem programskem paketu za rudarjenje podatkov Orange ter njegovi komponenti za vizualno programiranje, ki omogoča ročno gradnjo delotokov. Predstavljeno okolje Orange4WS dodaja naslednje razširitve. (1) Uporaba spletnih servisov kot gradnikov delotokov za podatkovno rudarjenje. (2) Uporaba algoritmov za relacijsko rudarjenje podatkov v delotokih. (3) Ontologija področja odkrivanja znanja, ki opisuje komponente delotoka (podatke, znanje ter spletne servise za podatkovno rudarjenje) na abstrakten način, ki omogoča strojno interpretacijo. Ontologija je uporabljena tudi za avtomatsko gradnjo delotokov s pomočjo planerja. Vse predstavljene razširitve so prikazane na treh realnih primerih uporabe.
COBISS.SI-ID: 25004071
Razvili smo novo metodologijo SegMine za semantično analizo podatkov mikromrež in novo okolje za gradnjo delotokov Orange4WS, ki podpira vključevanje spletnih servisov. SegMine metodologija sestoji iz dveh glavnih korakov. Najprej uporabimo algoritem za semantično odkrivanje podskupin, ki poišče semantično označena pravila za identifikacijo skupin diferencialno izraženih genov. Nato uporabimo servis BioMine za odkrivanje povezav, ki omogoča kreiranje in vizualizacijo novih bioloških hipotez. Uporabnost metodologije SegMine, implementirane z delotoki v Orange4WS, smo prikazali z rezultati analize dveh množic podatkov iz mikromrež. Pri analizi senescence človeških izvornih celic smo z uporabo SegMine formulirali tri nove raziskovalne hipoteze, ki izboljšujejo razumevanje mehanizmov, ki pripeljejo do senescence.
COBISS.SI-ID: 25208871