Razvili smo nov algoritem za preštevanje frekvenc grafkov (graphlets) in njihovih orbit v velikih redkih grafih. Algoritem ima številne aplikacije predvsem na področju bioinformatike. Algoritem je za velikostni razred hitrejši od obstoječih algoritmov; v praksi to pomeni približno stokrat hitrejše izvajanje na tipičnih grafih, s kakršnimi se srečujemo v bioinformatiki. V preteklosti smo objavili algoritem, ki rešuje omejeno različico problema, v tem članku pa smo ga uspešno posplošili na grafke poljubne velikosti.
COBISS.SI-ID: 1537349315
Rast obsežnih in raznolikih zbirk bioloških podatkov omogoča analizo interakcij med različnimi tipi objektov, kot so geni, kemične spojine, molekulski profili, bolezni in vplivi iz okolja. Par objektov - na primer gen in bolezen - je pogosto lahko povezan na različne načine, na primer z neposredno povezavo med genom in boleznijo ali posredno, prek funkcijske anotacije, kemične spojine ali poti. Različni načini imajo lahko različen pomen. Običajne metode analize interakcij to semantiko zanemarjajo. V članku predstavljamo algoritem Medusa, ki s pomočjo sočasne matrične faktorizacije izpelje različne semantike. V sistematični študiji 310 bolezni smo pokazali njeno učinkovitost pri iskanju povezav med geni in boleznimi ter prepoznavanju skupin bolezni. Zaradi upoštevanja različnih semantik je algoritem natančnejši od drugih sorodnih algoritmov.
COBISS.SI-ID: 1537026243
Ogromna razsežnost prostora možnih učinkovin in zelo majhno pokritje tega prostora z eksperimentalnimi podatki narekuje potrebo po uporabi metod, ki napovedi obnašanja teh učinkovin opremijo z oceno zanesljivosti. V članku predlagamo, da morajo te mere biti odvisne od učinkovine, in ne, kot v dosedanji literaturi, od podobnosti nabora učinkovin, za katere napovedujemo obnašanje z učinkovinami, na katerem smo se napovednega modela učili.
COBISS.SI-ID: 10466388
Analiza epistaze je osnovno orodje klasične genetike. V članku predlagamo nov verjetnostni pristop k odkrivanju genskih mrež iz kvantitativnih podatkov o interakcijah. Pristop temelji na skupni obravnavi podatkov o mutantih s pomočjo faktorizacije in verjetnosti za povezave med geni, ki jih izpeljemo iz latentnih podatkov o genih. Rezultati so pokazali, da predlagani pristop uspešno rekonstruira znane genske poti in po točnosti preseže trenutne pristope.
COBISS.SI-ID: 10624852
Napovedovanje manjkajočih ali potencialnih vozlišč in povezav je ena od osnovnih nalog analize omrežij. V članku definiramo problem dopolnjevanja majhnih omrežij z ali brez zabeležene pretekle dinamike. Obstoječi algoritmi in načini evalvacije za ta problem niso primerni. V članku definiramo nov algoritme, Hyspan, ki išče pogoste vzorce v majhnih omrežjih in jih uporablja za napovedovanje manjkajočih vozlišč in povezav v novih omrežjih.
COBISS.SI-ID: 1536144835