Razvili smo metodologijo Bio3graph, ki omogoča avtomatsko luščenje relacij iz biološke literature: avtomatsko izluščene relacije v obliki trojk (komponenta1, reakcija, komponenta2) tvorijo omrežje, ki ga lahko vizualiziramo ter omogočimo njegovo biološko evalvacijo v primerjavi z ročno generiranim strukturnim modelom biološkega sistema. Orodje Bio3graph, ki vključuje slovar relevantnih bioloških izrazov, smo uporabili za ekstrakcijo relacij iz 9.586 relevantnih bioloških člankov, iz katerih smo izluščili 137 novih relacij, ki smo jih dodali v sprva ročno sestavljeno omrežje 175 komponent in 387 reakcij, s katerimi smo modelirali obrambni odziv rastlin na napad patogenov (virusov). Končno omrežje, ki predstavlja signalno omrežje prototipne rastline Arabidopsis thaliana sestavljeno iz 175 komponent in 524 reakcij, lahko služi kot koristen vir za nadaljnje modeliranje in interpretacijo omičnih podatkov.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 26363431Spletni portal VideoLectures.Net je prejel nagrado World Summit Award na področju e-znanosti in tehnologije (Monterrey, Mehika). Nagrado podeljuje oddelek informacijske družbe Organizacije združenih narodov. Gre za svetovno tekmovanje za priznanje najboljšim e-vsebinam in ustvarjalnosti.
E.02 Mednarodne nagrade
COBISS.SI-ID: 23551271Razvili smo novo servisno orientirano okolje za rudarjenje podatkov ter referenčno implementacijo Orange4WS (Orange for Web Services). Orange4WS temelji na obstoječem programskem paketu za rudarjenje podatkov Orange ter njegovi komponenti za vizualno programiranje, ki omogoča ročno gradnjo delotokov, kateremu dodaja naslednje razširitve: (1) Uporaba spletnih servisov kot gradnikov delotokov za podatkovno rudarjenje. (2) Uporaba algoritmov za relacijsko rudarjenje podatkov v delotokih. (3) Ontologija področja odkrivanja znanja, ki opisuje komponente delotoka (podatki, znanje ter spletni servisi za podatkovno rudarjenje) na abstrakten način, ki omogoča strojno interpretacijo. Ontologija je uporabljena tudi za avtomatsko gradnjo delotokov. Po sklepu Znanstvenega sveta ARRS za Tehniko je bilo okolje Orange4WS razpoznano kot izjemni znanstveni dosežek za leto 2012.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 25004071V okviru projekta FIRST (Large scale information extraction and integration infrastructure for supporting financial decision making) smo skupaj s strokovnjaki iz Nemčije razvili večparametrski odločitveni model za odkrivanje zlorab v finančnem poslovanju. Gre za zvrst zlorab, imenovanih "Pump and Dump", ki se nanašajo na nedovoljeno manipulacijo vrednosti finančnih instrumentov z razširjanjem lažnih informacij. Bistvena novost našega pristopa je, da pri ugotavljanju teh zlorab povezuje notranje finančne informacije z analizo sentimenta v dokumentih na medmrežju. Razvito rešitev smo predstavili v referatu, ki je dobil priznanje na mednarodni konferenci. Rešitev je tudi že vključena v znani in razširjeni informacijski sistem, ki ga proizvaja nemški projektni partner. Oboje nakazuje, da je rešitev uporabna v praksi, kjer lahko pomembno pomaga finančnim organizacijam pri odkrivanju zlorab in posledično zmanjševanju njihove škode.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 26828583Sodelovali smo pri gradnji referenčnih korpusov slovenskega jezika Gigafida, KRES, ccGigafida in ccKRES. Kulturna identiteta Slovencev je že od nekdaj tesno povezana z jezikom in zgrajeni korpusi predstavljajo pomemben mejnik pri opremljenosti slovenščine z referenčnimi in široko dostopnimi jezikovnimi viri. Delo na področju jezikovnih virov in tehnologij je potekalo v sodelovanju s komplementarnimi slovenskimi institucijami: UL-FF, UL-FDV, ZRC SAZU, NUK, Amebis in Alpineon. Naše delo na tem področju je bilo uporabljeno pri iskalniku dLib.si in pri poučevanju slovenskega jezika na gimnazijah, na Univerzah v Ljubljani in Mariboru ter pri raziskavah na univerzah in ZRC SAZU.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 262711040