Razvili smo novo servisno orientirano okolje za rudarjenje podatkov ter referenčno implementacijo Orange4WS (Orange for Web Services). Orange4WS temelji na obstoječem programskem paketu za rudarjenje podatkov Orange ter njegovi komponenti za vizualno programiranje, ki omogoča ročno gradnjo delotokov. Predstavljeno okolje Orange4WS dodaja naslednje razširitve. (1) Uporaba spletnih servisov kot gradnikov delotokov za podatkovno rudarjenje. (2) Uporaba algoritmov za relacijsko rudarjenje podatkov v delotokih. (3) Ontologija področja odkrivanja znanja, ki opisuje komponente delotoka (podatki, znanje ter spletni servisi za podatkovno rudarjenje) na abstrakten način, ki omogoča strojno interpretacijo. Ontologija je uporabljena tudi za avtomatsko gradnjo delotokov s pomočjo planerja. Vse predstavljene razširitve so prikazane na treh realnih primerih uporabe.
COBISS.SI-ID: 25004071
Prispevek predstavi jezikovne vire MULTEXT-East, ki so večjezični nabor podatkov namenjen raziskavam s področja jezikovnih tehnologij in zajemajo oblikoskladenjsko raven jezikoslovnega opisa. Ti jezikovni viri vsebujejo oblikoskladenjske specifikacije, leksikone in stavčno poravnan ter ročno označen vzporedni korpus. Viri so zapisani v skladu s priporočili za zapis besedil TEI P5 in pokrivajo 16 jezikov, večinoma s Srednje in Vzhodne Evrope. Jezikovni viri MULTEXT-East, ki vsebujejo izčrpno spremno dokumentacijo, so prosto dostopni v raziskovalne namene.
COBISS.SI-ID: 25372199
Predlagana je nova metodologija OntoPlus za pol-avtomatsko razširitev ontologij, ki uvaja uporabo vsebine in strukture ontologije ter informacijo o sopojavitvah pojmov v besedilih. Omogoča učinkovito razširjanje velikih ontologij, tako da uporabniku predlaga potencialno relevantne koncepte in relacije glede na nov koncept, ki ga želimo dodati v ontologijo. OntoPlus smo ocenili z uporabo znane ontologije Cyc in besedil iz dveh domen – finance in ribogojništvo. Ugotovili smo, da najboljše rezultate dosežemo s kombiniranjem vsebine ontologije, strukture ontologije in sopojavitve pojmov v besedilih.
COBISS.SI-ID: 25127463