Orange4WS je nova platforma za servisno-orientirano odkrivanje znanja. Postala je javno dostopna, kar omogoča njeno uporabo širši skupnosti raziskovalcev na področju rudarjenja podatkov.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 24214311V preteklem letu smo organizirali: EBI Bionformatics Roadshow, Ljubljana, Third Generation Data Mining: Towards Service-Oriented Knowledge Discovery v sklopu evropske konference ECML/PKDD 2010, Barcelona, Data-mining ontology Jamboree: Ljubljana Conference on Data Mining and Data Warehouses na mednarodni konferenci Informacijska družba 2010, Ljubljana.
B.01 Organizator znanstvenega srečanja
COBISS.SI-ID: 252779264V sodelovanju s Pediatrično kliniko smo preko vmesnih konceptov povezali avtizem s transkripcijskim faktorjem NF-kappaB, kar je bilo strokovno ocenjeno kot prispevek k boljšemu razumevanju avtizma in sprejeto za objavo v revijo Autism Research and Treatment.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 929787Lematizacija je proces določanja slovarskih oblik besed, ki nastopajo v besedilih. Lematizacija je uporaben pred-proces pri množici nalog s področja rudarjenja besedil in je še posebej pomemben pri jezikih z bogato morfologijo (npr. slovenščini). LemmaGen je nov sistem za lematizacijo, ki je bil naučen za uporabo na 12 različnih evropskih jezikih.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 23897895V tem temeljnem projektu smo izdelali označene korpuse slovenskega jezika in pridružene vire, namenjene spodbujanju razvoja jezikovnih tehnologij za slovenski jezik. Rezultati vsebujejo oblikoskladenjske specifikacije JOS, dva ročno označena korpusa in dva spletna servisa. Razviti viri so v celoti dostopni pod licenco Creative Commons na naslovu http://nl.ijs.si/jos/ in so že bili uporabljeni pri poučevanju, šolanju oblikoskladenjskih in skladenjskih označevalnikov in raziskavah na področju leksikalne semantike.
F.04 Dvig tehnološke ravni
COBISS.SI-ID: 23680295