Leta 2019 je bilo ustanovljeno središče znanja CLARIN za južnoslovanske jezike (CLASSLA), ki zagotavlja strokovno podporo pri uporabi jezikovnih virov in tehnologij za južnoslovanske jezike. Glavne dejavnosti središča CLASSLA vključujejo: posredovanje informacij prek dokumentacije o razpoložljivih virih in tehnologijah raziskovalcem, študentom, ljubiteljskim znanstvenikom in drugim zainteresiranim posameznikom, tehnično podporo pri ustvarjanju, preoblikovanju in objavljanju virov in tehnologij in organizacijo izobraževanj. Središče znanja CLASSLA upravljata raziskovalni infrastrukturi CLARIN.SI in CLADA-BG. Spletna stran: https://www.clarin.si/info/k-center/
D.02 Ustanovitev raziskovalnega centra, laboratorija, študija, društva
Center za jezikovne vire in tehnologije (CJVT UL) je enota Univerze v Ljubljani, namenjena znanstvenemu raziskovanju, vzpostavljanju in vzdrževanju temeljnih digitalnih jezikovnih virov in jezikovnotehnoloških orodij za sodobni slovenski jezik, ki so praktično uporabni in preko spleta dostopni vsem uporabnikom slovenskega jezika v svetu. CJVT je nastal v zavedanju, da le načrten in sistematičen dolgoročni razvoj tehnologij, virov in orodij za slovenski jezik zagotavlja, da bo slovenščina v digitalnem okolju obdržala enakovreden status z drugimi nacionalnimi jeziki. Univerza v Ljubljani kot združevalka številnih študijskih in raziskovalnih programov ter raziskovalcev in raziskovalk ponuja institucionalni okvir za interdisciplinarno delo, katerega vizija je urejena jezikovna opremljenost slovenščine. Kot rezultat navajamo enega od slovarjev, ki jih vzdržuje CJVT.
D.07 Vodenje centra/laboratorija
COBISS.SI-ID: 294177280Referenčni besedilni korpus Gigafida, ki je trenutno na voljo v različici 2.0, je nabor besedil, ki so izbrana in strojno obdelana z namenom, da bi korpus kot vzorec sodobne standardne slovenščine lahko služil za jezikoslovne in druge humanistične raziskave, izdelavo sodobnih slovarjev, slovnic, učnih gradiv in razvoj jezikovnih tehnologij za slovenščino. Na 36. Slovenskem knjižnem sejmu (2020) je korpus Gigafida v okviru nagrade Knjiga leta prejel posebno priznanje na področju e-založništva, ki se podeli za projekt z najbolj domišljenimi, svežimi in specifičnimi rešitvami v okviru digitalnih platform v zvezi s knjigo: https://www.knjiznisejem.si/index.php/sl/nagrade.
E.01 Domače nagrade
COBISS.SI-ID: 18023939Baza Kolokacijskega slovarja sodobne slovenščine 1.0 vsebuje 7.310.983 kolokacij za 35.862 slovarskih iztočnic. Kolokacije so bile avtomatsko pridobljene iz referenčnega korpusa Gigafida z upoštevanjem vnaprej določenih jezikoslovnih parametrov. Baza je primer jezikovnih podatkov za sodobno slovenščino, ki jih pripravljamo z napredno interdisciplinarno metodologijo in pod odprto licenco objavljamo na repozitoriju CLARIN.SI. V zadnjih dveh letih smo objavili 19 podatkovnih baz in učnih korpusov, med katerimi so baza oblikoslovnega leksikona Sloleks s strojno pripisanimi naglasnimi podatki, leksikon večbesednih enot, vezljivostni leksikon, referenčni seznam slovenskih pogostih splošnih besed in drugi viri.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 20172291