Lematizacija je ena od osnovnih jezikovnotehnoloških komponent. V tem znanstvenem članku predstavimo metodo, s katero se lahko skozi strojno učenje nad oblikoslovnimi leksikoni nauči kvalitetnih modelov za lematizacijo poljubnega jezika in pokažemo njene prednosti glede na poprej razvite metode.
COBISS.SI-ID: 21593383
Oblikoslovno označevanje je ena od osnovnih jezikovnotehnoloških komponent. V članku predstavimo metodo, s katero je moč poboljšati rezultate oblikoslovnega označevanja skozi kombinacijo oblikoslovnih označevalnikov.
COBISS.SI-ID: 22416423
Članek predstavi prvo, samo oblikoslovno označeno različico korpusa jos100k.
COBISS.SI-ID: 21930023
Izdelava semantičnih leksikonov je zamuden in drag proces. Članek predlaga metodo, pri kateri iz odprtih jezikovnih virov, kot npr. Wikipedia, avtomatsko dopolnjujemo semantične leksikone za poljubne jezike.
COBISS.SI-ID: 40118626
Predstavitev procesa in rezultatov ročnega označevanja besednih pomenov v korpusu jos100k.
COBISS.SI-ID: 42066018