1.

Odkrivanje koreferenčnosti v slovenskem jeziku na označenih besedilih iz coref149

Odkrivanje koreferenčnosti je ena izmed treh ključnih nalog ekstrakcije informacij iz besedil, kamor spadata še prepoznavanje imenskih entitet in ekstrakcija povezav. Namen odkrivanja koreferenčnosti je prek celotnega besedila ustrezno združiti vse omenitve entitet v skupine, v katerih vsaka skupina predstavlja svojo entiteto. Metode za reševanje te naloge se za nekatere jezike z več govorci razvijajo že dalj časa, medtem ko za slovenski jezik še niso bile izdelane. V prispevku predstavljamo nov, ročno označen korpus za odkrivanje koreferenčnosti v slovenskem jeziku - korpus coref149. Za avtomatsko odkrivanje koreferenčnosti smo prilagodili sistem SkipCor, ki smo ga izdelali za angleški jezik. Sistem SkipCor je na slovenskem gradivu dosegel 76 % ocene CoNLL 2012. Ob tem smo analizirali še vplive posameznih tipov značilk in preverili, katere so pogoste napake. Pri analiziranju besedil smo razvili tudi programsko knjižnico s spletnim vmesnikom, prek katere je možno izvesti vse opisane analize in neposredno primerjati njihovo uspešnost. Rezultati analiz so obetavni in primerljivi z rezultati pri drugih, bolj razširjenih jezikih. S tem smo dokazali, da je avtomatsko odkrivanje koreferenčnosti v slovenskem jeziku lahko uspešno, v prihodnosti pa bi bilo potrebno izdelati še večji in kvalitetnejši korpus, v katerem bodo koreferenčno naslovljene vse posebnosti slovenskega jezika, kar bi omogočilo izgradnjo učinkovitih metod za avtomatsko reševanje koreferenčnih problemov.

F.29 Prispevek k razvoju nacionalne kulturne identitete

COBISS.SI-ID: 67079778

2.

Članstvo v ur. odboru slovenske znanstveno strokovne revije

Revija Infromatica

C.05 Uredništvo nacionalne revije

COBISS.SI-ID: 36338688

3.

Varnost interneta stvari z uporabo fizično nepotvorljivih funkcij

Vabljeno predavanje na Poljski akademiji znanosti

B.04 Vabljeno predavanje

COBISS.SI-ID: 1538206403

4.

Varnost interneta stvari z uporabo fizično nepotvorljivih funkcij

Vabljeno predavanje na Univerzi v Zurichu

B.04 Vabljeno predavanje

COBISS.SI-ID: 1538428099

5.

Sistem Tolmač

Visoko prilagojen interpreter za slovneščino (glej točko 4.2)

F.06 Razvoj novega izdelka

P2-0359 — Vmesno poročilo

1.

Odkrivanje koreferenčnosti v slovenskem jeziku na označenih besedilih iz coref149

2.

Članstvo v ur. odboru slovenske znanstveno strokovne revije

3.

Varnost interneta stvari z uporabo fizično nepotvorljivih funkcij

4.

Varnost interneta stvari z uporabo fizično nepotvorljivih funkcij

5.

Sistem Tolmač