V članku predstavimo postopek izgradnje referenčnega govornega korpusa in njegovo uporabo na primeru korpusa govorjene slovenščine Gos. Osredotočimo se na zgradbo korpusa, postopek snemanja, označevanja posnetkov in transkribiranja na dveh ravneh (pogovorni in standardizirani zapis) ter predstavimo spletni vmesnik (konkordančnik) in dostopnost izvirnih korpusnih gradiv.
COBISS.SI-ID: 16771606
V zadnjih desetletjih je ugotavljanje avtorstva besedil doživelo velik razmah, saj prinaša izrazito aplikativne rezultate na področju prava (plagiatorstvo), kriminologije (grozilna pisma), literarnih študij (psevdonimi) in tržnih analiz (strategije oglaševanja). V prispevku z metodo podpornih vektorjev (SVM) analiziramo besedilo, imenovano "Volivci v trenirkah", in ga primerjamo s 75 besedili 21 znanih avtorjev. Rezultati kažejo, da so specifike enega izmed opazovanih avtorjev precej podobne besedilu neznanega izvora glede na raznolikost besedišča, Brunetovo formulo in relativno frekvenco hapaksov v besedilu.
COBISS.SI-ID: 51943522
Glavni cilj aktivnosti Pedagoški slovnični portal je ugotoviti, na katerih mestih imajo učenci in dijaki pri pisanju v slovenščini največ težav, in jim ponuditi razlago in rešitev teh problemov v zanje zanimivi in razumljivi obliki.
COBISS.SI-ID: 35714349