V članku predstavimo postopek izgradnje referenčnega govornega korpusa in njegovo uporabo na primeru korpusa govorjene slovenščine Gos. Osredotočimo se na zgradbo korpusa, postopek snemanja, označevanja posnetkov in transkribiranja na dveh ravneh (pogovorni in standardizirani zapis) ter predstavimo spletni vmesnik (konkordančnik) in dostopnost izvirnih korpusnih gradiv.
COBISS.SI-ID: 16771606
V prispevku analiziramo anonimno besedilo in ga primerjamo s 75 besedili 21 znanih avtorjev. Analiza temelji na metodi podpornih vektorjev (SVM), ki omogoča določanje razlik in podobnosti med primerjanimi besedili na podlagi značilk besedišča in berljivosti. Rezultati kažejo, da so specifike enega izmed opazovanih avtorjev precej podobne besedilu neznanega izvora glede na raznolikost besedišča, Brunetovo formulo in relativno frekvenco hapaksov v besedilu.
COBISS.SI-ID: 51943522
Cilj raziskave je opredeliti najučinkovitejša strateška sredstva v francoščini in slovenščini, ki jih uporabljajo govorci, ko se borijo za prevzem besede. Raziskava sloni na treh spontanih govornih izmenjavah, ki smo jih analizirali na prozodični, oblikoskladenjski in diskurzivni ravni. Rezultati kažejo, da so govorci, ki so bili bolj učinkoviti pri prevzemanju besede, tvorili številne premore, ponavljanja in samopopravke, pa tudi bistveno daljše diskurzivne preambule kot govorci, ki so besedo prepustili.
COBISS.SI-ID: 56746594
V prispevku predstavljamo analizo avtentičnega primera anonimnega besedila, ki je leta 2011 močno vznemirilo slovensko javnost. Avtorstvo besedila smo preverjali na korpusu 75 besedil 21 potencialnih avtorjev na podlagi vnaprej določenega nabora leksikalnih in berljivostnih značilk. Rezultati kažejo, da ima eden od potencialnih avtorjev zelo podobne vrednosti značilk, vendar v dani situaciji ni mogoče preveriti, ali je bil dejanski avtor besedila zajet v analizo ali ne.
COBISS.SI-ID: 55987554
Cilj prispevka je raziskati značilnosti obstoječih govornih baz v funkciji potreb jezikoslovnih raziskav in jezikovnih tehnologij, ki predstavljajo ključni področji njihove uporabe. V tam namen primerjamo bazo za avtomatsko razpoznavanje govora BNSI Broadcast News in referenčni Korpus govorjene slovenščine Gos. Na koncu postavimo enotne smernice za nadaljnje delo.
COBISS.SI-ID: 17960982