Pri jezikih z majhnim številom govorcev predstavlja dostopnost govornih in jezikovnih virov eno izmed glavnih ovir za razvoj govornih tehnologij. To je še posebej izrazito pri razpoznavanju spontanega govora. V članku smo zasnovali postopke kombiniranja obstoječih govornih virov za razpoznavanje novih domen in nenadzorovanega oziroma rahlo nadzorovanega učenja akustičnih modelov razpoznavalnika spontanega govora. Na osnovi govorne baze BNSI Broadcast News smo tako uporabili govorne baze SloParl, ki vsebuje parlamentarne razprave ter govorni bazi PoliDat in Plattos TTS.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 000000000Raziskave o diskurznih označevalcih v dveh različnih pogovornih žanrih slovenskega jezika so pomembne s stališča ohranjanja slovenskega jezika v dobi digitalizacije. Z večanjem vpliva informacijske družbe prihaja do večanja vpliva angleškega jezika, ki je še posebej opazen v povezavi z uporabo različnih telekomunikacijskih storitev. Analize izvedene na osnovi različnih slovenskih govornih virov omogočajo dodatne raziskave na področju avtomatskega razpoznavanja spontanega govora, kar bo posledično imelo vpliv tudi na razvoj sodobnih telekomunikacijskih storitev s podporo za slovenski jezik.
F.29 Prispevek k razvoju nacionalne kulturne identitete
COBISS.SI-ID: 36334434V članku predstavljamo postopek označevanja diskurznih označevalcev v korpusih spontanega govora. Vrednotenje je pokazalo, da pri določenih kategorijah diskurznih označevalcev sicer prihaja do odstopanja pri ročnem označevanju, vendar razlike ne vplivajo bistveno na kasnejšo uporabo korpusa za razvoj modelov razpoznavalnika govora. Zelo pomemben rezultat vrednotenja je določitev skupine tistih označevalcev, ki vedno nastopajo v vlogi diskurznih označevalcev. Tako bo v prihodnje možno delno avtomatizirati postopek označevanja korpusov spontanega govora.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 12719894Zasnovali smo sistem za modeliranje mašil pri razpoznavanju slovenskega spontanega govora. Osnovo je predstavljala analiza diskurznih označevalcev v formalnem in neformalnem govoru. Na nivoju akustičnih modelov smo modeliranje izvedli s štirimi različnimi implicitnimi topologijami, ki so predstavljale različno kompleksnost zgradbe mašil. Pri tem smo uporabljali pravila na osnovi ekspertnega jezikovnega znanja. Eksperimente smo izvedli na slovenskih govornih virih. Analiza rezultatov je pokazala pomemben vpliv modeliranja mašil na performance razpoznavanja spontanega govora.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 12454422