Članek predstavlja vključitev nelinearne funkcije v frekvenčni spekter, ki izboljša zaznavanje vokalov, dvoglasnikov in polglasnikov v govornem signalu. Slabšega zaznavanja konzonantov je bilo rešeno z vpeljavo kriterija podaljška in kriterija predhodnega nastopa. Ta članek predstavlja postopek za hitrejšo določitev konstant uporabljenih za kriterija podaljška in kriterija predhodnega nastopa. Nelinearno spremenjen frekvenčni spekter je uporabljen v predlaganem algoritmu za zaznavanje aktivnosti govora, ki temelji na Gaussovih modelih porazdelitve verjetnosti. Primerjalni testi so bili izvedeni na bazi izgovarjav Aurora 2 na predlaganem in drugih sedmih algoritmih za zaznavanje aktivnosti govora. Eksperimenti so temeljili na uspešnosti zaznavanja okvirov in na uspešnosti avtomatskega razpoznavanja govora za dva tipa modelov različnih učnih okolij (šumno in čisto okolje). Najmanjši odstotek napačno zaznanih okvirov je bil dosežen s predlaganim algoritmom za zaznavanje aktivnosti govora, ki je tudi dosegel pozitivno izboljšanje uspešnosti avtomatskega razpoznavanja govora za oba tipa modelov različnih učnih okolij.
COBISS.SI-ID: 16323862
Predlagali smo novo metodo za izračun akustične zamenljivosti besed v avtomatskem razpoznavalniku govora. Akustična zamenljivost besed je eden izmed ključnih faktorjev, ki vplivajo na uspešnost razpoznavanja govora. Nova metoda je zasnovana na Levenshteinovi razdalji, izračunani na osnovi fonetične transkripcije besed v slovarju razpoznavalnika govora. Predlagano metodo smo ovrednotili na posredni način z uporabo štirih različnih naborov kontekstno odvisnih akustičnih modelov. Analiza rezultatov vrednotenja je pokazala uspešnost predlagane metode.
COBISS.SI-ID: 16500502
Označevalci odprte propozicije so izrazi, kot so in tako naprej, pa to, pa tako, ali pa nekaj takega. Prispevek prinaša pregled oblik in pogostosti teh izrazov v različnih tipih govora v slovenščini ter s kvalitativno analizo osvetli diskurzne vloge najpogostejšega formalnega označevalca odprte propozicije, in tako naprej. Ugotavlja, da so ti izrazi v splošnem najpogosteje rabljeni v zasebnem diskurzu. Govorec jih uporabi, da označi predhodni propozicijski element kot nepopoln, nakazan s primerom ali približno izražen, hkrati pa lahko z njimi zaključi izjavo ali temo. Obenem imajo ti izrazi tudi pomembno interakcijsko vlogo.
COBISS.SI-ID: 48889442
Če želimo doseči naravno sintezo pogovornega obnašanja sintetičnega pogovornega agenta, moramo zasledovati več ključnih značilk pogovornega obnašanja v okviru komunikacije človek-človek. Spontana komunikacija je kombinacija več modalnosti (kot so, kretnje, telesna drža, pogled, izraz) v smislu učinkovitega prenosa informacije med sogovornikoma. V članku avtorji predstavljajo nov postopek zajemanja oblik gibov izvajanih med spontanim pogovorom. Avtorji prav tako predstavijo proces transformacije zajetih opisov gibov v visoko ločljivostne skripte obnašanja z možnostjo izvedbe transformacij. Cilj raziskave je bilo definiranje postopka, ki bo omogočal gradnjo visokoločljivostnega slovarja gibov. Slovar vsebuje množico skript obnašanja, kjer vsaka opisuje posamezne izrazne elemente spontanega pogovora (npr. prostorske, ponavljalne, strukturne in časovne značilke).
COBISS.SI-ID: 16541462
Neverbalno obnašanje, ki ga dandanes znamo realizirati na pogovornih avatarjih, je še vedno zelo togo in včasih tudi nenaravno. Ustrezni korpusi in natančne anotacijske sheme, ki ustrezno opišejo podrobnosti gibanja pri ljudeh, lahko izboljšajo tudi sintetično obnašanje. Ta članek predstavlja anotacijsko shemo, predlagano na neformalnih bazah, ki vključujejo dialoge med več govorci. Ta anotacijska shema omogoča anotatorjem zajeti izrazne podrobnosti gibanja z visoko natančnostjo. Med drugim se lahko zajame: gibanje v prostoru (konfiguracija gest na nivoju artikulatorjev), fluidnost (prehod med fazami gibanja in frazami), časovni potek gest (spremembe v gibanju v obliki faz gibanja), ponovljivost (lastnosti gibanja pri ponavljanju), in jakost (nivo izraznosti). Predstavljena anotacijska shema lahko pretvori podatke v geste, ki se lahko direktno reproducirajo na pogovornem avatarju.
COBISS.SI-ID: 16541974