Projekti / Programi
Viri, metode in orodja za razumevanje, prepoznavanje in razvrščanje različnih oblik družbeno nesprejemljivega diskurza v informacijski družbi
Koda |
Veda |
Področje |
Podpodročje |
6.05.02 |
Humanistika |
Jezikoslovje |
Teoretično in uporabno jezikoslovje |
Koda |
Veda |
Področje |
H350 |
Humanistične vede |
Jezikoslovje |
Koda |
Veda |
Področje |
6.02 |
Humanistične vede |
Jeziki in književnost |
družbeno nesprejemljiv diskurz; računalniško posredovana komunikacija; korpusno jezikoslovje; kritična analiza diskurza; jezikovne tehnologije
Raziskovalci (17)
Organizacije (4)
Povzetek
Pojav različnih oblik družbeno nesprejemljivega diskurza, kot so sovražno, diskriminatorno in žaljivo izražanje, sicer še zdaleč ni nov, a se z njimi v zadnjem času zaradi številnih družbenih, kulturnih in ekonomskih sprememb izrazito intenzivno soočamo. Z razmahom informacijsko-komunikacijskih tehnologij in računalniško posredovane komunikacije ter s hitrostjo širjenja informacij po internetu so tovrstne diskurzivne prakse postale bolj razširjene in vplivnejše kot kdajkoli prej, zato je učinkovito proučevanje in soočanje z njimi mogoče le z avtomatskimi pristopi.
Projekt združuje najsodobnejše kvantitativne in kvalitativne multidisciplinarne pristope, ki bodo omogočili raziskovanje rabe družbeno nesprejemljivega diskurza v sociokulturnem kontekstu. Poleg tega bodo predlagani novi podatkovno podprti pristopi na nestrukturiranih in polstrukturiranih podatkih premaknili meje tradicionalne humanistike in družboslovja. Kot stranski učinek bo projekt podpiral tudi razvoj novega področja digitalne humanistike in družboslovja, ki združuje orodja in metode s področja računalništva s tistimi iz humanistike in družboslovja.
V okviru projekta bomo zgradili velika korpusa splošne slovenske računalniško posredovane komunikacije in družbeno nesprejemljivega diskurza, ki bosta služila kot podlaga za empirične raziskave. Zbrani korpusi bodo natančno strukturirani, besedila pa bodo jezikovno obdelana in obogatena z različnimi metapodatki.
Razvili bomo tipologijo družbeno nesprejemljivega diskurza in njegovih tarč ter s pomočjo tipologije ročno označili reprezentativen vzorec besedil, s čimer bomo pridobili podatkovno zbirko, ki bo služila kot zlati standard za proučevanje tovrstne komunikacije. Z uporabo tehnik strojnega učenja na tej zbirki bomo razvili avtomatsko metodo za prepoznavanje in kategoriziranje družbeno nesprejemljivega diskurza ter njegovih tarč, nato pa bomo razvite metode aplicirali na zgrajena korpusa.
Osrednji del raziskave so interdisciplinarne sociolingvistične analize na zgrajenih virih, v katerih se bomo osredotočili na migrante in islamofobijo, homofobijo in pravice istospolnih ter na seksizem in mizoginijo. Za to bomo uporabili kombinacijo metodologij in instrumentov korpusnega jezikoslovja, kritične analize diskurza in inferenčne statistike. Te pristope bomo dopolnili še s korpusno analizo pravnih vidikov DND in z anketami o dojemanju družbeno nesprejemljivega diskurza v slovenski družbi.
V okviru projekta bomo organizirali tudi mednarodno interdisciplinarno delavnico in objavili znanstveno monografijo. Pomembno je tudi, da bo projekt omogočil prost in odprt dostop do raziskovalnih rezultatov, in sicer s pomočjo raziskovalnih infrastruktur CLARIN.SI in Arhiva družboslovnih podatkov. Raziskovalni podatki bodo vsebovali razvite jezikovne vire in programsko opremo, pri čemer bodo upoštevane vse pravne in etične omejitve varovanja osebnih podatkov. Na ta način bo projekt podprl tudi pobudo za odprto znanost in omogočil preverjanje raziskovalnih rezultatov.
Pomen za razvoj znanosti
Predlagani projekt predstavlja pomembno prelomnico v slovenski humanistiki in družboslovju, saj se še nihče
ni lotil izčrpne inter- ter multidisciplinarne podatkovne raziskave DND. Projekt je za razvoj znanosti relevanten
in pomemben zaradi štirih glavnih razlogov:
Oprijemljiv rezultat projekta bosta velika bogato označena korpusa splošne RPK in DND ter
podatkovne zbirke, ročno označene z vrsto in tarčo DND. Ti jezikovni viri bodo omogočili celovit
vpogled v značilnosti različnih oblik DND v informacijski družbi in razvoj številnih novih raziskovalnih pristopov na področju jezikoslovja, sociolingvistike, kritične analize diskurza in antropologije ter s tem podprli razvoj tehnologij za analizo vsebine in besedilno analitiko za slovenščino, ki bodo široko
uporabne v digitalni humanistiki in družboslovju.
Rezultat projekta bo teoretično podkrepljeno in temeljito preizkušeno orodje za samodejno odkrivanje
in klasifikacijo družbeno nesprejemljivih spletnih vsebin, ki bo neposredno uporabno v družboslovju,
pravu in kriminologiji. Tovrstne storitve postajajo vse pomembnejše v družbi, ki temelji na znanju in
visoki tehnologiji, kjer slovenščina v primerjavi z večino evropskih jezikov močno zaostaja, zaradi česar je v primerjavi z ostalimi jeziki v neenakopravnem položaju, razvoj slovenske družbe in jezika pa oviran.
V nasprotju s številnimi slovenskimi projekti bodo rezultati tega projekta, ki bodo obsegali jezikovne
vire, orodja in modele ter ročno označene podatkovne zbirke, prosto dostopni (Creative Commons) v skladu s smernicami. To bo zainteresiranim raziskovalcem pri nas in v tujini omogočilo reprodukcijo rezultatov projekta in izboljšave opravljenih raziskav.
Z združevanjem metod računalništva ter metod humanističnih ved in družboslovja bo projekt omogočil razvoj nove raziskovalne smeri digitalne humanistike in družboslovja.
Pomen za razvoj Slovenije
Z združevanjem metod in pristopov iz različnih področij digitalne humanistike in družboslovja bo
projekt omogočil boljše razumevanje DND v sodobni družbi ter razvil orodja in smernice za spopadanje z ekstremizmom in netoleranco. Rezultati projekta bodo neposredno uporabni za medijske hiše,
ponudnike spletnih vsebin ter za vladne in nevladne organizacije.
Na področju prava bo izvirni prispevek projekta pravna analiza korpusa, ki bo nakazala, koliko
kazensko pregonljivega DND pri nas ostaja nepreganjanega, pravne značilnosti DND v korpusu,
njegove tarče in stopnja problematičnosti. To bo pomembno prispevalo k poznavanju in razumevanju DND, pa tudi k njegovemu preprečevanju, ki je v primerjavi s kriminalnim pregonom vsekakor
prednostni družbeni mehanizem.
Projekt bo razvil številne vire in odprtokodna jezikovnotehnološka orodja za obdelavo spletne
slovenščine, ki bodo znatno učinkovitejši v primerjavi z obstoječimi. Projekt bo zgradil tudi ročno
označene podatkovne zbirke, ki bodo ključni vir za razvoj jezikovnotehnoloških orodij za slovenščino. Takšni viri in orodja bodo neposredno dostopni drugim raziskovalcem in, kadar bo to le mogoče, tudi
za komercialno rabo. Ti viri in orodja bodo pospešili nadaljnji razvoj jezikovnih tehnologij za
slovenščino.
Najpomembnejši znanstveni rezultati
Vmesno poročilo,
zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati
Vmesno poročilo,
zaključno poročilo