Nalaganje ...
Projekti / Programi vir: ARIS

Viri, metode in orodja za razumevanje, prepoznavanje in razvrščanje različnih oblik družbeno nesprejemljivega diskurza v informacijski družbi

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
6.05.02  Humanistika  Jezikoslovje  Teoretično in uporabno jezikoslovje 

Koda Veda Področje
H350  Humanistične vede  Jezikoslovje 

Koda Veda Področje
6.02  Humanistične vede  Jeziki in književnost 
Ključne besede
družbeno nesprejemljiv diskurz; računalniško posredovana komunikacija; korpusno jezikoslovje; kritična analiza diskurza; jezikovne tehnologije
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (17)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  28195  dr. Veronika Bajt  Družboslovje  Raziskovalec  2017 - 2020 
2.  30704  dr. Jernej Berzelak  Javno zdravstvo (varstvo pri delu)  Raziskovalec  2017 - 2020 
3.  30672  dr. Maja Bitenc  Jezikoslovje  Raziskovalec  2018 
4.  53338  Monika Bohinec  Kriminologija in socialno delo  Tehnični sodelavec  2020 
5.  36914  dr. Jaka Čibej  Jezikoslovje  Raziskovalec  2017 - 2020 
6.  05023  dr. Tomaž Erjavec  Jezikoslovje  Vodja  2017 - 2020 
7.  26294  dr. Darja Fišer  Jezikoslovje  Raziskovalec  2017 - 2020 
8.  14681  dr. Vojko Gorjanc  Jezikoslovje  Raziskovalec  2017 - 2020 
9.  24365  dr. Dejan Jontes  Družboslovje  Raziskovalec  2019 - 2020 
10.  27894  dr. Neža Kogovšek Šalamon  Pravo  Raziskovalec  2017 - 2020 
11.  50983  dr. Jakob Lenardič  Jezikoslovje  Raziskovalec  2018 - 2020 
12.  36871  dr. Nikola Ljubešić  Jezikoslovje  Raziskovalec  2017 - 2020 
13.  39534  Andrej Motl  Sociologija  Raziskovalec  2017 - 2020 
14.  03323  dr. Igor Mozetič  Računalništvo in informatika  Raziskovalec  2017 - 2020 
15.  20544  Irena Salmič    Tehnični sodelavec  2017 - 2020 
16.  37977  dr. Jasmina Smailović  Računalništvo in informatika  Raziskovalec  2017 
17.  10155  dr. Vasja Vehovar  Sociologija  Raziskovalec  2017 - 2020 
Organizacije (4)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacijŠtev. publikacij
1.  0106  Institut "Jožef Stefan"  Ljubljana  5051606000  18 
2.  0366  Mirovni inštitut  Ljubljana  5498295000 
3.  0581  Univerza v Ljubljani, Filozofska fakulteta  Ljubljana  1627058  15 
4.  0582  Univerza v Ljubljani, Fakulteta za družbene vede  Ljubljana  1626957 
Povzetek
Pojav različnih oblik družbeno nesprejemljivega diskurza, kot so sovražno, diskriminatorno in žaljivo izražanje, sicer še zdaleč ni nov, a se z njimi v zadnjem času zaradi številnih družbenih, kulturnih in ekonomskih sprememb izrazito intenzivno soočamo. Z razmahom informacijsko-komunikacijskih tehnologij in računalniško posredovane komunikacije ter s hitrostjo širjenja informacij po internetu so tovrstne diskurzivne prakse postale bolj razširjene in vplivnejše kot kdajkoli prej, zato je učinkovito proučevanje in soočanje z njimi mogoče le z avtomatskimi pristopi. Projekt združuje najsodobnejše kvantitativne in kvalitativne multidisciplinarne pristope, ki bodo omogočili raziskovanje rabe družbeno nesprejemljivega diskurza v sociokulturnem kontekstu. Poleg tega bodo predlagani novi podatkovno podprti pristopi na nestrukturiranih in polstrukturiranih podatkih premaknili meje tradicionalne humanistike in družboslovja. Kot stranski učinek bo projekt podpiral tudi razvoj novega področja digitalne humanistike in družboslovja, ki združuje orodja in metode s področja računalništva s tistimi iz humanistike in družboslovja. V okviru projekta bomo zgradili velika korpusa splošne slovenske računalniško posredovane komunikacije in družbeno nesprejemljivega diskurza, ki bosta služila kot podlaga za empirične raziskave. Zbrani korpusi bodo natančno strukturirani, besedila pa bodo jezikovno obdelana in obogatena z različnimi metapodatki. Razvili bomo tipologijo družbeno nesprejemljivega diskurza in njegovih tarč ter s pomočjo tipologije ročno označili reprezentativen vzorec besedil, s čimer bomo pridobili podatkovno zbirko, ki bo služila kot zlati standard za proučevanje tovrstne komunikacije. Z uporabo tehnik strojnega učenja na tej zbirki bomo razvili avtomatsko metodo za prepoznavanje in kategoriziranje družbeno nesprejemljivega diskurza ter njegovih tarč, nato pa bomo razvite metode aplicirali na zgrajena korpusa. Osrednji del raziskave so interdisciplinarne sociolingvistične analize na zgrajenih virih, v katerih se bomo osredotočili na migrante in islamofobijo, homofobijo in pravice istospolnih ter na seksizem in mizoginijo. Za to bomo uporabili kombinacijo metodologij in instrumentov korpusnega jezikoslovja, kritične analize diskurza in inferenčne statistike. Te pristope bomo dopolnili še s korpusno analizo pravnih vidikov DND in z anketami o dojemanju družbeno nesprejemljivega diskurza v slovenski družbi. V okviru projekta bomo organizirali tudi mednarodno interdisciplinarno delavnico in objavili znanstveno monografijo. Pomembno je tudi, da bo projekt omogočil prost in odprt dostop do raziskovalnih rezultatov, in sicer s pomočjo raziskovalnih infrastruktur CLARIN.SI in Arhiva družboslovnih podatkov. Raziskovalni podatki bodo vsebovali razvite jezikovne vire in programsko opremo, pri čemer bodo upoštevane vse pravne in etične omejitve varovanja osebnih podatkov. Na ta način bo projekt podprl tudi pobudo za odprto znanost in omogočil preverjanje raziskovalnih rezultatov.
Pomen za razvoj znanosti
Predlagani projekt predstavlja pomembno prelomnico v slovenski humanistiki in družboslovju, saj se še nihče ni lotil izčrpne inter- ter multidisciplinarne podatkovne raziskave DND. Projekt je za razvoj znanosti relevanten in pomemben zaradi štirih glavnih razlogov: Oprijemljiv rezultat projekta bosta velika bogato označena korpusa splošne RPK in DND ter podatkovne zbirke, ročno označene z vrsto in tarčo DND. Ti jezikovni viri bodo omogočili celovit vpogled v značilnosti različnih oblik DND v informacijski družbi in razvoj številnih novih raziskovalnih pristopov na področju jezikoslovja, sociolingvistike, kritične analize diskurza in antropologije ter s tem podprli razvoj tehnologij za analizo vsebine in besedilno analitiko za slovenščino, ki bodo široko uporabne v digitalni humanistiki in družboslovju. Rezultat projekta bo teoretično podkrepljeno in temeljito preizkušeno orodje za samodejno odkrivanje in klasifikacijo družbeno nesprejemljivih spletnih vsebin, ki bo neposredno uporabno v družboslovju, pravu in kriminologiji. Tovrstne storitve postajajo vse pomembnejše v družbi, ki temelji na znanju in visoki tehnologiji, kjer slovenščina v primerjavi z večino evropskih jezikov močno zaostaja, zaradi česar je v primerjavi z ostalimi jeziki v neenakopravnem položaju, razvoj slovenske družbe in jezika pa oviran. V nasprotju s številnimi slovenskimi projekti bodo rezultati tega projekta, ki bodo obsegali jezikovne vire, orodja in modele ter ročno označene podatkovne zbirke, prosto dostopni (Creative Commons) v skladu s smernicami. To bo zainteresiranim raziskovalcem pri nas in v tujini omogočilo reprodukcijo rezultatov projekta in izboljšave opravljenih raziskav. Z združevanjem metod računalništva ter metod humanističnih ved in družboslovja bo projekt omogočil razvoj nove raziskovalne smeri digitalne humanistike in družboslovja.
Pomen za razvoj Slovenije
Z združevanjem metod in pristopov iz različnih področij digitalne humanistike in družboslovja bo projekt omogočil boljše razumevanje DND v sodobni družbi ter razvil orodja in smernice za spopadanje z ekstremizmom in netoleranco. Rezultati projekta bodo neposredno uporabni za medijske hiše, ponudnike spletnih vsebin ter za vladne in nevladne organizacije. Na področju prava bo izvirni prispevek projekta pravna analiza korpusa, ki bo nakazala, koliko kazensko pregonljivega DND pri nas ostaja nepreganjanega, pravne značilnosti DND v korpusu, njegove tarče in stopnja problematičnosti. To bo pomembno prispevalo k poznavanju in razumevanju DND, pa tudi k njegovemu preprečevanju, ki je v primerjavi s kriminalnim pregonom vsekakor prednostni družbeni mehanizem. Projekt bo razvil številne vire in odprtokodna jezikovnotehnološka orodja za obdelavo spletne slovenščine, ki bodo znatno učinkovitejši v primerjavi z obstoječimi. Projekt bo zgradil tudi ročno označene podatkovne zbirke, ki bodo ključni vir za razvoj jezikovnotehnoloških orodij za slovenščino. Takšni viri in orodja bodo neposredno dostopni drugim raziskovalcem in, kadar bo to le mogoče, tudi za komercialno rabo. Ti viri in orodja bodo pospešili nadaljnji razvoj jezikovnih tehnologij za slovenščino.
Najpomembnejši znanstveni rezultati Vmesno poročilo, zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati Vmesno poročilo, zaključno poročilo
Zgodovina ogledov
Priljubljeno