Članek je predstavil novo segmentacijsko arhitekturo globokega učenja, ki je zasnovana za detekcijo in segmentacijo površinskih napak z uporabo popolnoma nadzorovanega učenja. Predlagani model je bil zasnovan za uporabo z majhnim številom učnih primerov, kar je pomembna zahteva pri praktičnih aplikacijah. Primerjava z drugimi sorodnimi metodami globokega učenja, vključno z najsodobnejšo komercialno programsko opremo, je pokazala, da predlagani pristop presega sorodne metode. To je prikazano na novo ustvarjeni zbirki podatkov iz praktičnega primera nadzora kakovosti, kjer je bilo mogoče predlagani pristop naučiti z majhnim številom okvarjenih površin, t.j., le približno 25–30 učnih primerov napak, namesto sto ali tisoč, kot je običajno zahtevano za metode globokega učenja. S tem postane metoda globokega učenja praktična za uporabo v industriji, kjer je število razpoložljivih vzorcev pogosto zelo omejeno. S strani raziskovalne skupnosti je bil izkazan zelo velik interes za to delo, tako za objavljeno izvorno kodo, kot tudi za javno objavljeno zbirko slik, ki jo je preneslo že preko 3000 raziskovalcev. Predlagana metoda dosega odlične rezultate v diskriminativnem nadzorovanem načinu učenja in predstavlja zelo dobro osnovo tudi za nadgradnje v šibko nadzorovan, delno nadzorovan in nenadzorovan način učenja.
COBISS.SI-ID: 1538225859
V članku smo predlagali novo premikajočo agregacijsko enoto (DAU) za globoke konvolucijske mreže, ki v globoke modele uvaja nove kompozicionalne lastnosti. V nasprotju s klasičnimi filtri z enotami (kot slikovnimi elementi) nameščenimi na togi mreži, so premiki enot v filtru DAU naučeni, kar privede do globokih mrež z novimi lastnostmi, kot je neodvisnost št. parametrov od velikosti dovzetnega polja, učenje velikosti dovzetnega polja ter samodejno prilagajanje prostorskega fokusa značilk. Nove lastnosti so tako privedle do učinkovitih globokih nevronskih mrež z manjšim številom operacij in parametrov, ter omogočile novo analizo parametrov in prostorske pokritosti značilk. Prednosti filtra DAU so bile nazorno prikazane na nalogah klasifikacije, semantične segmentacije in razmeglejevanja slik. Rezultati so pokazali boljšo učinkovitost uporabe parametrov v modelih s filtrom DAU, kar je privedlo do 4-krat bolj kompaknih globokih nevronskih mrežah pri podobni ali celo boljši natančnosti in točnosti. Predlagana metoda je torej primerna za modeliranje konsistentnosti v slikah tako v polnokovolucijskih modelih za segmentacijo kot tudi za generativne modele, saj se velikost dovzetnega polja veliko enostavneje prilagaja vsebini slik, oz. konsistentnosti vsebine množice slik, kot standarna konvolucija.
COBISS.SI-ID: 1538492611
V članku smo obravnavali vprašanje detekcije in razpoznavanja velikega števila kategorij predmetov, ki smo ga aplicirali na problem detekcije in razpoznavanja prometnih znakov. Pristop s konvolucijsko nevronsko mrežo (CNN), Mask R-CNN, je bil prilagojen za obravnavno celotnega cevovoda detekcije in razpoznavanja z avtomatskim in enovitim postopkom učenja. Več predlaganih izboljšav je bilo evalviranih na problemu detekcije 200 kategorij prometnih znakov iz na novo zajete podatkovne zbirke. Fokus evalvacije je bil na detekciji zahtevnejših kategorij prometnih znakov, ki še niso bile obravnavane v sorodnih delih. Obsežna analiza metod globokega učenja za zaznavanje prometnih znakov z veliko variacijo izgleda znotraj kategorije je pokazala na maksimalno 3% napako, s čimer je presegla rezultate sorodnih del. S temi raziskavami smo začeli že pred izvajanjem tega projekta, smo pa z njimi zaključili v okviru dela na projektu, na katerem smo tako evalvirali tudi dvofazni detekcijski pristop (detekcija regij zanimanja, ki ji sledi klasifikacija posameznih regij) kot komplement na projektu prevladujočemu polnokonvolucijskemu segmentacijskemu pristopu.
COBISS.SI-ID: 1538227907