Projekti / Programi
Statistične metode za visoko razsežne omične podatke v povezavi s semantičnimi relacijami iz biomedicinske literature
Koda |
Veda |
Področje |
Podpodročje |
3.08.00 |
Medicina |
Javno zdravstvo (varstvo pri delu) |
|
Koda |
Veda |
Področje |
B110 |
Biomedicinske vede |
Bioinformatika, medicinska informatika, biomatematika, biometrija |
Koda |
Veda |
Področje |
3.05 |
Medicinske in zdravstvene vede |
Druge medicinske vede |
Bioinformatika, medicinska informatika, biomatematika, biometrija
Raziskovalci (16)
Organizacije (1)
Povzetek
Visoke tehnologije za merjenje izražanja genov so sprožile raziskovanje in razvoj podobnih orodij na vseh “omičnih” področjih (genomika, proteomika, …).
Glavna značilnost tako pridobljenih podatkov je njihova visoka razsežnost, kar pomeni, da je število merjenih spremenljivk mnogo večje od števila enot. V zadnjih desetih letih je produkcija in uporaba visokorazsežnih podatkov v biomedicinskem raziskovanju skokovito narasla in razvitih je bilo več statističnih metod za pravilno analizo takšnih podatkov.
Biomedicinske raziskave, ki uporabljajo visokorazsežne podatke, imajo tipično dva cilja (i) odkriti pravila, po katerih natančno napovemo razredno pripadnost novih enot (napovedovanje razreda) in (ii) identificirati spremenljivke, katrih porazdelitve se ločijo med vnaprej določenimi razredi (primerjava razredov). Tretji cilj, ki se vse bolj pojavlja, je (iii) integracija podatkov iz različnih virov z namenom, da dobimo bolj zanesljive rezultate glede prvih dveh ciljev. Viri podatkov so lahko že objavljeni podatki o istem znanstvenem vprašanju ali pa meritve na istih vzorcih, ki pa so namenjene drugim “omičnim” področjem ali morda drugim kliničnim vidikom (na primer ko so meritve genske izraženosti in analiza sprememb v številu kopij DNA zaporedij narejene na istih enotah in so dostopni tudi klinični podatki).
Namen tega projekta je nadaljevati naše metodološke raziskave na področju napovedovanja in primerjave razredov, evalvacija strategij in razvoj nekaterih novih in nujno potrebnih metod za integracijo visoko razsežnih podatkov iz različnih virov.
Dodatno bomo k temu dodali semantične relacije, pridobljene iz biomedicinske literature. Biomedicinska literatura je še vedno glavni vir biomedicinskega znanja, vendar so zaradi njene obsežnosti za njeno procesiranje potrebne računalniške metode. Pri nas že dalj časa razvijamo programe, ki z uporabo procesiranja naravnega jezika iščejo ustrezne semantične relacije. Te predstavljajo dejstva, objavljena v literaturi, in ta so predstavljena v obliki, ki je primerna tudi za statistične metode.
Pomen za razvoj znanosti
Člani naše raziskovalne skupine so imeli dolgo tradicijo raziskovanja na področju analize preživetja, kar se kaže v številnih znanstvenih objavah, ki so dokumentirane v naši bibliografiji. V zadnjih letih smo bili aktivni tudi pri raziskovanju visokorazsežnih podatkov; izvajali smo analize ter preučevali metodološke značilnosti uporabljenih metod. Razvili smo tudi javno dostopna orodja za analizo „omičnih” podatkov, kot tudi za pomoč pri interpretaciji rezultatov. S tem projektom smo lahko združili različna znanja naše skupine in nadaljevali raziskovanje na tem hitro rastočem področju. Projekt je veliko doprinesel k pravilni statistični analizi visokorazsežnih podatkov, tako metodološko kot pri uporabi teh metod v praksi.. Naš cilj je bil boljše razumevanje lastnosti obstoječih metod in razvoj novih, ustreznejših metod za analizo visokorazsežnih „omičnih” podatkov in orodij za interpretacijo rezultatov iz tovrstnih analiz, s čimer smo povečali vpliv in uporabnost naših odkritij. Menimo, da smo dosegli ta cilj, saj smo prispevali metodološke rezultate, razvili nova programska orodja in uspostavili stike z raziskovalnimi biomedicinskami skupinami,v sodelovanju s katerimi smo načrtovali in analizirali visokorazsežne „omične” podatke.
Pomen za razvoj Slovenije
Tehnologija, ki se uporablja v „omičnem” raziskovanju se izredno hitro razvija, kar ustvarja nov tip podatkov, ki terjajo razvoj novih statističnih metod in novih orodij za njihovo analizo in interpretacijo. Take podatke generira čedalje večje število slovenskih raziskovalcev na področju biomedicine. Splošno znano je, da veliko znanstvenih člankov, ki uporabljajo nove tehnologije, uporablja napačne statistične metode za načrtovanje in analizo poskusov, saj je poznavanje problemov, ki jih prinaša nov tip podatkov, zelo omejeno. Statistiki in bioinformatiki, ki so sodelovali pri projektu, so v teku projekta nudili podporo raziskovalnemu in strokovnemu delu v slovenski biomedicini. Analizirali smo visokorazsežne podatke iz “omičnega” področja, ki so jih generirali slovenski raziskovalci ter pomagali pri načrtovanju raziskav in pri interpretaciji rezultatov. Prepričani smo, da je metodološko znanje, ki smo ga pridobili z izvedbo projekta, bistveno prispevalo k boljšem sodelovanju s slovenskimi raziskovalci in na izboljšanje kakovosti izdelkov, ki so nastali tekom sodelovanja. To predstavlja eno od osnovnih usmeritvah našega inštituta, ki je nuditi najkvalitetnejšo podporo raziskovalnemu delu v slovenski medicini.
Najpomembnejši znanstveni rezultati
Letno poročilo
2011,
2012,
2013,
zaključno poročilo,
celotno poročilo na dLib.si
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati
Letno poročilo
2012,
2013,
zaključno poročilo,
celotno poročilo na dLib.si