PURY je podatkovna baza empiričnih geometrijskih parametrov za piljenje heteromolekul v kompleksih z makromolekularnimi strukturami. Temelji na Podatkovni bazi Struktur iz Cambridga (CSD). Ko je bil razvit PURY strežnik (Andrejašič in sod., 2008) je postalo jasno da je bazo mogoče izboljšati v vrsti primerov. Prva omejitve je bila v konceptu atomarnih razredov, ki so bili določeni izključno na osnovi uporabe apriornega kemijskega znanja o povezavah in planarnosti struktur. Na osnovi tega pristopa je nastalo preko dva tisoč atomarnih razredov in nekaj sto tisoč geometrijskih parametrov. Analiza je pokazala da je bila približno polovica med njimi statistično nezanesljiva in da je med njimi vrsta razredov in parametrov, ki so odveč saj opisujejo parametre z dejansko enako distribucijo. Naslednji pomislek izhaja iz dostopnosti rezultatov, saj licenca uporabe CSD eksplicitno omejuje njeno uporabo v javne namene. Z namenom, da bi podatkovno bazo lahko odprli javnosti smo pripravili tudi novo vrsto parametrov, ki temeljijo na Odprti Kristalografski Bazi (COD). Takšen set parametrov bo lahko javno dostopen in predvidevamo, da bo kmalu postal tako natančen kot ta iz CSD. Marca 2013 je COD vsebovala 220.000 struktur in stalno raste. Napisali smo vrsto programov v jeziku Python, ki dostopajo do vhodnih podatkov, organizirajo strukturno informacijo v podatkovni bazi in izločijo problematične vhodne podatke in molekularne strukture. Iterativni proces nato vzpostavi definicije atomarnih razredov. Proces temelji na topologiji molekul in distribuciji razdalj med posameznimi razredi. Ta sheme začne z imenom elementa in nato postopno veča kompleksnost razredov z vključevanjem sosedov z omejitvijo na tiste razrede, ki dajejo več modalne distribucije razdalj ali pa visoko standardno deviacijo. Ta postopek vodi do različnih stopenj kompleksnosti. Najvišja se pojavi pri hibridiziranih strukturah kot so obroči. Trenutna stopnja razvoja parametrov bo predstavljena.
B.06 Drugo
COBISS.SI-ID: 27630887