Keserű György Miklós (szerk.)

Gyógyszerkémia


4.6.1.2. Deszkriptorok

Deszkriptor (molekulaleíró) lényegében bármilyen mért vagy számolt tulajdonság lehet, ami feltételezhetően összefüggésbe hozható a vizsgált hatással. Mivel azt a teret, amiben molekuláink hasonlóságát – a molekulák távolságának számításával – értelmezzük, a deszkriptorok jelölik ki, ezért ezek megválasztása alapvetően meghatározza a későbbi predikció sikerességét. A deszkriptorok értékük szerint lehetnek valós szám (pl. logP), egész szám (pl. HBD) vagy bináris szám (pl. molekuláris ujjlenyomatok binjei) formátumúak. Egyes deszkriptorokból újabbak számíthatók, erre példa a logP, amelyből (további deszkriptorok felhasználásával) többek között a szolubilitási deszkriptor (logS) számolható. A deszkriptorok lehetnek egyszerű, globális értékek (pl. MW), vagy összetett deszkriptorok, amelyek lényegében sok egyszerű deszkriptorból állnak össze (pl. molekuláris ujjlenyomatok). A deszkriptorok között megkülönböztetünk 1D, 2D és 3D deszkriptorokat az alapján, hogy a molekulának milyen szintű reprezentációja szükséges a számolásukhoz.
Az 1D molekulaleírók a molekulákat egy egészként kezelik, és róluk semmilyen lokális információt nem tárolnak. Az irodalomban egyesek 0D leírókként is említik őket. Idesorolhatók azok a leírók, amiket a molekula összegképlete alapján ki lehet számolni, így például a szénatomok száma, a nehéz atomok (nem hidrogénatomok) száma vagy MW.
A 2D deszkriptorok számítása a molekula szerkezeti képletében (a molekulagráfban) rejlő információ használatát igényli. Ilyen lehet például a molekulában tálalható gyűrűk száma, a hidrogéndonorok és -akceptorok száma, a HOMO- és LUMO-pályák energiái. A molekulagráf ún. topológiai leíróinak használata szintén széles körben elterjedt. Számításuk gyors és egyszerű, a molekulák atomjai/fragmensei közötti távolság pedig a közöttük levő kötések számával egyezik meg. A gráf alapján egy molekula fragmensekre bontható, és leírható additív módon ezen fragmensek kontribúcióival. A legegyszerűbb fragmensek maguk az atomok. Számos atomalapú módszer alapja a következő egyenlet:
 
 
ahol H az adott biológiai hatás, ni az i atomtípusba tartozó atomok száma, Ai pedig az i atomtípusba tartozó atomok kontribúciója a hatáshoz. Ai értéke mért adatok alapján statisztikai módszerekkel számítható.
Erre a számolási módszerre épül pl. az ALOGP nevű logP-számító eljárás (Wildman és mtsa, 1999). A gráf alapján azonban generálhatunk kötésalapú vagy atompár típusú leírókat is. A több atomot és kötést magukban foglaló fragmensek leírói közül megemlítjük az ún. topológiai torziókat (topological torsions), amelyek 4 konszekutívan kapcsolódó nehéz atomot használnak fel (Nilakantan és mtsai, 1987). Az így létrejövő fragmenseket az alkotó atomok, a hozzájuk kapcsolódó nehéz atomok és a bennük levő π-elektronpárok számával jellemzik.
A fragmensalapú leírókkal kapcsolatban általában két probléma merül fel: mit kezdjünk a hiányzó fragmensekkel (melyekhez nem áll rendelkezésre pontos aktivitásadat), és hogyan írhatunk le velük sztereomer-függő biológiai hatásokat. A hiányzó fragmenseket általában egyéb kategóriába szokták sorolni, és egy átlagos értékkel veszik őket figyelembe. Egyes programok ilyen esetben jelzik, hogy a molekulában olyan fragmens is szerepelt, amire nincsenek megfelelő paraméterek, így ezeket a molekulákat célszerű kihagyni az adott szűrési lépésből. A sztereomerek kérdése sajnos nem oldható meg kizárólag a gráfok vizsgálatával. Jó megoldás lehet azonban speciális atomhoz rendelt jelölések bevezetése, például egy kiralitáscentrumban az R/S konfiguráció jelölése.
A legelterjedtebb fragmensalapú leírók közé tartozik az ún. molekuláris ujjlenyomat (molecular fingerprint), amely a molekulákat bitek (0-ák és 1-esek) sorozataként írja le. Az egyes bitek értéket az határozza meg, hogy egy adott fragmens megtalálható-e (1) vagy sem (0) a molekulában. A bitek tehát egyszerű deszkriptoroknak tekinthetők, amelyekből összeáll a molekula egészét jellemző bitsorozat, vagyis egy összetett deszkriptor. Ez a forma nagyon gyorsan számítható, és mivel nagy adatbázisok ujjlenyomatai is elférnek a számítógép memóriájában, rendkívül gyorsan lehet velük számolni. Az előre definiált alszerkezetekre kereső ujjlenyomatokat szerkezeti kulcsoknak (structural keys) nevezzük. Ez a módszer azonban kevésbé hatékony, ha a molekulák olyan fragmensekből állnak, amikre az adott ujjlenyomat nem keres. Ennek a problémának a megoldására találták ki az ún. lineáris ujjlenyomatokat, amelyek adott hosszúságú (ált. 4–7 kötésnyi) fragmensekre bontják a molekulákat, és egy ún. hash kód alapján az adott fragmenseket több, de mindig ugyanazon binekhez rendelik. Egy fragmens tehát több binhez van rendelve, de ugyanahhoz a binhez több fragmens is tartozhat. Ennek a módszernek a hátránya, hogy elveszik az egyértelmű megfeleltethetőség az egyes bitek és az alszerkezetek között, ugyanakkor az egyes molekulákra jellemző bitmintázatot kapunk, és annak az esélye, hogy két molekula ugyanazt az ujjlenyomatot kapja, az ujjlenyomat hosszának növelésével csökkenthető.
Ugyancsak gráfalapú leírók közé tartoznak az ún. atompárok (Avidon és mtsai, 1982; Carhart és mtsai, 1985), amelyek két atomtípust és topológiai távolságukat (az őket összekötő legrövidebb úthoz tartozó kötések számát) rögzítik. Két atom helyett használhatunk akár 3 vagy 4 atomot is (ennél több már nem praktikus), ekkor atomtriplettekről, illetve atomkvartettekről beszélünk. Ehhez nagyon hasonló módon definiáljuk az ún. 2D farmakofór ujjlenyomatokat (Bonachéra és mtsai, 2006). Itt az atomokat először farmakofór tulajdonság- (pharmacophore feature) osztályokba (általában: hidrogéndonor, hidrogénakceptor, pozitív töltésű, negatív töltésű, hidrofób, aromás) soroljuk, és ezeket a csoportokat, valamint az egymástól való távolságukat tároljuk. A tárolás binekbe rendezett módon történik, ahol a binekhez adott farmakofór tulajdonságkombinációk és megfelelő távolsági intervallumok tartoznak. Erre példa az ún. CATS deszkriptor (Schneider és mtsai, 1999), amely a molekula atomjait 5 farmakofór tulajdonságosztály valamelyikébe sorolja, és a farmakofór tulajdonságpárokat 10 különböző távolságintervallumba rendezi. Fontos megemlíteni azonban, hogy a farmakofór-ujjlenyomatok még nem jelentenek farmakofór-modellt, ugyanis a bennük levő binek csak azt mutatják, hogy egy adott farmakofór-elrendeződés egy molekulában lehetséges-e vagy sem. Arról nem hordoznak információt, hogy ez fontos vagy lényegtelen a vizsgált célfehérjére vonatkozó biológiai aktivitás szempontjából.
A molekuláris ujjlenyomatok lineáris leíróknak tekinthetők, mivel egy bitsorozattal írják le a molekulákat. Vannak azonban nemlineáris leírók is, ilyen például maga a teljes gráf vagy ilyenek az ún. redukált gráfok, amelyekben a gráfcsúcsok vegyesen jelenthetnek atomokat és nagyobb fragmenseket is. A redukált gráfok közé tartozik például a Feature Trees deszkriptor (Rarey és mtsa, 1998), amely a 2D farmakofór-ujjlenyomat mintájára farmakofór tulajdonságosztályokba sorolja a molekula atomjait vagy atomcsoportjait, de megőrzi ezek teljes konnektivitási rendszerét egy tulajdonságfa (Feature Tree) formájában.
Azokat a leírókat, amelyek a molekula 3D reprezentációjából származtathatók, 3D deszkriptoroknak nevezzük. Idetartoznak például az oldószer számára hozzáférhető felszín (solvent accessible surface area), a molekula-térfogat (volume) és a különböző potenciálfelületek, mezők (lásd CoMFA-módszer).
A gráfból származtatott 2D leírókkal szemben, a 3D deszkriptorok számításához már szükség van a molekula 3D szerkezetének (ideális esetben a kötőhelyen megvalósuló bioaktív konformáció) előállítására. Ez történhet például szabályalapú módszerek alkalmazásával vagy ún. molekuláris erőterekben történő optimalizálással, egyes esetekben pedig akár kvantumkémiai alapokon számolt konformerek is alkalmazhatók. Utóbbira példa a PubChemQC projekt (Nakata és mtsa, 2023), melynek során a PubChem adatbázis 86 millió molekulájára generáltak egyensúlyi szerkezetet. Ezen szerkezetek alapján hatékony, gépi tanulásos konformergeneráló modellek építhetők (Ganscha és mtsai, 2025). Ezeknek a módszereknek is vannak azonban korlátai, ezért nem feltétlenül várható tőlük, hogy az általuk legalacsonyabb energiájúnak vélt konformáció megegyezik majd a kötőhelyen megvalósulóval.
A 3D leírók közé tartoznak az ún. 3D farmakofór ujjlenyomatok (McGregor és mtsa, 1999), amelyek a 2D farmakofór ujjlenyomatokhoz hasonlóan farmakofór tulajdonságok egymástól való távolságát tárolják, azonban a távolság itt már nem kötéstávolságot, hanem térbeli (euklideszi) távolságot jelent. A 3D farmakofór ujjlenyomatok konformációfüggésének problémáját általában két módon lehet kezelni. Az első esetben minden molekuláról több, alacsony energiájú konformert állítunk elő, és a hozzájuk tartozó ujjlenyomatokkal együtt mindegyiket tároljuk. A másik lehetőség a különböző konformerekhez tartozó ujjlenyomatok „összeolvasztása” a VAGY operátor használatával (ha az egyik konformer adott binjében 0 van, a másik konformerben pedig 1-es, akkor az összeolvasztott ujjlenyomatba 1-es kerül). Így a keletkező ujjlenyomat az összes konformer összes lehetséges farmakofór elrendeződését tartalmazni fogja.
Ugyancsak ebbe a csoportba tartoznak a molekuláris mező típusú leírók (Cramer és mtsai, 1988), amelyek számításához a molekula 3D szerkezete szükséges. Ez a megközelítés összhangban van azzal a gondolattal, miszerint a molekulák valójában a körülöttük levő molekuláris mezők és nem az alattuk rejlő vázszerkezet (molecular skeleton) által ismerik fel egymást. Számos különböző molekuláris mező számítható, amelyek közül a leggyakrabban használtak a molekula elektrosztatikus potenciálja (MEP), valamint a hidrogénkötő-, van der Waals- és hidrofób potenciálok. Szerkezetileg jelentősen eltérő molekuláknak is lehetnek hasonló molekuláris mezői, így az ilyen alapú virtuális szűrővizsgálatok alkalmasak lehetnek alapszerkezet-váltásra is. A mezők generálása ún. próbarészecskékkel történik (pl. elektron, sp3 szénatom, egységnyi pozitív töltés). A molekulákat egy adott felbontású rácsba helyezzük, amelynek minden egyes pontjára kiszámítjuk a próba és a molekula kölcsönhatását. A molekuláris mezők ugyancsak összetett deszkriptoroknak tekinthetők, amelyeket az egyes rácspontokra számolt egyszerű deszkriptorok építenek fel.

Gyógyszerkémia

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2026

ISBN: 978 963 664 145 0

A kötet az Akadémiai Kiadónál 2011-ben Gyógyszerkutatás kémiája címen megjelent kézikönyv hagyományaira alapozva a kismolekulás gyógyszerkutatás eszköztárára és módszertanára fókuszál. Újdonságot jelent a magyar nyelvű szakirodalomban, hogy a modern gyógyszerkémiai felfogásnak megfelelően nem pusztán a meglévő gyógyszerkincs kémiáját mutatja be, hanem betekintést enged a kismolekulás gyógyszerek felfedezésének stratégiájába is.

Hivatkozás: https://mersz.hu/keseru-gyogyszerkemia//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave