Keserű György Miklós (szerk.)

Gyógyszerkémia


4.6.3. Validálás

A virtuális szűrő megépítése után a következő lépés a modell validálása. Ez modelltől függően különböző lépéseket tartalmazhat. A modellel szemben támasztott elvárásaink, a modell jellege és a referenciamolekulákról rendelkezésre álló információk alapján alapvetően regressziós (becsült és valós affinitás összevetése), illetve ún. dúsulási (aktívak véletlenhez képesti dúsulása a rangsorolt tesztadatbázis elején) teszteket végezhetünk. Előbbi esetben a validálásra ismert aktivitású molekulákat használunk, és az affinitásukat a modellel becsüljük. A regressziós validálási lépések között lehetnek olyanok, amelyek a tanító halmaz molekuláira épülnek (pl. korrelációs koefficiens számítása a referenciamolekulákra), de minden esetben szükség van egy külső tesztkészleten történő validálási lépésre is. A QSAR típusú modellek validálásáról részletesebben a 4.6.6. fejezetben lesz szó.
A dúsulási teszteknél az aktív és inaktív vegyületeket ugyancsak külső (modellépítéshez fel nem használt) forrásból vesszük. Itt nem feltélel az aktivitás értékének pontos ismerete, a molekulákat aktív és inaktív osztályokba soroljuk. Ez a klasszifikációs szemlélet összhangban van a virtuális szűrés filozófiájával is, ahol a vizsgált vegyületeket a folyamat végén két (biológiai szűrésre javasolt és nem javasolt) osztályba soroljuk. Az aktív és inaktív vegyületek kiválasztásánál általános szempontként említhető a maximális diverzitás. Ideális esetben a validáláshoz használt aktív és inaktív vegyületeket kísérleti adatok alapján választjuk ki. Ha ilyen adatok nem állnak rendelkezésre, akkor inaktívként véletlenszerűen kiválasztott molekulákat is alkalmazhatunk tekintve, hogy ezen vegyületeknek kicsi az esélye (HTS találati arányait figyelembe véve 0,01–1%) arra, hogy a célmakromolekulán jelentős aktivitást mutassanak. Az inaktív vegyületeket érdemes úgy megválasztani, hogy fizikokémiai tulajdonságaik minél jobban hasonlítsanak az aktív molekulákéira, így különbséget tehetünk a valóban prediktív és a csak néhány egyszerű fizikokémiai tulajdonság alapján diszkrimináló modellek között (Huang és mtsai, 2006). A dúsulási tesztekben a virtuális szűrés nyomán előálló rangsorban (amennyiben nem eleve osztályokba sorolják a tesztvegyületeket – lásd klasszifikációs modellek) mindig meghúzunk egy határt – e felett helyezkednek el az ún. virtuális találatok (virtual hit) (4.6.5. ábra). A virtuális találatok között levő ténylegesen aktív vegyületeket valós pozitívoknak (VP), az inaktívakat pedig hamis pozitívoknak (HP) nevezzük. A virtuális találatok alatti tartományban levő aktívakat hamis negatívakként (HN), az inaktívakat pedig valós negatívakként (VN) azonosítjuk (4.6.5. ábra). A határt úgy célszerű meghúzni, hogy a virtuális találatok között minél nagyobb legyen az aktívak aránya (találati arány – hit rate). A találati arány azonban függ az adatbázisban található aktív vegyületek arányától, ezért a jobb összehasonlíthatóság érdekében a modellek hatékonyságát jellemezhetjük az ún. dúsulási faktorral is. A dúsulási faktor nem más, mint a virtuális találatok közti aktívak és a teljes adatbázisban található aktívak aránya. A dúsulási faktor azt mutatja meg, hogy a véletlen kiválasztáshoz képest modellünk segítségével hányszor nagyobb eséllyel választunk ki aktív vegyületet. A dúsulást jellemző további paraméterek még a szenzitivitás (VP/(VP+HN)) és a specificitás (VN/(VN+HP)), amelyek arról tájékoztatnak, hogy az aktívakat, illetve az inaktívakat milyen arányban soroltuk helyes osztályba. A szenzitivitást (valós pozitívok aránya) az 1-specificitás (hamis pozitívok aránya) függvényeként ábrázolva, az ún. ROC- (receiver operating characteristic) görbéhez jutunk. A ROC-görbék különösen hasznosak lehetnek az aktívak és inaktívak közötti határ kijelölésében.
 
4.6.5. ábra. Egy tesztadatbázis valós és becsült aktivitásadatainak eloszlása (A). A valós aktivitási értékhatár (vízszintes vonal) és a becsült aktivitási értékhatár (függőleges vonal) felett helyezkednek el az aktív molekulák, illetve a virtuális találatok. Utóbbi határérték ideális helyének meghatározásában nyújthat segítséget az azonosított aktívak (B) és a dúsulási faktorok (C) ábrázolása a rangsorolt adatbázis %-ának függvényében, valamint az ún. ROC -görbe (D). A B–D ábrákon az elméletileg lehetséges maximális (pontozott vonal), a véletlenszerű (szaggatott vonal) és az A ábrán szereplő szűrési eljárással elérhető (folytonos vonal) hatékonyságokat is jelöltük
Forrás: saját szerkesztés
 
A validálási tesztek segítségével információt kaphatunk modellünk várható hatékonyságáról, és arról is, hogy a modell mennyire képes extrapolálni – azaz a tanító halmaz deszkriptorterén kívül eső molekulák aktivitását jósolni. Így kijelölhetjük modellünk alkalmazhatósági tartományát (applicability domain).

Gyógyszerkémia

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2026

ISBN: 978 963 664 145 0

A kötet az Akadémiai Kiadónál 2011-ben Gyógyszerkutatás kémiája címen megjelent kézikönyv hagyományaira alapozva a kismolekulás gyógyszerkutatás eszköztárára és módszertanára fókuszál. Újdonságot jelent a magyar nyelvű szakirodalomban, hogy a modern gyógyszerkémiai felfogásnak megfelelően nem pusztán a meglévő gyógyszerkincs kémiáját mutatja be, hanem betekintést enged a kismolekulás gyógyszerek felfedezésének stratégiájába is.

Hivatkozás: https://mersz.hu/keseru-gyogyszerkemia//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave