La ĉi-jara Premio Lasker por Baza Medicina Esplorado estis aljuĝita al Demis Hassabis kaj John Jumper pro iliaj kontribuoj al la kreado de la artefaritinteligenteca sistemo AlphaFold, kiu antaŭdiras la tridimensian strukturon de proteinoj surbaze de la unuaorda sekvenco de aminoacidoj.
Iliaj rezultoj solvas problemon, kiu longe turmentas la sciencan komunumon, kaj malfermas la pordon al akcelo de esplorado tra la biomedicina kampo. Proteinoj ludas pivotan rolon en malsanevoluo: en Alzheimer-malsano, ili faldiĝas kaj kunbuliĝas; en kancero, ilia reguliga funkcio perdiĝas; en denaskaj metabolaj malsanoj, ili estas misfunkciaj; en mukoviskozeco, ili iras en la malĝustan spacon en la ĉelo. Jen nur kelkaj el la multaj mekanismoj, kiuj kaŭzas malsanon. Detalaj proteinstrukturaj modeloj povas provizi atomkonfiguraciojn, stiri la dezajnon aŭ selektadon de alt-afinecaj molekuloj, kaj akceli la malkovron de medikamentoj.
Proteinaj strukturoj estas ĝenerale determinitaj per rentgen-kristalografio, nuklea magneta resonanco kaj krio-elektrona mikroskopio. Ĉi tiuj metodoj estas multekostaj kaj tempopostulaj. Tio rezultigas ekzistantajn 3D-datumbazojn pri proteinstrukturoj kun nur ĉirkaŭ 200 000 strukturaj datumoj, dum DNA-sekvenca teknologio produktis pli ol 8 milionojn da proteinsekvencoj. En la 1960-aj jaroj, Anfinsen kaj aliaj malkovris, ke la 1D-sekvenco de aminoacidoj povas spontanee kaj ripeteble faldiĝi en funkcian tridimensian formon (Figuro 1A), kaj ke molekulaj "ŝaperonoj" povas akceli kaj faciligi ĉi tiun procezon. Ĉi tiuj observoj kondukas al 60-jara defio en molekula biologio: antaŭdiri la 3D-strukturon de proteinoj el la 1D-sekvenco de aminoacidoj. Kun la sukceso de la Homa Genaro-Projekto, nia kapablo akiri 1D-aminoacidajn sekvencojn multe pliboniĝis, kaj ĉi tiu defio fariĝis eĉ pli urĝa.
Antaŭdiri proteinajn strukturojn estas malfacile pro pluraj kialoj. Unue, ĉiuj eblaj tridimensiaj pozicioj de ĉiu atomo en ĉiu aminoacido postulas multan esploradon. Due, proteinoj maksimume utiligas komplementecon en sia kemia strukturo por efike konfiguri atomojn. Ĉar proteinoj tipe havas centojn da hidrogenligaj "donantoj" (kutime oksigeno), kiuj devus esti proksimaj al la hidrogenliga "akceptanto" (kutime nitrogeno ligita al hidrogeno), povas esti tre malfacile trovi konformaciojn, kie preskaŭ ĉiu donanto estas proksima al la akceptanto. Trie, ekzistas limigitaj ekzemploj por la trejnado de eksperimentaj metodoj, do necesas kompreni la eblajn tridimensiajn interagojn inter aminoacidoj surbaze de 1D-sekvencoj uzante informojn pri la evoluo de la koncernaj proteinoj.
Fiziko unue estis uzata por modeli la interagadon de atomoj serĉante la plej bonan konformacion, kaj metodo estis evoluigita por antaŭdiri la strukturon de proteinoj. Karplus, Levitt kaj Warshel ricevis la Nobel-premion pri kemio en 2013 pro sia laboro pri komputila simulado de proteinoj. Tamen, fizik-bazitaj metodoj estas komputile multekostaj kaj postulas proksimuman prilaboradon, do precizaj tridimensiaj strukturoj ne povas esti antaŭdiritaj. Alia "sciobazita" aliro estas uzi datumbazojn de konataj strukturoj kaj sekvencoj por trejni modelojn per artefarita inteligenteco kaj maŝinlernado (AI-ML). Hassabis kaj Jumper aplikas elementojn de kaj fiziko kaj AI-ML, sed la novigado kaj salto en efikeco de la aliro devenas ĉefe de AI-ML. La du esploristoj kreive kombinis grandajn publikajn datumbazojn kun industri-nivelaj komputilaj rimedoj por krei AlphaFold.
Kiel ni scias, ke ili "solvis" la enigmon de struktura antaŭdiro? En 1994, la konkurso Kritika Takso de Struktura Antaŭdiro (CASP) estis establita, kiu kunvenas ĉiun duan jaron por spuri la progreson de struktura antaŭdiro. La esploristoj dividos la 1D-sekvencon de la proteino, kies strukturon ili ĵus solvis, sed kies rezultoj ankoraŭ ne estas publikigitaj. La antaŭdiro antaŭdiras la tridimensian strukturon uzante ĉi tiun 1D-sekvencon, kaj la taksisto sendepende juĝas la kvaliton de la antaŭdiritaj rezultoj komparante ilin kun la tridimensia strukturo provizita de la eksperimentisto (provizita nur al la taksisto). CASP faras verajn blindajn reviziojn kaj registras periodajn rendimentajn saltojn asociitajn kun metodika novigado. Ĉe la 14-a CASP-Konferenco en 2020, la antaŭdiraj rezultoj de AlphaFold montris tian salton en rendimento, ke la organizantoj anoncis, ke la problemo de 3D-struktura antaŭdiro estis solvita: la precizeco de la plej multaj antaŭdiroj estis proksima al tiu de eksperimentaj mezuradoj.
La pli larĝa signifo estas, ke la laboro de Hassabis kaj Jumper konvinke montras kiel AI-ML povus transformi sciencon. Ĝia esplorado montras, ke AI-ML povas konstrui kompleksajn sciencajn hipotezojn el pluraj datenfontoj, ke atentmekanismoj (similaj al tiuj en ChatGPT) povas malkovri ŝlosilajn dependecojn kaj korelaciojn en datenfontoj, kaj ke AI-ML povas memtaksi la kvaliton de siaj rezultoj. AI-ML esence faras sciencon.
Afiŝtempo: 23-a de septembro 2023




