永利赌场选144-永利赌场开户1-威尼斯人娱乐城购物

清華主頁(yè) - 清華新聞 - 學(xué)術(shù)科研 - 正文

清華大學(xué)團(tuán)隊(duì)聯(lián)合研發(fā)AI驅(qū)動(dòng)的超高通量藥物虛擬篩選平臺(tái)DrugCLIP

清華新聞網(wǎng)1月12日電 目前,人類(lèi)對(duì)靶向藥物的探索約覆蓋人體全部可成藥靶點(diǎn)的10%。面對(duì)數(shù)以萬(wàn)計(jì)的潛在靶點(diǎn),如何在廣闊的化學(xué)空間中,快速篩選苗頭化合物,已成為該領(lǐng)域研究的瓶頸。清華大學(xué)智能產(chǎn)業(yè)研究院教授(AIR)蘭艷艷聯(lián)合生命學(xué)院、化學(xué)系團(tuán)隊(duì)創(chuàng)新研發(fā)AI驅(qū)動(dòng)的超高通量藥物虛擬篩選平臺(tái)DrugCLIP,比傳統(tǒng)方法實(shí)現(xiàn)了百萬(wàn)倍提升,在預(yù)測(cè)準(zhǔn)確率上也取得顯著突破。依托該平臺(tái),團(tuán)隊(duì)首次完成了覆蓋人類(lèi)基因組規(guī)模的藥物虛擬篩選,為創(chuàng)新藥物發(fā)現(xiàn)帶來(lái)了新的可能性。

圖片 

圖1.DrugCLIP主頁(yè)

目前,受限于自動(dòng)移液工作站、超級(jí)計(jì)算機(jī)等工具的高昂成本,絕大多數(shù)潛在靶點(diǎn)和化合物仍未被充分探索。人類(lèi)基因組編碼2萬(wàn)余個(gè)蛋白,現(xiàn)有蛋白靶點(diǎn)開(kāi)發(fā)只覆蓋其中小部分。若使用當(dāng)前最先進(jìn)的分子對(duì)接工具篩選1萬(wàn)個(gè)蛋白靶點(diǎn),假設(shè)每個(gè)靶點(diǎn)面對(duì)109個(gè)候選分子,則需完成約1013次蛋白-配體打分,一臺(tái)計(jì)算機(jī)即使日夜不休,也需數(shù)百年才可完成計(jì)算。DrugCLIP將該計(jì)算量縮短為一臺(tái)計(jì)算節(jié)點(diǎn)一天的機(jī)時(shí),首次打通了從蛋白結(jié)構(gòu)預(yù)測(cè)到藥物發(fā)現(xiàn)的關(guān)鍵通道,實(shí)現(xiàn)覆蓋人類(lèi)基因組規(guī)模的虛擬篩選

硬件方面,基于128核中央處理器(CPU)和8張圖形處理器(GPU)的計(jì)算節(jié)點(diǎn),DrugCLIP即可實(shí)現(xiàn)萬(wàn)億級(jí)蛋白口袋小分子對(duì)打分日吞吐能力其核心突破在于將傳統(tǒng)的分子對(duì)接轉(zhuǎn)化為蛋白口袋與小分子在向量空間中的高效語(yǔ)義檢索,較分子對(duì)接等傳統(tǒng)方法的速度提升百萬(wàn)倍。

圖片 

圖2.基于DrugCLIP的超高速全基因組虛擬篩選

在生命學(xué)院閆創(chuàng)業(yè)團(tuán)隊(duì)協(xié)作下,DrugCLIP模型從160萬(wàn)個(gè)候選分子中,為去甲腎上腺素轉(zhuǎn)運(yùn)體(NET)靶點(diǎn)篩選出約100個(gè)高評(píng)分分子。同位素配體轉(zhuǎn)運(yùn)實(shí)驗(yàn)檢測(cè)顯示,其中15%為有效抑制劑,其中12個(gè)分子結(jié)合能力優(yōu)于現(xiàn)有抗抑郁藥物安非他酮。

化學(xué)系劉磊團(tuán)隊(duì)通過(guò)DrugCLIP針對(duì)E3泛素連接酶TRIP12(thyroid hormone receptor interactor 12)進(jìn)行了虛擬篩選與實(shí)驗(yàn)驗(yàn)證。通過(guò)使用TRIP12的AlphaFold結(jié)構(gòu),DrugCLIP模型從160萬(wàn)個(gè)候選分子中高通量篩選出約50個(gè)高評(píng)分分子。實(shí)驗(yàn)證實(shí),其中10個(gè)分子與TRIP12有結(jié)合能力,兩個(gè)親和力較高的分子也對(duì)TRIP12的泛素連接酶活性有一定抑制活性。

依托DrugCLIP,聯(lián)合團(tuán)隊(duì)首次完成了人類(lèi)基因組規(guī)模的虛擬篩選項(xiàng)目,可覆蓋約1萬(wàn)個(gè)蛋白靶點(diǎn)、2萬(wàn)個(gè)蛋白口袋,分析篩選超過(guò)5億個(gè)類(lèi)藥小分子,總共富集出超過(guò)200萬(wàn)個(gè)潛在活性分子,構(gòu)建了目前已知最大規(guī)模的蛋白-配體篩選數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)已免費(fèi)面向全球科研社區(qū)開(kāi)放,為基礎(chǔ)研究與早期藥物發(fā)現(xiàn)提供了強(qiáng)大數(shù)據(jù)支持。

同時(shí),篩選服務(wù)平臺(tái)也已同步上線(xiàn),支持對(duì)用戶(hù)上傳的靶點(diǎn)和蛋白口袋m進(jìn)行定制化篩選。截至論文發(fā)表,半年來(lái)該平臺(tái)已經(jīng)累計(jì)服務(wù)1400余名用戶(hù)完成了1.35萬(wàn)余次篩選。

圖片 

圖3.人類(lèi)基因組規(guī)模篩選項(xiàng)目覆蓋的蛋白數(shù)目與現(xiàn)有數(shù)據(jù)庫(kù)對(duì)比(左:覆蓋的靶蛋白空間,使用ESM1b編碼并進(jìn)行t-SNE降維可視化;右:覆蓋的UniProt ID數(shù)量)

未來(lái),DrugCLIP將與科研與產(chǎn)業(yè)生態(tài)伙伴深度合作,在抗癌、傳染病、罕見(jiàn)病等方向加速新靶點(diǎn)與First-in-class藥物(首創(chuàng)新藥)的發(fā)現(xiàn)。

研究成果以“深度對(duì)比學(xué)習(xí)實(shí)現(xiàn)基因組級(jí)別藥物虛擬篩選”(Deep contrastive learning enables genome-wide virtual screening)為題,于北京時(shí)間1月9日在線(xiàn)發(fā)表于《科學(xué)》(Science)。

清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)博士后賈寅君、計(jì)算機(jī)系2024級(jí)博士生高博文、生命學(xué)院博士后譚佳鑫、化學(xué)系博士后鄭濟(jì)青以及智能產(chǎn)業(yè)研究院(AIR)博士后洪鑫為論文共同第一作者;智能產(chǎn)業(yè)研究院(AIR)教授蘭艷艷,生命學(xué)院副教授張偉、閆創(chuàng)業(yè),化學(xué)系教授劉磊為論文共同通訊作者。

研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金委、新基石研究基金等項(xiàng)目的支持,以及清華大學(xué)無(wú)錫應(yīng)用技術(shù)研究院智能產(chǎn)業(yè)創(chuàng)新中心、北京智源人工智能研究院、清華-IDG/麥戈文腦科學(xué)研究院、膜生物學(xué)全國(guó)重點(diǎn)實(shí)驗(yàn)室和北京結(jié)構(gòu)高精尖中心等機(jī)構(gòu)的支持。

論文鏈接:

https://doi.org/10.1126/science.ads9530

供稿:智能產(chǎn)業(yè)研究院

編輯:李華山

審核:郭玲

2026年01月12日 12:32:28

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.