加快打造原始創(chuàng)新策源地,加快突破關(guān)鍵核心技術(shù),努力搶占科技制高點,為把我國建設(shè)成為世界科技強國作出新的更大的貢獻。

——習近平總書記在致中國科學院建院70周年賀信中作出的“兩加快一努力”重要指示要求

面向世界科技前沿、面向經(jīng)濟主戰(zhàn)場、面向國家重大需求、面向人民生命健康,率先實現(xiàn)科學技術(shù)跨越發(fā)展,率先建成國家創(chuàng)新人才高地,率先建成國家高水平科技智庫,率先建設(shè)國際一流科研機構(gòu)。

——中國科學院辦院方針

首頁 > 科研進展

上海藥物所發(fā)展出基于知識圖譜的計算模型

2024-09-25 上海藥物研究所
【字體:

語音播報

9月19日,中國科學院上海藥物研究所鄭明月課題組在《細胞-基因組學》(Cell Genomics)上,發(fā)表了題為Identifying compound-protein interactions with knowledge graph embedding of perturbation transcriptomics的研究論文。該研究提出了基于知識圖譜的計算模型PertKGE。這一模型以數(shù)據(jù)驅(qū)動的形式在微擾轉(zhuǎn)錄組數(shù)據(jù)中解耦出化合物-蛋白質(zhì)相互作用。

化合物和蛋白質(zhì)是藥物發(fā)現(xiàn)中兩個基本實體,而關(guān)于二者相互作用的建模是藥物發(fā)現(xiàn)的基礎(chǔ)。目前,尚無通用的計算方法來預測和解釋所有的化合物-蛋白質(zhì)相互作用,但科研人員可以利用不同的生物數(shù)據(jù)并從多種研究視角構(gòu)建化合物-蛋白質(zhì)相互作圖譜。

在藥物發(fā)現(xiàn)領(lǐng)域,微擾轉(zhuǎn)錄組學連接了藥物發(fā)現(xiàn)中最重要的實體(化合物)和組學數(shù)據(jù),提供了化合物微擾受試體后產(chǎn)生的直觀微擾結(jié)果,為解耦化合物-蛋白質(zhì)相互作用(CPI)提供了新視角。然而,由于生物數(shù)據(jù)的噪聲、細胞穩(wěn)態(tài)及轉(zhuǎn)錄組表達的動態(tài)變化等原因,CPI通常不會直接反應在差異表達基因上,這為微擾轉(zhuǎn)錄組數(shù)據(jù)的分析帶來了挑戰(zhàn)。

該研究提出了基于知識圖譜的PertKGE模型。PertKGE模型受啟發(fā)于微擾組學分析中的因果推斷模型以及知識圖譜在藥物發(fā)現(xiàn)中的應用,從因果視角來構(gòu)建新型的生物知識圖譜,包含原因部分(化合物與受試體中的特定靶標發(fā)生CPI)、過程部分(生物系統(tǒng)中多層級的調(diào)控事件對CPI信號進行放大)、結(jié)果部分(微擾結(jié)果以差異表達基因的形式被觀測)。在此基礎(chǔ)上,研究結(jié)合知識圖譜嵌入技術(shù)來建模因果鏈接,以達到從差異表達基因中解耦CPI的目的。廣泛的計算實驗表明,PertKGE在化合物冷啟動和靶標冷啟動場景中均取得了優(yōu)異的CPI預測性能,同時,PertKGE通過因果策略引入的多級調(diào)控事件緩解了CPI數(shù)據(jù)集中代表性偏差對模型學習的影響,從而提高了預測的可靠性。

進一步,該研究將PertKGE整合到基于表型和基于靶標的藥物發(fā)現(xiàn)流程,發(fā)現(xiàn)了TNKS抑制劑K-756的新靶標ENPP1,為獨特的抗腫瘤免疫效應提供了分子層面的機制解釋。研究以10.8%的高命中率為治療結(jié)直腸癌和胰腺癌的新型靶標ALDH1B1篩選到5個具有全新骨架的苗頭化合物。

該團隊將CPI預測任務對應到藥物發(fā)現(xiàn)的真實場景中,從計算模擬和實驗驗證兩方面證明了PertKGE在藥物發(fā)現(xiàn)流程中的作用,為CPI圖譜的構(gòu)建和推理提供了全新策略。

研究工作得到國家自然科學基金、國家重點研發(fā)計劃、中國科學院基礎(chǔ)與交叉前沿科研先導專項、中國科學院青年創(chuàng)新促進會會員項目、上海藥物所與上海中醫(yī)藥大學中醫(yī)藥創(chuàng)新團隊聯(lián)合研究項目、中國科協(xié)青年托舉人才工程及上海市科技重大專項的資助,并獲得國家蛋白質(zhì)科學研究(上海)設(shè)施規(guī)模化蛋白質(zhì)制備系統(tǒng)的技術(shù)支持。

論文鏈接

PertKGE工作流

打印 責任編輯:侯茜

掃一掃在手機打開當前頁

© 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002

地址:北京市西城區(qū)三里河路52號 郵編:100864

電話: 86 10 68597114(總機) 86 10 68597289(總值班室)

編輯部郵箱:casweb@cashq.ac.cn

  • © 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864

    電話: 86 10 68597114(總機) 86 10 68597289(總值班室)

    編輯部郵箱:casweb@cashq.ac.cn

  • © 1996 - 中國科學院 版權(quán)所有
    京ICP備05002857號-1
    京公網(wǎng)安備110402500047號
    網(wǎng)站標識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864
    電話:86 10 68597114(總機)
       86 10 68597289(總值班室)
    編輯部郵箱:casweb@cashq.ac.cn