——習(xí)近平總書記在致中國科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國科學(xué)院辦院方針
語音播報
蛋白激酶(protein kinases)是細(xì)胞功能的關(guān)鍵調(diào)節(jié)分子,是生物體內(nèi)最大且功能最多樣的基因家族之一。因此,激酶是開發(fā)治療癌癥、炎癥、糖尿病、心血管疾病和阿爾茲海默癥等相關(guān)疾病藥物的重要靶標(biāo)。然而,由于激酶家族蛋白質(zhì)(特別是催化域)結(jié)構(gòu)的高度保守性,給高效選擇性激酶抑制劑的開發(fā)帶來了巨大挑戰(zhàn)。
二十一世紀(jì)以來,隨著計算機(jī)計算能力的迅猛提升和大數(shù)據(jù)的涌現(xiàn),深度學(xué)習(xí)在機(jī)器學(xué)習(xí)算法的基礎(chǔ)上快速崛起,并在藥物研發(fā)領(lǐng)域得到廣泛應(yīng)用。然而,對許多尚未經(jīng)過充分深入研究的激酶靶標(biāo),目前已有的數(shù)據(jù)還遠(yuǎn)遠(yuǎn)達(dá)不到訓(xùn)練中等規(guī)模神經(jīng)網(wǎng)絡(luò)所需的量級。因此,傳統(tǒng)的單任務(wù)神經(jīng)網(wǎng)絡(luò)模型通常難以取得較好的泛化性能。
為了解決這一問題,中國科學(xué)院上海藥物研究所蔣華良、鄭明月團(tuán)隊采用了多任務(wù)深度神經(jīng)網(wǎng)絡(luò)(multitask deep neural network)建立分類模型解決化合物的激酶譜預(yù)測問題。多任務(wù)深度神經(jīng)網(wǎng)絡(luò)通過任務(wù)間的遷移學(xué)習(xí),可以高效解決具有相關(guān)性的多類別分類問題,對于眾多激酶靶標(biāo),共享的保守催化域使得多重活性預(yù)測任務(wù)緊密相關(guān)。因此,利用多任務(wù)深度神經(jīng)網(wǎng)絡(luò)可以有效減少特定激酶數(shù)據(jù)不足對模型泛化性能的限制。此外,多任務(wù)神經(jīng)網(wǎng)絡(luò)只需建立一個模型即可對整體激酶譜進(jìn)行預(yù)測,無需多次建模,并且通過使用共享表示減少了模型參數(shù)的規(guī)模,可以使模型的訓(xùn)練學(xué)習(xí)過程更加高效。
上述研究結(jié)果近期在線發(fā)表于Journal of Medicinal Chemistry,題為Deep Learning Enhancing Kinome-Wide Polypharmacology Profiling: Model Construction and Experiment Validation,并被選為封面論文。上海藥物所藥物設(shè)計與發(fā)現(xiàn)中心(DDDC)鄭明月為論文通訊作者,第一作者是藥物發(fā)現(xiàn)與設(shè)計中心博士研究生李敘潼。
基于多任務(wù)神經(jīng)網(wǎng)絡(luò)的藥物激酶譜預(yù)測流程
多任務(wù)神經(jīng)網(wǎng)絡(luò)與隨機(jī)森林預(yù)測表現(xiàn)對比
(左)對五個化合物預(yù)測與實驗得到的激酶圖譜,標(biāo)記為紅色的激酶表示預(yù)測或?qū)嶒灉y定為活性。(右)預(yù)測與實驗得到的激酶家族選擇性,當(dāng)一個家族的odds ratio顯著大于1(紅色),認(rèn)為化合物對該激酶家族具有選擇性。
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn