語音播報
近日,由中國科學院北京基因組研究所國家基因組科學數(shù)據(jù)中心開發(fā)的人類表觀組關(guān)聯(lián)分析數(shù)據(jù)庫EWAS Data Hub正式上線。該項研究成果以EWAS Data Hub: a resource of DNA methylation array data and metadata 為題在國際學術(shù)期刊《核酸研究》(Nucleic Acids Research)在線發(fā)表。
近年來,表觀組關(guān)聯(lián)分析(Epigenome-wide Association Study,EWAS)已成為探索復雜性狀表觀遺傳基礎的有效策略。隨著大量EWAS科研成果的發(fā)表,現(xiàn)已積累了海量表觀遺傳數(shù)據(jù),尤其是DNA甲基化芯片數(shù)據(jù),其海量數(shù)據(jù)的整合分析對系統(tǒng)研究不同實驗條件下的DNA甲基化狀態(tài)以及探索與各種性狀相關(guān)的表觀遺傳機制具有重要意義。目前,國際上存在一些數(shù)據(jù)庫來存儲DNA甲基化芯片數(shù)據(jù),但這些數(shù)據(jù)庫缺乏有效和統(tǒng)一的歸一化方法來消除不同數(shù)據(jù)集之間的批次效應,可能對下游分析產(chǎn)生負面影響,元數(shù)據(jù)標準不統(tǒng)一,并且都不提供跨不同組織、性別、種族和疾病的標準化的DNA甲基化圖譜。為了解決這些問題,國家基因組科學數(shù)據(jù)中心開發(fā)了EWAS Data Hub數(shù)據(jù)庫。
目前,EWAS Data Hub整合了來自GEO、TCGA、ArrayExpress和ENCODE數(shù)據(jù)庫的共計75344個樣本的DNA甲基化芯片數(shù)據(jù)和對應的元數(shù)據(jù),并采用了有效的歸一化方法來消除不同數(shù)據(jù)集的批次效應。EWAS Data Hub利用海量高質(zhì)量DNA甲基化數(shù)據(jù)和標準化元數(shù)據(jù)的優(yōu)勢,為485512個探針和36397個基因提供了一系列重要的評估值(包括組織特異性、年齡相關(guān)性、性別差異和種族特異性)和不同背景下的參考DNA甲基化圖譜,涉及81種組織/細胞類型(包含25個腦部和25種血細胞類型),67種疾?。ò?/span>39種癌癥),不同年齡、性別、種族和BMI。同時,EWAS Data Hub 還提供了高效的查詢方式。
該研究得到國家重點研發(fā)計劃、中科院戰(zhàn)略先導專項、中科院國際大科學計劃和中科院十三五信息化專項等的資助。
© 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:[email protected]
© 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:[email protected]
© 1996 - 中國科學院 版權(quán)所有
京ICP備05002857號-1京公網(wǎng)安備110402500047號
網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)
編輯部郵箱:[email protected]