語音播報
記者4月23日從中科曙光獲悉,在經(jīng)歷了6個月的試運營之后,中科曙光針對高性能計算機群推出的SaaS級專業(yè)化在線平臺EasyOP正式上線。
今年3月,谷歌Alpha Go在與李世石九段的人機大戰(zhàn)中以4:1的成績勝出后名聲大噪。事實上,Alpha Go獲勝原因之一就是擁有穩(wěn)定運行的強大超級計算系統(tǒng)。
然而,目前基于高性能計算機群(HPC)的IT中心建設,能夠提供服務的公司往往難以做到全生命周期的運維服務。第三方HPC服務商并不研發(fā)和生產(chǎn),解決問題的效率也不盡如人意。
“EasyOP是曙光結合‘互聯(lián)網(wǎng)+’和HPC的產(chǎn)物,不僅幫助用戶維護HPC系統(tǒng),還有望利用用戶的系統(tǒng)為其創(chuàng)造更多的價值?!敝锌剖锕飧笨偛蒙吵罕硎?,“通過提供運維、調(diào)優(yōu)等服務,將各行各業(yè)的專家從HPC的運維和管理中解放出來。
沙超群介紹,該平臺具有五大關鍵技術:監(jiān)控數(shù)據(jù)實時遠程采集、海量數(shù)據(jù)存儲與展示、故障的分析與定位技術、大量數(shù)據(jù)統(tǒng)計與分析、移動終端的集成與推送。
來自中科院物理所的徐力方研究員對記者表示:“HPC集群的運維此前一直是我們的艱巨任務,非常辛苦。接入EasyOP后,我們的運維壓力大大降低了,運維成本和人力投入也都減少了,而且HPC集群的安全性和使用效率也得以提升。”
2015年11月,EasyOP在全國高性能計算學術年會上亮相并宣布試運營。記者獲悉,從試運營的數(shù)據(jù)反饋信息來看,其表現(xiàn)稱得上專業(yè)、全面。在此期間,累計接入來自20組HPC集群的超過7800個節(jié)點,應用涵蓋CAE、氣象、海洋、物理、生物、材料及互聯(lián)網(wǎng)6大領域,對所有接入集群資產(chǎn)全面監(jiān)控的指標超過180項。
專家分析稱,在監(jiān)控的7800多個節(jié)點中,CPU的最高和平均利用率為83%和70.1%,內(nèi)存的最高和平均利用率為40%和25.5%,存儲的最高和平均利用率為23%和20.3%。在EasyOP接入的資源作業(yè)中,中短時長作業(yè)占近70%,作業(yè)排隊率約為1/5。這種多線程任務下適于對HPC系統(tǒng)各子功能的全方位監(jiān)控。
據(jù)統(tǒng)計,試運營半年期間,全部集群共自動觸發(fā)近2900條通知信息,其中2281條是因計算節(jié)點主要部件溫度升高觸發(fā)的輕微類通知。嚴重類通知僅有3條,從側面反映了曙光集群系統(tǒng)的高可靠性。
“曙光推出EasyOP在線運維平臺,引領了我國HPC行業(yè)向互聯(lián)網(wǎng)+轉(zhuǎn)型的方向,將促進行業(yè)整體服務水平的提升。”中國軟件行業(yè)協(xié)會數(shù)學軟件分會常務副秘書長姚繼鋒表示,“EasyOP可實現(xiàn)曙光與HPC用戶的互聯(lián),對于打造‘HPC生態(tài)圈’具有重要意義”。
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn