數(shù)據(jù)中心如今伴著云計算、大數(shù)據(jù)和5G的興起迅速站穩(wěn)C位,大伙兒眾說紛紜,展望得心潮澎湃。但這些展望靠不靠譜?又如何落地?好的數(shù)據(jù)中心到底長啥樣?怎么建設(shè),又該如何管理?
不能懵,華為現(xiàn)在帶你一起,十問數(shù)據(jù)中心!
人人聊,家家說,AI在數(shù)據(jù)中心真的落地了嗎?
自從AlphaGo戰(zhàn)勝了柯潔和李世石,如果一個科技圈或創(chuàng)業(yè)圈的精英不會聊兩句AI,出門兒都不好意思跟人打招呼。無比敬崗愛崗的數(shù)據(jù)中心從業(yè)者們當(dāng)然也不能放著這么好的技術(shù)不琢磨,不過關(guān)于AI與數(shù)據(jù)中心,說了不少,也聽了很多。但新技術(shù)只有應(yīng)用,創(chuàng)造出價值,才有繼續(xù)優(yōu)化和演進的可能。
問:所以現(xiàn)在AI在數(shù)據(jù)中心真的落地了嗎,應(yīng)用了有什么好處?
答:落地了,實踐證明,AI是數(shù)據(jù)中心難得的行業(yè)轉(zhuǎn)折機遇,AI將使能數(shù)據(jù)基礎(chǔ)設(shè)施價值最大化。
問:那怎么用AI實現(xiàn)價值最大化呢?
答:以下有幾個經(jīng)過驗證的標準答案,要不借你“Ctrl C”一下。
安全運行對數(shù)據(jù)中心的重要性不言而喻,業(yè)界在提升數(shù)據(jù)中心可靠性和可用性方面已有實踐,例如收集供配電系統(tǒng)設(shè)備信息,對即將發(fā)生故障的設(shè)備和部件提前發(fā)出預(yù)警,為運維人員的運維活動提供決策支撐,但是如何利用機器的自我學(xué)習(xí)能力,做到供配電系統(tǒng)整體運行的安全可靠,是需要思考的重點問題。要實現(xiàn)更高程度的智能化及主動避錯,這對AI技術(shù)應(yīng)用是個很好的契機。
華為融入AI性能的iPower技術(shù)可提升數(shù)據(jù)中心可用性,借助智能化硬件,實現(xiàn)智能故障定位與預(yù)警管理,引入大數(shù)據(jù)技術(shù),智能分析每日海量的運維數(shù)據(jù),識別機房潛在隱患,保障數(shù)據(jù)中心的可靠運行。
iPower智能供配電技術(shù)以模塊化UPS為核心,主要通過供電全鏈路監(jiān)測、預(yù)警和故障自動隔離等手段,提高數(shù)據(jù)中心能源基礎(chǔ)設(shè)施可用性,繼而通過AI技術(shù)的應(yīng)用,最終實現(xiàn)預(yù)測性維護。
iPower通過供電全鏈路監(jiān)測,可實現(xiàn)毫秒級的故障檢測,毫秒級的故障隔離,分鐘級的故障恢復(fù),可消除火災(zāi)隱患,大大提高數(shù)據(jù)中心能源基礎(chǔ)設(shè)施可靠性和可用性;
以電池管理為例,在預(yù)防電池失效方面,iPower通過AI技術(shù),可以精確預(yù)測電池的壽命和健康度,為用戶提前提供維護決策依據(jù),及時排除有失效隱患的電池組,變事后補救為事前預(yù)防,變被動響應(yīng)為主動維護,大大提高數(shù)據(jù)中心供配電安全等級。華為的模塊化UPS結(jié)合iPower技術(shù),可以在電池出現(xiàn)溫度快速升高等極端情況下,自動切斷該組電池,從而避免出現(xiàn)起火等惡性事件。
數(shù)據(jù)中心傳統(tǒng)的維護方法是靠人,失誤率大、漏錯率高、失效排查時間長,傳統(tǒng)運維方式無法解決人為誤操作帶來的業(yè)務(wù)中斷問題。
融入AI性能的 iManager,可看作是數(shù)據(jù)中心的大腦,借助智能化硬件和傳感器,實現(xiàn)精準感知。通過自動化手段,逐步減少人工巡檢等例行重復(fù)性工作,池化專家資源和能力,并固化于運維流程中。
加上全流程的電子運維,包括巡檢、維保、應(yīng)急演練,把所有的流程以及操作指導(dǎo)全部做到線上,實現(xiàn)了運維質(zhì)量從原來靠人的責(zé)任心到現(xiàn)在靠流程管理的轉(zhuǎn)變。通過全流程電子化的運維跟蹤,量化原來無法量化的信息,比如通過電子運維提升巡檢的執(zhí)行力和運維活動的質(zhì)量、實現(xiàn)故障的預(yù)測等,大幅提高人均運維效率和運維水平,提升數(shù)據(jù)中心的可靠性。
此外,市場上出現(xiàn)了越來越多由邊緣計算產(chǎn)生的邊緣數(shù)據(jù)中心機房,就近提供服務(wù)和處理計算。邊緣數(shù)據(jù)中心數(shù)量日益增長,分行、支行、網(wǎng)點等數(shù)據(jù)中心無法統(tǒng)一集中管理,數(shù)據(jù)中心故障響應(yīng)速度慢,運維效率低。
華為iManager全網(wǎng)管理功能,實現(xiàn)對多網(wǎng)點數(shù)據(jù)中心基礎(chǔ)設(shè)施進行集中監(jiān)控,統(tǒng)一管理,實現(xiàn)預(yù)防性維護,通過GIS定位技術(shù)提高故障定位響應(yīng)速度,提升數(shù)據(jù)中心運維效率;移動APP監(jiān)控,從內(nèi)到外簡化管理,輕松知曉海量網(wǎng)點數(shù)據(jù)中心運行情況,擺脫傳統(tǒng)人工的運維檢修方式,降低維護下站次數(shù)和節(jié)省開支,讓數(shù)據(jù)中心管理變得更加簡單、高效。
華為iManager還能對資產(chǎn)進行盤查,保證設(shè)備的完整性,保護重要數(shù)據(jù)。另外,還可以對資產(chǎn)匹配最適宜的供電、制冷、空間、帶寬等資源,實現(xiàn)資源的最佳利用,利用AI技術(shù),可協(xié)助對資產(chǎn)上下架和運營進行智能化的管理,提升運營效率和效益。
能耗問題一直是數(shù)據(jù)中心關(guān)注的焦點,傳統(tǒng)數(shù)據(jù)中心年平均PUE高于1.8,隨著越來越多AI應(yīng)用的落地,業(yè)界對高速計算的需求日漸增多,GPU計算服務(wù)器的規(guī)模和需求將持續(xù)增長,加速計算服務(wù)器產(chǎn)生的熱能是傳統(tǒng)CPU的數(shù)倍,如何解決服務(wù)器的散熱問題將是未來的重要考量。目前已有的智能DC節(jié)能技術(shù)可以通過傳感器獲取關(guān)鍵節(jié)點數(shù)據(jù),進而優(yōu)化所有系統(tǒng)和設(shè)備的整體能耗,降低PUE。
而AI能否深入數(shù)據(jù)中心內(nèi)核,帶來更低PUE?華為作為ICT行業(yè)的領(lǐng)導(dǎo)者,在數(shù)據(jù)中心熱管理技術(shù)方面走在行業(yè)前端,致力于帶給客戶更低的PUE。
華為將基于AI的iCooling智能熱管理解決方案融入數(shù)據(jù)中心基礎(chǔ)設(shè)施,針對數(shù)據(jù)中心制冷效率提升瓶頸,通過深度學(xué)習(xí),打通精密空調(diào)末端、冷水機組、冷卻塔、水泵等制冷系統(tǒng)以及IT負載、環(huán)境變量等大數(shù)據(jù)之間的聯(lián)動,對大量的歷史數(shù)據(jù)進行分析,探索影響能耗的關(guān)鍵因素,獲取PUE的預(yù)測模型。利用尋優(yōu)算法,獲取調(diào)優(yōu)參數(shù)組,下發(fā)到控制系統(tǒng),實現(xiàn)制冷系統(tǒng)的最優(yōu)控制。最終通過規(guī)范化的實踐引導(dǎo)和目標導(dǎo)向評測,不斷調(diào)整優(yōu)化,獲取最佳PUE。
iCooling@AI解決方案目前已在華為云廊坊數(shù)據(jù)中心成功部署,全年P(guān)UE可降低超過0.1,年平均值達到1.3以下,年節(jié)約電費數(shù)百萬元。
地址:陜西省西安經(jīng)濟技術(shù)開發(fā)區(qū)鳳城九路海博廣場B座27層
電話:029-88446935 傳真:029-88446935 E-mail:diantuo@xadiantuo.com
版權(quán)所有:西安點拓電子科技有限公司 陜ICP備11005095號-2 營業(yè)執(zhí)照
技術(shù)支持:兄弟建站
營業(yè)執(zhí)照