2024-03-20 瀏覽量:1329
按照數(shù)字技術(shù)的發(fā)展技術(shù),未來數(shù)據(jù)中心將具備安全可靠、融合極簡、低碳綠色三大特征,具體到設(shè)備產(chǎn)品、數(shù)據(jù)系統(tǒng)和架構(gòu)方面,也將呈現(xiàn)出不同的技術(shù)演進(jìn)趨勢。
大數(shù)據(jù)顯示,從2019年到2022年,數(shù)據(jù)中心業(yè)務(wù)中斷造成損失超過100萬元的事件比例從約40%上升至70%,且會(huì)隨著算力需求增長比例不斷升高。毫無疑問,安全可靠是數(shù)據(jù)中心的核心訴求,應(yīng)始終作為最高優(yōu)先級(jí)關(guān)注。同時(shí),隨著AI大時(shí)代的來臨,數(shù)據(jù)中心將從云數(shù)據(jù)中心向“云+智算中心”演進(jìn)。未來,數(shù)據(jù)中心將具備安全可靠、融合極簡、低碳綠色三大特征,具體到設(shè)備產(chǎn)品、數(shù)據(jù)系統(tǒng)和架構(gòu)方面,也將呈現(xiàn)出不同的技術(shù)演進(jìn)趨勢。我們預(yù)測,在2024年,數(shù)據(jù)中心的發(fā)展將出現(xiàn)以下新變化。
高可靠產(chǎn)品+專業(yè)化服務(wù)是保障數(shù)據(jù)中心安全可靠運(yùn)行的關(guān)鍵
數(shù)據(jù)中心承載著海量數(shù)據(jù)的存儲(chǔ)、處理和傳輸任務(wù),為各行各業(yè)的各種系統(tǒng)穩(wěn)定運(yùn)行提供保障,但數(shù)據(jù)中心的安全性、可靠性一直是較薄弱的環(huán)節(jié)。為確保數(shù)據(jù)中心能夠安全可靠地運(yùn)行,我們?cè)诋a(chǎn)品設(shè)計(jì)、生產(chǎn)環(huán)節(jié)就要貫穿“全產(chǎn)業(yè)鏈安全”的理念,同時(shí)嚴(yán)控產(chǎn)線質(zhì)量,實(shí)現(xiàn)高度自動(dòng)化,減少人為干預(yù),保障產(chǎn)品自身的高可靠性。此外,我們還要大膽假設(shè),充分思考產(chǎn)品出現(xiàn)問題后應(yīng)采取的應(yīng)對(duì)措施,通過提供專業(yè)化部署和運(yùn)維服務(wù),降低產(chǎn)品失效率,減輕災(zāi)后影響,完善端到端的保障機(jī)制,以保障數(shù)據(jù)中心安全可靠運(yùn)行。
分布式制冷架構(gòu)將是保障溫控安全的優(yōu)選項(xiàng)
傳統(tǒng)大型數(shù)據(jù)中心多采用集中式制冷架構(gòu),如傳統(tǒng)冷凍水系統(tǒng),該系統(tǒng)中的冷凍站包括七大子系統(tǒng)和上百種設(shè)備,各設(shè)備之間不能獨(dú)立運(yùn)行,一旦發(fā)生單點(diǎn)故障,可能會(huì)影響整個(gè)冷凍站的安全運(yùn)行,進(jìn)而導(dǎo)致數(shù)據(jù)中心大規(guī)模宕機(jī)。近年來,業(yè)內(nèi)部分?jǐn)?shù)據(jù)中心發(fā)生的多起安全事故也印證了集中式制冷架構(gòu)存在單點(diǎn)故障的風(fēng)險(xiǎn)。相比之下,分布式制冷架構(gòu)靈活,各子系統(tǒng)相互獨(dú)立,單臺(tái)設(shè)備故障不會(huì)影響其他設(shè)備運(yùn)行,故障率更小,可靠性更高,能直接從架構(gòu)設(shè)計(jì)上避免數(shù)據(jù)中心制冷系統(tǒng)單點(diǎn)運(yùn)行的潛在風(fēng)險(xiǎn),提升數(shù)據(jù)中心的運(yùn)行可靠性。
預(yù)測性維護(hù)模塊將成為數(shù)據(jù)中心基礎(chǔ)設(shè)施的標(biāo)配
數(shù)據(jù)中心的維護(hù)往往屬于事后型維護(hù),發(fā)生事故后才知道問題所在,但隨著智算時(shí)代的到來,數(shù)據(jù)中心的故障響應(yīng)時(shí)間將大幅縮短。未來,在數(shù)據(jù)中心基礎(chǔ)設(shè)施的運(yùn)維方面,預(yù)測性維護(hù)模塊將成為標(biāo)配,維護(hù)從事后型轉(zhuǎn)為事前型。得益于AI技術(shù)的快速發(fā)展,預(yù)測性維護(hù)的范圍將持續(xù)擴(kuò)大,從電容、風(fēng)扇等易損件的使用壽命預(yù)測到設(shè)備的熱失控預(yù)警再到制冷系統(tǒng)的漏液預(yù)警,這些都能實(shí)現(xiàn)前置,從被動(dòng)“救火”走向主動(dòng)“防火”,在運(yùn)維層面大幅提升數(shù)據(jù)中心的可靠性。
全生命周期的網(wǎng)絡(luò)安全防護(hù)體系將成為數(shù)據(jù)中心基礎(chǔ)設(shè)施的保護(hù)盾
隨著數(shù)字化、智能化程度的加深,網(wǎng)絡(luò)安全風(fēng)險(xiǎn)也在升級(jí),網(wǎng)絡(luò)攻擊變得越來越常態(tài)化。UPS電源、空調(diào)設(shè)備等一旦遭遇惡意攻擊,會(huì)直接影響數(shù)據(jù)中心的安全性、可靠性。未來,在數(shù)據(jù)中心基礎(chǔ)設(shè)施層面,“硬件安全+軟件安全”才是全方位的安全策略,尤其是針對(duì)軟件安全,我們需要從供應(yīng)安全、縱深防御、運(yùn)維/運(yùn)營安全三個(gè)維度考慮,構(gòu)筑全生命周期網(wǎng)絡(luò)安全防護(hù)體系,為數(shù)據(jù)中心的安全可靠運(yùn)行保駕護(hù)航。
預(yù)制化、模塊化將成為數(shù)據(jù)中心高質(zhì)量快速交付的優(yōu)選項(xiàng)
互聯(lián)網(wǎng)云廠商的全球業(yè)務(wù)加速發(fā)展,帶動(dòng)了數(shù)據(jù)中心建設(shè)需求顯著增長。但在傳統(tǒng)的建設(shè)模式下,數(shù)據(jù)中心建設(shè)速度慢、工程復(fù)雜,不能很好地滿足用戶快速部署的需求。因此,建設(shè)周期更短、質(zhì)量更高的預(yù)制化、模塊化方案將成為首選。企業(yè)通過“工程產(chǎn)品化”和“產(chǎn)品模塊化”方案,在工廠一體化集成數(shù)據(jù)中心的軟硬件,并完成預(yù)制和預(yù)調(diào)試,保證現(xiàn)場交付的是高質(zhì)量產(chǎn)品,這樣既能有效縮短交付周期,也可以滿足客戶業(yè)務(wù)快速上線的需求。
專業(yè)化管理平臺(tái)讓數(shù)據(jù)中心運(yùn)維更加安全和高效
從千柜級(jí)建筑到萬柜級(jí)園區(qū),數(shù)據(jù)中心越來越呈現(xiàn)出規(guī)模化、集約化的發(fā)展趨勢,相應(yīng)的整體運(yùn)維復(fù)雜度也大幅提升,且數(shù)據(jù)中心設(shè)備多為“聾啞”設(shè)備,若使用傳統(tǒng)巡檢方法,不僅難度大,對(duì)運(yùn)維人員技能的要求也較高,會(huì)導(dǎo)致故障定位時(shí)間長。構(gòu)建專業(yè)化的管理平臺(tái)可以顯著提升數(shù)據(jù)中心運(yùn)維工作的效率和準(zhǔn)確性,幫助客戶構(gòu)建設(shè)備深度管理能力,做到快速判斷問題、及時(shí)排除故障,確保數(shù)據(jù)中心安全穩(wěn)定運(yùn)行。
風(fēng)液融合將成為業(yè)務(wù)需求不確定場景下的優(yōu)選架構(gòu)
當(dāng)前正處于通用算力和智能算力交替的過渡期,同一個(gè)數(shù)據(jù)中心同時(shí)存在通用算力和智能算力應(yīng)用場景。通用服務(wù)器單柜功率密度一般不超過15kW,風(fēng)冷型設(shè)備即可滿足其制冷散熱需求,而智算中心單柜功率密度通常超過30kW,這種場景往往需要液冷設(shè)備來散熱。對(duì)于需求不確定的業(yè)務(wù)場景,風(fēng)液融合將成為適配未來數(shù)據(jù)中心演進(jìn)路徑的優(yōu)選架構(gòu),它能夠發(fā)揮“風(fēng)冷+液冷”組合比例可調(diào)的優(yōu)勢,靈活應(yīng)對(duì)業(yè)務(wù)需求變化。
間接蒸發(fā)冷卻依然是未來的優(yōu)選制冷方案
當(dāng)前,風(fēng)冷方案仍占據(jù)著主流的數(shù)據(jù)中心應(yīng)用場景。在冷源側(cè),相較于冷凍水系統(tǒng),間接蒸發(fā)冷卻方案在架構(gòu)、效率和運(yùn)維方面存在明顯優(yōu)勢,是未來較為經(jīng)濟(jì)適用的制冷方案。間接蒸發(fā)冷卻的分布式制冷架構(gòu)可有效避免單點(diǎn)故障,可靠性更高,并且它能充分利用自然冷源,僅需完成一次熱交換,在寒冷地區(qū)絕大部分時(shí)間無需壓縮機(jī)制冷,達(dá)到了很低的PUE值(數(shù)據(jù)中心能源效率評(píng)價(jià)指標(biāo))。此外,針對(duì)智能算力未來發(fā)展的液冷降溫需求,間接蒸發(fā)冷卻方案也能提供很好的技術(shù)支撐。
能效PUE挖潛要從關(guān)注部件效率調(diào)整轉(zhuǎn)為關(guān)注系統(tǒng)工程優(yōu)化
傳統(tǒng)數(shù)據(jù)中心更關(guān)注提升UPS電源、空調(diào)等部件的效率,但因元器件的物理限制,部件的效率提升已接近瓶頸,微調(diào)改進(jìn)的時(shí)間和成本較高,無法滿足算力爆發(fā)時(shí)代的巨大需求。因此,提升數(shù)據(jù)中心能效需要轉(zhuǎn)換思路,我們要從關(guān)注部件效率調(diào)整轉(zhuǎn)為關(guān)注系統(tǒng)工程優(yōu)化,用系統(tǒng)工程思維綜合審視,在現(xiàn)實(shí)條件限制和部件技術(shù)水平提升間進(jìn)行權(quán)衡,得出最優(yōu)解,如UPS電源雙變換模式轉(zhuǎn)向S-ECO(智能在線模式),可以助力我們進(jìn)行端到端的數(shù)據(jù)中心能效優(yōu)化。
AI調(diào)優(yōu)將成為實(shí)現(xiàn)存量數(shù)據(jù)中心能效智能優(yōu)化的首選項(xiàng)
在數(shù)據(jù)中心節(jié)能方面,除了新建的數(shù)據(jù)中心,仍有大量存量數(shù)據(jù)中心的PUE值遠(yuǎn)高于國家一體化大數(shù)據(jù)中心建設(shè)的要求,迫切需要進(jìn)行節(jié)能改造。傳統(tǒng)的節(jié)能改造需要停線停業(yè)務(wù),存在業(yè)務(wù)中斷的風(fēng)險(xiǎn),而采用人工調(diào)整優(yōu)化的方式難度大、效果差、頻率低。相比之下,AI能效調(diào)優(yōu)解決方案能夠通過預(yù)置AI算法和大數(shù)據(jù)模型,對(duì)存量數(shù)據(jù)中心實(shí)現(xiàn)節(jié)能優(yōu)化,且AI調(diào)優(yōu)不依賴人工經(jīng)驗(yàn),優(yōu)化速度快、效果好,可以很好地實(shí)現(xiàn)從“制冷”到“智冷”的轉(zhuǎn)變。