作者:新天域互聯(lián)
對大家而言,人工智能不再只是一個未來概念,它正迅速、成功地部署在無數(shù)行業(yè)中,以優(yōu)化業(yè)務(wù)的不同方面。而伴隨著AI技術(shù)的不斷普及,越來越多地企業(yè)將他們的網(wǎng)絡(luò)和計算需求轉(zhuǎn)移到云端,以及從智能手機到機器人的聯(lián)網(wǎng)智能設(shè)備激增,整個計算行業(yè)對數(shù)據(jù)中心資源的需求呈指數(shù)級增長,這對于作為存儲人工智能所需數(shù)據(jù)的數(shù)據(jù)中心是個不小的挑戰(zhàn),特別是已經(jīng)在高容量工作的數(shù)據(jù)中心設(shè)備。這迫使數(shù)據(jù)中心不得不添加更多的服務(wù)器和硬件,這些服務(wù)器和硬件的管理變得越來越復(fù)雜,能源消耗成為了數(shù)據(jù)中心最急待解決的問題。
就在前不久,亦莊某地區(qū)數(shù)據(jù)中心的柴油發(fā)電機起火,北京也有幾家數(shù)據(jù)中心因使用柴油發(fā)電機發(fā)電導(dǎo)致起火。其主要原因是數(shù)據(jù)中心忽略了政府“限電令”的頒布,數(shù)據(jù)中心原本以為使用柴油發(fā)電機發(fā)電已經(jīng)足夠給予服務(wù)器的用電,導(dǎo)致起火事故的相繼發(fā)生,數(shù)據(jù)中心無法運營更多的服務(wù)器和硬件,只能用過柴油發(fā)電機發(fā)電,不僅僅增大了能源消耗,還將數(shù)據(jù)中心危險指數(shù)升級。
面對AI技術(shù)的加入對數(shù)據(jù)中心有了更高的設(shè)施要求,許多公司已經(jīng)開始致力于消減數(shù)據(jù)中心的碳足跡的電力解決方案中。前不久,微軟進行了一個大膽而又瘋狂的實驗,利用潛艇技術(shù),并與海洋能開拓者合作,建立了一個水下數(shù)據(jù)中心,目前正在試運行階段。一旦運行成功,就可以輕松實現(xiàn)在很短的距離內(nèi)將數(shù)據(jù)傳輸?shù)窖睾3鞘校屓藗兿硎艿娇焖倭鲿车纳暇W(wǎng)、視頻直播、游戲以及其他基于人工智能技術(shù)的體驗的同時,減少對碳能源的消耗,解決了數(shù)據(jù)中心用電困難局面,并減少了數(shù)據(jù)中心的安全風險指數(shù),可謂是一舉數(shù)得。
人工智能來襲,實現(xiàn)能源實時監(jiān)控
很多數(shù)據(jù)中心嘗試使用人工智能,那么數(shù)據(jù)的獲取就顯得極為重要,但這個獲得數(shù)據(jù)的過程卻并不簡單。在過去的十多年時間里,數(shù)據(jù)中心IT專業(yè)人員習慣于設(shè)備監(jiān)控和實時警報,但由于數(shù)據(jù)中心連接著用于供電和散熱的不同設(shè)備,數(shù)據(jù)的計量的標準化變得讓人難以捉摸。
機器學習計算的基準要求是來自數(shù)據(jù)中心主要組件的實時數(shù)據(jù),其中包括了冷水機組,冷卻塔,空氣處理機,風機等,也包括了服務(wù)器利用率,溫度和功耗等指標。機器學習對這些設(shè)備及其環(huán)境數(shù)據(jù)產(chǎn)生的數(shù)據(jù)進行實時分析,詳細了解其性能和容量,并確定適當?shù)捻憫?yīng)。隨著數(shù)據(jù)中心條件的不斷變化,機器學習系統(tǒng)開始從變化中分析,不依靠特定的編程指令來執(zhí)行其任務(wù),具有極強的靈活性。
目前,數(shù)據(jù)中心設(shè)施內(nèi)部越來越多的傳感器正在從設(shè)備收集數(shù)據(jù),其中包括備用電源(UPS),配電設(shè)備,開關(guān)設(shè)備和冷卻器等。與此同時,越來越多的企業(yè)也開始采用高級分析和機器學習來深度監(jiān)控數(shù)據(jù)中心能源使用情況。
自動化避免故障發(fā)生
機器學習對于數(shù)據(jù)中心而言并不陌生,很長一段時間,當我們還在試圖根據(jù)容量和需求改善機器正確尺寸的散熱時,機器學習就能夠快速幫我們做到這一點,它能夠通過使用現(xiàn)有數(shù)據(jù)和實時監(jiān)控為數(shù)據(jù)中心避免事故的發(fā)生,減少不必要的損失,最大限度地提高生產(chǎn)力,讓數(shù)據(jù)中心時刻保持冷靜。
機器學習的自動化能有效避免因系統(tǒng)故障而導(dǎo)致的事故的發(fā)生,這主要基于數(shù)據(jù)中心計量技術(shù)的進步以及云中數(shù)據(jù)池的出現(xiàn),智能系統(tǒng)在提高效率的同時,還能發(fā)現(xiàn)手動流程無法發(fā)現(xiàn)的數(shù)據(jù)中心運行中的漏洞。例如2016年,達美航空數(shù)據(jù)中心因電力系統(tǒng)故障停運三天時間事件,約2000次航班,造成航空公司損失1.5億美元。
而在大型數(shù)據(jù)中心運營商和主機托管提供商中,動態(tài)散熱優(yōu)化是數(shù)據(jù)中心機器學習最常見的,通過動態(tài)冷卻優(yōu)化,數(shù)據(jù)中心管理人員可以根據(jù)環(huán)境條件監(jiān)控和控制設(shè)施的冷卻基礎(chǔ)設(shè)施。當設(shè)備移動或計算流量激增時,建筑物內(nèi)的熱負荷也會發(fā)生變化。動態(tài)調(diào)整冷卻輸出以轉(zhuǎn)移熱負荷可幫助消除不必要的制冷量并降低運營成本。目前,數(shù)據(jù)中心運營商正在努力將動態(tài)制冷優(yōu)化的成功擴展到其他領(lǐng)域。
人工智能時代,數(shù)據(jù)中心開始尋找發(fā)展新方向
目前,數(shù)據(jù)中心的AI技術(shù)主要圍繞著機器學習監(jiān)控和自動化設(shè)施組件的管理來展開的,如電力和配電元件,冷卻基礎(chǔ)設(shè)施,機架系統(tǒng)和物理安全。企業(yè)發(fā)現(xiàn)傳統(tǒng)的數(shù)據(jù)中心管理方法并不是最優(yōu)的,通過使用人工智能,通過機器學習,可以有效簡化復(fù)雜計算設(shè)施的管理。
隨著互聯(lián)網(wǎng)的不斷發(fā)展,人工智能技術(shù)的不斷革新,企業(yè)開始采用機器學習技術(shù),人工智能將在數(shù)據(jù)中心運營中扮演更重要的角色。一方面AI需求是未來數(shù)據(jù)中心需求增長的主要驅(qū)動力,另一方面AI技術(shù)將幫助數(shù)據(jù)中心提升運營效率。
人工智能時代,數(shù)據(jù)中心運營效率大幅提升
將機器學習用于數(shù)據(jù)中心,為大量新型數(shù)據(jù)相關(guān)決策創(chuàng)造了機會,能夠大大提高預(yù)測能力。數(shù)據(jù)中心現(xiàn)有的監(jiān)控工具是基礎(chǔ)設(shè)施管理(DCIM)軟件,可以提供對數(shù)據(jù)中心資產(chǎn),相互依賴性,性能和容量的可視性。而當我們將外部大量匯總數(shù)據(jù)添加到數(shù)據(jù)中心DCIM軟件中,機器學習便會發(fā)揮關(guān)鍵作用。機器學習對大規(guī)模數(shù)據(jù)進行進行實時數(shù)據(jù)分析,使企業(yè)能夠?qū)⒆约旱臄?shù)據(jù)中心性能與全球基準進行比較,使數(shù)據(jù)中心能更得到更深層次的預(yù)測性和預(yù)防性維護。
未來,機器學習在數(shù)據(jù)中心的廣泛應(yīng)用將為企業(yè)在決定運行某些工作負載的位置時提供更多建樹性意見,這對數(shù)據(jù)中心而言無疑是非常有價值的,特別是如果企業(yè)正在圍繞最佳執(zhí)行場所做決定。而AI技術(shù)的加入,智能系統(tǒng)可承擔更復(fù)雜的任務(wù),使數(shù)據(jù)中心能夠根據(jù)運行效率最高或最可靠的位置動態(tài)調(diào)整工作負載。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...