亦莊數據中心起火,服務提供商亟需惡補哪些常識?
//www.gynok.icu 物聯中國
日期:2018-06-28 11:44:04來源:中國IDC圈 點擊:1120
核心提示:2018年的高溫天氣來得比往年更早一些。驕陽似火的6月,北京亦莊某數據中心機房柴油機發生一起起火事故,所幸并未出現去年多家金融機構設備大規模宕機。本次起火事件,緣起亦莊地區發布的30天限電令,當地不少數據中心開始使用柴油發電機進行帶載。多家金融機構和73家村鎮銀行的所有設備宕機,服務全部中斷長達7小時以上——...

2018年的高溫天氣來得比往年更早一些。驕陽似火的6月,北京亦莊某數據中心機房柴油機發生一起起火事故,所幸并未出現去年多家金融機構設備大規模宕機。本次起火事件,緣起亦莊地區發布的30天限電令,當地不少數據中心開始使用柴油發電機進行帶載。

多家金融機構和73家村鎮銀行的所有設備宕機,服務全部中斷長達7小時以上——去年亦莊某數據中心的斷電事故,仍令人心有余悸。調查發現,當時兩臺老舊的UPS負載過高,切到旁路,很快三臺柴油發電機接連出現“失磁”報警,停止運行,導致機房全部設備斷電,系統宕機……

實際上,諸如此類的數據中心突發事故時有發生,供電故障是國內數據中心比較常見的災難產生原因。2016年因電力系統故障導致的達美航空數據中心停運事件造成了2000余架次航班停飛,帶來1.5億美元的經濟損失……這樣的報道屢見不鮮,如何能夠避免此類事故的重演?

選址的門道很深

眾所周知,數據中心最大特點正是高耗能,整個數據中心投資最大的部分也正是供電系統。供電系統是整個通信系統的動力來源,它相當于一個人的心臟和血管,負責把能量輸送到系統的每一臺設備,是其他所有系統能夠正常工作的前提和基礎,因此,穩定的供電系統成為了數據中心運營商的重要考量因素。

據悉,北京市發改委于2014年出臺了產業禁止目錄,其中將PUE大于1.5的數據中心列為禁止項目,2015年8月又進一步限制在城六區新建數據中心。由此可見,數據中心是的建設選址不僅要保證建筑物的質量,還要保證配套設施的完備性和長期運轉的高可靠性,并要考慮到在用電高峰季節臨時性限電政策對數據中心帶來的影響。

以Facebook公司為例,該公司計劃在美國亨茨維爾北部建造一座全新的數據中心,看中的正是當地可提供可靠的可再生能源、強大的本地基礎設施。在國內,中國電信開普勒(佛山)數據中心則直接將園區選在佛山福能大數據產業園之中,依托的是其股東佛山電建集團安全可靠的電力資源,不僅可享受優惠政策,還可享受低廉電價。據悉,開普勒數據中心實現了真正的雙路供電,電力來自三個不同變電站,分別引入四路電纜,實現了高壓有聯絡,同時配有柴油發電機與UPS系統,供電保障率99.9999%。未來福能發電廠為開普勒高壓室提供10KV的電力的備用通道。

冷卻系統上大做文章

據悉,電力成本占數據中心整個支出成本的50%-70%,其中一半是機器設備散熱需要的空調費。行業數據顯示,數據中心設備運行時的最佳溫度為22℃,上下浮動不能超過2℃。在基準溫度情況下,溫度每升高10℃計算機的可靠性就下降25%。

然而,大多數的數據中心冷卻和電源的容量如今都已過度配置,通常所部署冷卻容量比必要的冷卻容量要高出三倍。根據調研機構Gartner公司的調查,數據中心40%的冷卻成本被浪費。如何更科學合理地節能降耗,成為擺在數據中心運營商面前的難題。國內外不乏一些獨辟蹊徑的路數,諸如微軟將數據中心沉入海底,騰訊將數據中心建在山洞……

難道只有這些非常規手段嗎?實則不然,有一些切實可行的節能降耗方案也取得了顯著的收效,諸如機房采用封閉冷通道以及精確下送風方式,地板結構下沉,機柜熱通道背靠背,優化氣流組織,避免冷熱氣流混合,提高制冷效率;采用雙環路管道,提高空調系統安全和可靠性;利用天然發電機余熱加熱水,給溴化鋰制冷機提供熱源,回收利用了余熱,達到了節能減排目的——這些常規卻有所突破創新的舉措正是開普勒數據中心進行的積極探索,并借力??榛可杓頻紉幌盜惺侄?,實現PUE值可達1.31.4的指標。

運維管理能夠防微杜漸

工欲善其事必先利其器——可靠的電力保障與高效節能的冷卻系統正是數據中心提供穩定服務的基礎,然而光有硬件和技術支撐還遠遠不夠。對于數據中心發生的故障,行業專家認為故障多發的原因還是在運維管理上,正所謂“三分技術,七分管理”,數據中心的故障大多源自于人禍。

運維工作對數據中心來說至關重要,關乎整個數據中心業務的正常運行。一旦突發故障,具備一定的專業技能和應急能力的運維團隊可及時對故障原因作出準確判斷并迅速找出解決方法,避免宕機風險,從而達到防微杜漸的效果。

在實踐中,運營商需要對數據中心里面的溫濕度、電能、水流及風量等進行全面實時的監控,以期發現潛在問題,通過預警機制及相應的流程做到防患于未然,并為應急措施及節能措施提供可靠的指導依據。數據中心的日常業務運維主要包括日常檢查、應用變更、軟硬件升級以及應對突發故障四大方面內容。其中,日常檢查作為業務運維的基礎性工作,其意義非同小可。

如今,不少數據中心運營商都采用了全自動化二維碼巡檢系統,可自定義巡檢路線,自動生成巡檢任務,手機APP自動接收巡檢任務,并一鍵生成巡檢報告,自動評估巡檢健康度,為客戶提供高效的智能化運維服務——據悉,這種系統是由開普勒數據中心首創,并得到了業界的普遍認可。

除了日常運維,數據中心的應急預案也很重要,建設災備系統正是其重要的環節。其實,我國早在2007年時就頒布了首個關于災備的國家標準《信息系統災難恢復規范》。現在的數據中心承載的業務越來越重要,引入有效的災備技術,在性能惡化時提出預警,使企業能提前感知并采取相應的修補動作,避免宕機事件的發生,能減少數據中心發生故障時帶來的損失。

然而,不要以為有了災備系統,就可以高枕無憂了,如果后期不對其進行管理,從不更新災備預案,這樣的災備系統在面臨突發狀況時也只能是形同虛設了。

競爭壓力激增,轉型機遇來襲

實際上,除了供電系統與運維管理系統之外,影響數據中心正常運維的因素還有許多,諸如充足穩定的網絡資源、安全的消防保障等。然而,不少數據中心服務提供商忙于能夠迅速帶來經濟效益的一線業務投入,卻忽略了包括應用在內的軟件的運維問題。

伴隨著以互聯網應用服務為載體的數據中心建設需求日益激增,包括運營商、互聯網巨頭在內的眾多企業紛紛加入到投建數據中心的熱潮之中,由于投建數據中心的技術門檻并不高,一時間泥沙俱下。因此,選擇靠譜的數據中心服務供應商也不是件易事。

如今,數據中心各服務商已在技術、服務、價格、宣傳等領域全面展開競爭,最終比拼的還是其技術實力。憑借佛山“互聯網+”創新創業產業園的基因,借力佛山市福能發電廠,融合直連中國華南地區國際出口電信骨干網資源優勢,背靠珠三角經濟帶,總投資80億元、規劃建設2萬個機架的中國電信開普勒(佛山)大數據中心將于今年6月底投入正式運營。

面臨數據中心業務模式日益趨于定制化、高端化的局面,開普勒數據中心的業務種類由當初的網站和服務器托管、應用托管等基礎業務,進行了更大范圍的延伸拓展,其增值服務覆蓋了網絡/服務器實時監控及告警、現場軟/硬件支持、入侵檢測、流量清洗、鏈路測試、網絡故障排除、巡檢監控等多項內容,可以滿足客戶多樣化及垂直專業化服務的需求。屆時,該數據中心可輻射至廣東、廣西、福建等華南地區,滿足行業用戶異地備份的需求,并可滿足華南地區大中企業客戶超萬家中小小型企業的發展需求。

未來,智能化運維管理將在數據中心行業得到越來越多的重視,將科學、系統的理念以及專業的管理和服務貫徹數據中心整個生命周期,將會為客戶創造最大化的價值,也將為整個數據中心產業帶來新氣象。


出處:中國IDC圈
鄭重聲明:本文僅代表作者個人觀點,與物聯中國(蓝球麒麟四幻图 www.gynok.icu)無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
分享到:
  • 資訊
  • 產業
  • 服務
  • 應用