機房監控措施
為了改變傳統機房環境監控的現狀,需要引入三大新理念加以改善。
對設備內部監控
機房監控的目的在于保護機房內IT系統的正常、有效運行,在事故發生之前偵測出潛在危機,并通過各種方式將警情信息發送給相關人員及時進行處理。因此,機房監控的核心應該是對IT系統運行狀態的監控,而最直接有效的監控應該是直接對IT設備運行狀態進行監控。
IT設備內部的運行環境,例如服務器內風扇轉速與CPU溫度等是最直接、最迅速影響IT設備正常運行的因素。有時候即使機房內空調運轉正常,機房整體環境參數值也在預設范圍內,但某服務器卻因為某種原因出現服務器內風扇的轉速不正常、CPU過熱。如果只監控機房整體環境,此時機房的管理人員是不會得到這種危險信息的,整個系統就會因為該服務器潛在危機沒有得到及時處理而意外癱瘓。
多層次的機房監控
完善的機房監控系統應該是能夠實現對從設備運行情況到機柜微環境再到機房整體環境這樣多層次的監控,并能重點實現對設備內部的監控。
機柜內的微環境是設備正常運行所需要的物理環境。機柜微環境參數最能體現設備所處的實際運行物理環境的情況,所以實現對機柜內微環境的監控也相當重要。機房各個點的環境參數值是不同的,因此機房內整體環境監測的參數不能體現各機柜微環境參數,更不能體現重要設備內部的環境。也就是說,即使機房整體環境參數正常,IT設備所在處的環境也不一定正常。所以說機房的整體環境監控的重要性次于對設備的監控和對機柜內微環境的監控。