伺服器為什麼要做雙機熱備?

摘要:伺服器原理:詳細介紹了伺服器修復故障時需要通過雙機熱備,來避免長時間的服務中斷,保證系統長期、可靠的服務。

伺服器為什麼要做雙機熱備?

雙機熱備針對的是伺服器的故障。 伺服器的故障可能由各種原因引起,如裝置故障、作業系統故障、軟體系統故障等等。一般地講,在技術人員在現場的情況下,恢復伺服器正常可能需要10分鐘、幾小時甚至幾天。從實際經驗上看,除非是簡單地重啟伺服器(可能隱患仍然存在),否則往往需要幾個小時以上。而如果技術人員不在現場,則恢復服務的時間就更長了。

而對於一些重要系統而言,使用者是很難忍受這樣長時間的服務中斷的。因此,就需要通過雙機熱備,來避免長時間的服務中斷,保證系統長期、可靠的服務。

決定是否使用雙機熱備,正確的方法是要分析一下系統的重要性以及對服務中斷的容忍程度,以此決定是否使用雙機熱備。即,你的使用者能容忍多長時間恢復服務,如果服務不能恢復會造成多大的影響。

在考慮雙機熱備時,需要注意,一般意義上的雙機熱備都會有一個切換過程,這個切換過程可能是一分鐘左右。在切換過程中,服務是有可能短時間中斷的。但是,當切換完成後,服務將正常恢復。因此,雙機熱備不是無縫、不中斷的,但它能夠保證在出現系統故障時,能夠很快恢復正常的服務,業務不致受到影響。而如果沒有雙機熱備,則一旦出現伺服器故障,可能會出現幾個小時的服務中斷,對業務的影響就可能會很嚴重。

另有一點需要強調,即伺服器的故障與交換機、儲存裝置的故障不同,其概念要高得多。原因在於伺服器是比交換機、儲存裝置複雜得多的裝置,同時也是既包括硬體、也包括作業系統、應用軟體系統的複雜系統。不僅裝置故障可能引起服務中斷,而且軟體方面的問題也可能導致伺服器不能正常工作。

還應指出的是,一些其他的防護措施如磁碟陣列(RAID)、資料備份雖然是非常重要的,但卻不能代替雙機熱備的作用。可參見相關文章:雙機熱備與資料備份/Raid的關係.

相關問題答案