MS?

【資料恢復故障描述】

  新疆某政府機構,MS SQL SERVER伺服器,硬體環境為:IBM X225,由4塊73G SCSI硬碟組成RAID5,RAID中只劃分了一個邏輯卷。作業系統為WINDOWS 2003。

  A、之前未發現故障,直至伺服器癱瘓,再查伺服器時,發現有3塊硬碟離線。

  B、隨便強制上線2塊硬碟後,無法啟動作業系統。

  C、使用WINPE光碟啟動作業系統後,可以看到資料,將備份好的ZIP資料庫檔案拷貝到行動硬碟上。

  D、ZIP檔案在另外的機器上測試,無法正確解壓。

  E、請對應維保公司幫助恢復。

  F、其維保公司更換了一塊新的RAID卡,直接重建成了一組RAID5。

  G、客戶認為ZIP檔案大小、名稱都正確,應該可以修好,所以直接先在RAID上重灌了系統並正常工作,同時試圖修復ZIP檔案,嘗試了1天后,沒有結果。這時,向資料恢復公司尋求幫助。

工具/原料

MS SQL SERVER伺服器

硬碟

方法/步驟

【資料恢復介紹】

  

  故障描述A中,在使用RAID5做儲存時,一定要及時維護RAID的正常狀態,當RAID5一塊硬碟掉線後,要及時備份資料到另外的儲存體上,再及時REBUILD故障RAID。 

故障描述B中,RAID5存在2塊以上硬碟離線時,一定要可以隨意選擇硬碟上線,如果選擇錯了,有些情況下,一啟動系統,整個RAID的狀態就會改變,有可能會破壞重要資料。參考《RAID損壞後,我們該如何緊急應對?》

故障描述C中,用PE可以看到目錄是因為目錄區正常或部分正常,並不見得資料區正常,其實系統無法啟動就意味著強制上線的操作是錯誤的,不應該繼續下去。在PE裡讀到目錄,實際上已經對檔案系統進行了載入,已經破壞了正常檔案系統的元資料區(只是有可能破壞的不影響要恢復的資料)

故障描述D中,ZIP檔案無法解壓即意味著RAID結構是錯誤的,實際上強制上線了2塊盤(這時候有3塊盤線上,僅有一塊盤離線),但這3塊盤裡有一塊是早就離線了的,所以合起來的資料是新鮮與陳舊的混合在一起的,雖然目錄是正確的,但資料區是混亂的。這時候並未對這3塊硬碟有全面的資料同步,基本還是可以完整恢復的。

故障描述E中,如果和維保公司簽訂協議中確定有資料恢復的專案,可以讓其代為處理(但最好還是諮詢幾家專業的資料恢復公司,確定一下處理方式)。如果維保公司並無資料恢復的服務範圍,最好直接選擇資料恢復公司。大多數情況下,如果客戶直接找維保公司,維保公司再找資料恢復公司,可能會導致費用增加(有時候大得可怕),同時對資料安全、資料恢復流程的規範方面無法直接控制。

故障描述F中,重建RAID5是此例中最致命的操作。IBM X225使用SERVER RAID SUPPORT CD重建RAID時,預設會清0所有資料。即使是其它伺服器,重建RAID時一般也會重新同步校驗,也會打亂原來的資料結構。但這個過程全部完成需要一段時間,如果沒完成,可能剩餘部分資料還有機會恢復。

故障描述G中,經過了一天,73G的RAID成員盤都已經同步完成了。資料完全毀掉了。

相關問題答案