問題描述:
同行介紹一個客戶,是網(wǎng)站服務器忽然重啟后無法正常啟動。請我們幫忙處理,重裝系統(tǒng)。
我們先電話聯(lián)系客戶。了解初步情況如下
隔天下班前還是好的,監(jiān)控屏幕看是半夜機器出現(xiàn)重啟,然后就再也無法進入系統(tǒng)。
客戶IT準備嘗試重裝系統(tǒng),但是提示空間不足。說是可以找到硬盤。
為了了解進一步信息,我們請客戶拍照發(fā)給我們。
服務器屏幕顯示如下:
錯誤信息:Error 1962: No operating system found. Boot sequence wil automatically repeat.
這個錯誤表示沒有發(fā)現(xiàn)操作系統(tǒng),自動按照啟動設備的順序逐個嘗試引導啟動。
而可引導啟動的設備里,只有光驅和網(wǎng)卡。沒有任何硬盤。
最壞的情況是,系統(tǒng)提示有兩塊1.8TB的硬盤,但是它們都處于Offline(離線) 狀態(tài)。
如下圖所示范,初步估計應該是兩塊磁盤組成了RAID1磁盤陣列。但是兩塊硬盤都發(fā)生故障了。
為了進一步確認狀況,按“Ctrl+L”進入磁盤陣列配置。
情況還是一樣,只有兩塊物理硬盤,而且都是離線狀態(tài)。這樣就可以肯定物理硬盤有問題了。
這臺機器的陣列配置非常簡單,沒有其他特別功能。通常兩塊一樣容量的硬盤,會組成Raid1, 這樣兩塊硬盤的數(shù)據(jù)會是一模一樣的鏡像。只要不是兩塊硬盤同時損壞,系統(tǒng)是不會出問題的。
如果只壞一塊硬盤,只要及時更換一塊同樣型號和容量的硬盤,RAID 1會自動重建數(shù)據(jù)。
為了進一步確認。把硬盤拆下,接到其他電腦上,還是無法識別硬盤。
對于這兩塊硬盤只能嘗試做數(shù)據(jù)恢復。因為里面有客戶的重要資料。
問題總結:
- 服務器一定要有定期的檢查和備份。否則一旦出問題了,就是愿意花錢也不一定能找回全部數(shù)據(jù)。預防性維護非常重要。
- 對于好點的服務器,硬盤會有獨立的健康指示燈?梢酝ㄟ^指示燈狀態(tài)了解硬盤的監(jiān)控狀況。
比如下面圖片示范的最下面一塊硬盤,健康指示燈已經(jīng)橙色了,表示有故障,需要立即更換。
3.客戶的這款聯(lián)想服務器是2018年5月出廠的。到現(xiàn)在一年半不到的時間,居然兩塊硬盤都壞了。這種情況也非常少見。聯(lián)系了售后,硬盤可以質(zhì)保,但是數(shù)據(jù)不負責。
相對于客戶這個案例,這個保修是無效的,因為一旦做了數(shù)據(jù)恢復,可能需要開盤,也就失去保修的權利了。
最后再次強調(diào),關于重要的數(shù)據(jù),無論是個人電腦還是服務器,一定一定一定要有備份。 |