?

可靠性監視器全面排障一例

2021-01-06 05:29北京段旭升范潔
網絡安全和信息化 2020年12期
關鍵詞:死機監視器文件夾

■ 北京 段旭升 范潔

編者按:筆者通過單位服務器出現的不定時死機問題,對其從安全、軟件、硬件方面逐步進行排查,并通過可靠性監視器最終鎖定問題根源。

筆者單位一臺Windows Server 2008 服務器架設了Hyper-V 虛擬化服務,承載了FTP、圖書查詢等業務系統,已經穩定運行多年。最近一個月該服務器出現不定時死機問題。

具體問題表現為:每周死機一次,基本上都是周一發現業務宕機,服務器屏幕無顯示,重新插拔電源后正常啟動。起初筆者沒有多加懷疑,只是認定一般軟件故障。但在出現3 次以后,通過結合固定的宕機時間(周末),筆者推斷該問題有些特殊,于是從安全、軟件、硬件三方面逐步排查故障原因。

硬件方面

磁盤陣列自檢正常,沒有任何故障燈和異響,風扇和溫度也無異常情況。

安全方面

因為本身是服務器且系統版本老舊,筆者重點懷疑安全攻擊導致。但單位配有深信服安全防護設備,且機器訪問外網還需要二次認證,本身也安裝了安全防護軟件。最終經查深信服日志未發現對此設備的惡意攻擊。

軟件方面

軟件方面的問題排查起來難度大,而且難以理清頭緒。筆者和很多管理員一樣,先從“服務”、“計劃任務”和“服務器日志”查起。但是,除了日志中有些安裝更新失敗的記錄,均未發現其它有價值線索。

鎖定問題根源

正在一籌莫展之際,筆者打開了監視工具中的“可靠性監視器”,只看一眼便找到了問題的根源:原來是系統更新過程中造成了中斷性關機(如圖1 所示)。該監視器用圖表的樣式清晰的展示了各類故障,配合穩定性分值從0 至10 詳細打分,在圖中可以看出伴隨著4 次故障點,穩定性分值均出現明顯的下行變化。

圖1 系統更新造成中斷性關機

圖2 控制面板中的可靠性監視器工具

筆者猜測可能是因為系統補丁不完整或者安裝過程中認證失敗導致死機。于是筆者將服務器聯網進行手動更新,不出所料,依然更新失敗。

接下來就開始排查系統更新問題,筆者首先檢查C:Windowssystem32catroot2 文件夾,該文件夾存儲Windows Update 軟件包的簽名,發現文件的更新時間比較久遠。

于是筆者在CMD 界面通過“net stop cryptsvc”命令,暫時停止數字簽名服務,這樣才能清空該文件夾內容。同時,清空C:WindowsSoftwareDistributionDown load 文件夾,該文件夾用于緩存系統補丁。最后,通過“net start cryptsvc”命令恢復服務。

再次運行系統更新程序,發現可以正常安裝系統補丁了。至此服務器故障解決完畢,通過一段時間的運行未發現死機問題。

可靠性監視器工具界面友好,內容詳細,相比系統日志更易解讀。該工具在后期的2012 和2016 版中移動到了控制面板內(如圖2 所示),可喜的是,Windows10 系統也內置了該工具,所以當你遇見難纏的故障時,打開它試一試吧!

猜你喜歡
死機監視器文件夾
提醒
Fast Folders,讓你的文件夾四通八達
摸清超標源頭 大文件夾這樣處理
調動右鍵 解決文件夾管理三大難題
臉死機了
深耕廣電,時代奧視監視器“花香遍墻內外”
不容忽視的空文件夾
計算機“死機”故障原因與排除
計算機“死機”故障原因與排除
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合