■ 山東 張艷霞 樊培彩
編者按:筆者在處理服務器內存故障中遇到服務器響應異常慢的現象,經分析后發現是由于服務器內存插法順序錯誤導致的。
筆者有一臺2013 年購置的HP DL388eGEN8服務器,為雙CPU配置。近期該服務器出現內存報警,提示內存故障。
該機器上本來有4 條4 GB 內存,筆者因不確定哪一條內存故障,故順手拔掉了其中兩條內存,機器能識別剩余8 GB 內存,也能正常啟動。而啟動后,內存利用率不高,CPU 利用率卻居高不下,基本上是大于80%,經常是100%。機器響應異常緩慢,system 進程過高占用CPU,大于50%。運行Ping 命令時明顯響應慢。該設備作為Ping 的目標機,響應異常慢。筆者在處理這個問題時,頗費了一番周折。
開始筆者懷疑機器中病毒了,通過升級殺毒軟件,系統打補丁,但故障依舊,并未發現中病毒的跡象。無意中筆者看到了服務器內存插槽圖,終于明白了服務器異常慢的根本原因。內存插槽圖如圖1 所示。
Intel xeon 5500 系列處理器集成3 個內存控制器,內存子系統劃分為通道channels,每個控制器控制一個通道(channel),組成3通道內存,每個處理器支持3個channel,每個channel 支持2 個內存。對內存的插法也有很多種情況,根據不同的插法可以達到性能和安全不同的效果。在多處理器配置的機型中,為達到最大化性能的目的,應盡可能均勻地分配所有處理器對應的內存總容量。內存條的配置:插法按照“ABCDEF”配置。
圖1 內存插槽圖
筆者拔掉的2 條內存,正好位于P2 這個CPU 旁邊,導致P2 邊上沒有內存。
這才是造成服務器異常緩慢的根本原因。
因此,筆者通過拔出故障內存,在P2 處理器旁邊A插槽插入正常內存,服務器內存從4 條4 GB 減為3 條4 GB,最終恢復正常。