?

談工業控制中服務器的正確使用

2011-04-14 01:16羅天昊李維剛
石油化工自動化 2011年3期
關鍵詞:控制站網卡組態

朱 妍,羅天昊,李維剛

(1.遼寧師范大學 計算機與信息技術學院,遼寧大連 116081;2.遼寧石油化工大學 能源化工系,遼寧撫順 113001; 3.中國石油集團公司撫順石化公司 煉油與化工項目部,遼寧撫順 113008)

0 引 言

目前,工業企業特別是化工流程行業,DCS得到廣泛應用,并在工業以太網中大量使用服務器、交換機、網卡、光纖等通信設備,使DCS的構建規模和復雜性日益增加,從而對保證系統運行的各方面性能帶來了相當難度。服務器,是網絡中的關鍵設備,如何恰當地配置,是值得注意的。

從廣義上講,服務器是指網絡中能為其他機器提供某些服務的計算機系統;從狹義上講,服務器是專指某些高性能計算機,它在網絡操作系統的控制下,可與任何外部設備相連,并且在穩定性、安全性、工作性能等方面要求更高。它是網絡上一種為客戶端計算機提供各種服務的高性能計算機。

權威統計,控制信息的高端工業級服務器,作為網絡上的節點,存儲和處理著網絡上80%的數據和信息,既為網絡上的客戶機提供信息共享,又為網絡用戶提供集中計算、信息顯示及數據管理等服務功能,因此對服務器依賴程度越來越高。一旦突然停機或意外的網絡中斷,就會帶來控制系統的嚴重后果。

服務器安全涉及多方面,包括硬件、系統、網絡、數據、安全運行等。必須采用專用網絡安全芯片、系統內核加固、硬件容錯等先進技術,且必須具備如下的特點:

a)高性能。服務器的高性能主要體現在高速的運算處理能力、強大的外部數據吞吐能力,使服務器能夠在單位時間內處理相當數量的請求并保證每個服務的響應時間。

b)可靠性。長時間的穩定可靠運行,服務器故障率很低,具有安全保障能力,是普通的PC機所做不到的。

c)可擴展性。服務器能夠隨著用戶數量的增加不斷提升性能,具有可管理等方面的突出優勢。

可見,服務器必須可靠高效,具有承擔保障服務質量能力。

1 系統組成及網絡架構

某煉油項目8 Mt/a常減壓裝置,其DCS是采用德國西門子公司的PCS7系統實現的。它采用先進的分布式客戶機/服務器架構,并基于該公司標準的Simatic軟件和硬件,支持總線冗余(包括系統總線和現場總線)和組件冗余(包括控制器、Profibus等接口模塊),支持在線組態修改和故障診斷,是新一代全集成自動化控制系統。

此生產裝置DCS的上位機采用了冗余的操作站服務器和客戶端的結構,即配置了1對互為冗余的547B型工業級服務器,1臺工程師站,1臺歸檔服務器,5臺客戶端操作站,5對冗余的AS控制器和若干 I/O卡件,整套系統實際提供 I/O點數1 430點。DCS所配置的工程師站,是用于對DCS進行組態調試和系統下裝,并以實時數據庫的形式來處理信息;DCS正常投運后,生產操作人員可以通過冗余的服務器從操作員站對生產工藝過程進行操作和監視,并監視服務器和控制器之間的數據通道的通信質量。

該工業級服務器采用雙機熱備和負載均衡技術。同一時間內當其中運行著的一臺服務器出現故障無法啟動時,另一臺備份服務器會迅速地自動啟動并運行,從而保證整個網絡系統的正常運行。整個控制系統可分為三個層次:各操作員站通過工業級交換機與工程師站和服務器構成上層標準的工業以太網;工程師站和服務器又通過Scalance系列的模塊化工業級交換機與各分散的AS控制器連接成環形的工業以太網,且上述兩層都是1Gbit/s速率的工業以太網絡;而底層的各AS控制器與現場的I/O(輸入/輸出)卡站(ET200M)相連接,并采用冗余的 Profibus-DP現場總線來進行下行通信,通信速率為12 Mbit/s。

該DCS的客戶機/服務器(Client/Server)即C/S結構特點:客戶機不斷向服務器發出服務請求,服務器根據服務請求類別來完成相應的作業并將處理結果按輕重緩急回送客戶端。具體講就是該架構是把DCS中應用程序中的執行內容劃分成兩部分:客戶機應用程序和服務器數據庫程序。當客戶端需要對AS控制站中的數據進行任何操作時,客戶程序就自動地尋找服務器程序,并向其發出服務請求,而服務器程序則根據預定的規則做出應答,相應地從存儲空間中取得數據,運算并送回結果。這樣,現場控制站CPU運行數據的負荷比較輕,而與數據存取有關的多數界面操作部分,則由服務器中數據庫管理系統承擔。其優點:充分發揮工業以太網中客戶端、服務器和現場控制站自身獨特的處理優勢;極大地減少主干網絡上的信息流量,避免信道擁擠和堵塞;有效地發揮了工業服務器軟硬件性能可靠、執行效率高,數據庫管理集中、安全、方便的長處。

2 服務器的故障現象

該蒸餾裝置于2009年10月初開始試生產。DCS剛投用,于2009年10月9日凌晨,中央控制室有4個操作員站的工藝畫面均讀不到生產數據,無法進行生產工藝指揮和操作。計算機維護人員迅速將1號服務器斷電再重新啟動,逐步恢復了操作站的操作功能。在處理過程中,現場操作人員臨時啟用了現場操作員站進行操作,生產未造成影響。10日凌晨,同樣的故障再次出現,因處理及時,未對生產造成影響。11日,工程師全面檢查DCS,拷貝出工業服務器上方顯示器中的診斷信息,內容如下:

a)窗口上的部分報警信息顯示了1號服務器與所有AS控制站CPU的通信發生中斷。

b)窗口上報警信息顯示了1號服務器與2號服務器的冗余功能處于中斷狀態。

c)從Windows的事件記錄器中發現,1號服務器的網卡CP1613在同一時間內出現了故障報警信息。

3 故障問題分析

綜合系統和網絡設置,并參照報警信息分析如下:

a)出現問題與現象是與OS操作站連接的網絡服務器故障,原因是服務器內部網卡CP1613的故障,造成操作站與服務器連接失敗。而網卡CP1613的功能是負責建立1號服務器與所有AS控制站中CPU的通信聯系,而生產的過程就是所有的操作站要時刻與1號服務器保持通信,交換信息。當網卡CP1613出現故障時,1號服務器與所有AS控制站中CPU的通信發生了中斷,數據無法上傳,其結果與1號服務器相連接的操作站也就無法讀取動態的數據,更無法指導和進行生產操作。

b)工業服務器與AS控制站發生通信故障一般是由硬件問題而引起,對正常運行的計算機系統而言,出現這樣的現象是非常特殊的。經過檢查發現所有操作站均連接在1號服務器上,而不是各為一半分擔在2臺互為冗余的1號和2號服務器上,組態上也未做合理的物理分配,且在冗余服務器系統的配置表中,冗余切換的選項功能也未使用。冗余服務器應當具備:當冗余1號和2號服務器與所有控制站之間發生通信故障時,所有操作站應當自動切換到另一個同步運行的服務器上,而發生故障時,計算機DCS實際上并未發生切換動作。

c)經過現場分析查證,是因為在計算機系統調試過程中,組態人員需要經常下裝和更新AS控制站CPU中的內容,這樣經常造成服務器與AS控制站CPU通信的中斷,從而使每次組態工作都產生OS操作站與1號和2號服務器之間的相互切換。組態人員為了避免頻繁切換的麻煩,當時取消了對該項功能的設置;而投用試生產時因遺忘與疏忽,使控制室所有4臺OS操作站即客戶機沒有與服務器建立有效的冗余連接功能,另外服務器的負荷分配也存在問題,所以當1號服務器與所有AS控制站CPU的通信發生中斷時,冗余功能失效,無法自動切換到2號服務器上,因而生產操作人員也就無法讀取數據和進行操作了。

d)當現場維護人員強制停止1號服務器的運行后,就相當于強制將所有的OS操作站切換到2號服務器上,而2號服務器的工作是正常同步的,所以所有OS操作站可立即恢復正常操作,但是由于組態的遺漏,實際服務器運行只能完成人工干預操作。

4 故障解決方法

a)更換了1號服務器的CP1613網卡,對服務器冗余切換功能選項重新進行組態,并經過兩天的運行觀察,沒有發生類似故障。

b)為了提高系統的可靠性,對1號和2號服務器的冗余設置進行了優化,如果再出現類似網卡故障的情況時,這兩臺服務器之間會自動進行切換。

c)為了分散故障危險性,維護人員將這4臺操作員站的默認連接進行了對半分配。即其中2臺以缺省方式連接至1號服務器上,另外2臺以缺省方式連接至2號服務器上。這樣,如果1號服務器發生故障,不論這兩臺服務器是否發生切換,至少能保證有2臺操作站可以操作。

d)在現場,DCS工程師對計算機系統的設置進行了全面的檢查,包括服務器的冗余選項、時間同步設置、多項目結構等,未發現其他配置上的遺漏。之后,DCS工程師與工藝技術人員共同做了實驗,模擬出故障時的狀態,驗證了上述推斷的正確。

e)在優化了系統的設置后,再次進行了生產在線試驗。這次,當1號服務器故障時,操作站能自動切換到2號服務器上,未發生影響操作的情況。

5 故障處理的經驗啟示

a)要養成良好的程序化軟硬件組態工作習慣,以免工作忙亂時出現差錯,特別是重大失誤。

b)要重視系統的冗余架構,對于CPU卡、服務器、交換機、網卡、網線等冗余設備的參數設置一定要優化,包括在今后系統調試、運行、維護過程中,要保證參數設置統一,克服隨意性。

c)DCS制造工廠的驗收測試內容還要細致和深入,測試方案不能粗放,驗收測試的記錄要詳實,報告中要能查閱到當時的測試細節,包括測試方案、內容和步驟,同時要完善驗收測試表格及記錄。

d)工廠驗收的測試要按技術規范對所有電子部件卡板進行考機試驗,增加抽查比例,盡量將這些分離的控制單元連接起來,并在大系統運行下考證大量交換數據負荷的運行對系統架構的影響,特別是通信部件的功能效果情況,這樣便于及早發現問題。

e)做好系統的安全保障。建議將原來的Administrator用戶名改為其他,并且設置復雜密碼,經常檢查計算機上是否有新的用戶名,一旦發現莫名其妙多出來的用戶,及時刪除并更改管理員密碼。另外,服務器上只安裝必須的軟件,盡可能減少其他軟件的安裝。

f)做好DCS服務器備份策略。由于DCS服務器擔負著系統的重要功能,如果服務器系統一旦癱瘓,工藝人員就不能對裝置進行監控和操作,更重要的是程序與系統組態文件等重要文件和數據將丟失。即使按常規重裝的方法恢復系統,不但步驟復雜,而且還會出錯、將前功盡棄;且再次重裝,不但花費大量時間,而且影響整個裝置的生產。因而對系統做出有效的備份和快速恢復措施是非常重要的。

g)重視服務器存儲系統。硬盤作為服務器數據存儲的主要設備,是一種技術含量高、制造精密的設備,服務器硬盤的發展目前已達到10 kr/s或15 kr/s,在運行當中,一點細小的故障都有可能造成硬盤物理損壞,所以工業使用的服務器必須都采用Raid磁盤陣列存儲,以加強服務器硬盤的容錯功能。

h)定期進行備份。對于一些非常重要的數據,要做好相對完善的備份方案,按計算機公司推薦的標準進行操作,切勿盲目操作。如果發現服務器數據丟失,千萬不要再盲目操作,造成數據恢復機率的降低。應該通過正規渠道來尋找數據恢復的技術支持,聽取專業建議或請專業技術人員檢查,同時不要再往丟失數據的分區或硬盤里寫入數據,以減少二次破壞。

[1] 鐘小平,張金石.網絡服務器配置與應用[M].3版.北京:人民郵電出版社,2007:123-136.

[2] 聶元銘,林建華.自主可控安全服務器探討[J].信息網絡安全,2010,(5):23-24.

[3] 閆志強.西門子PROFIBUS工業通信指南[M].北京:人民郵電出版社,2007.

[4] 梅海青.兩種數據冗余方案的淺析[J].可編程控制器與工廠自動化(PLC FA),2010,(7):115-117.

[5] 王大忠.探討Web服務器高效運行的方法[J].電腦編程技巧與維護,2010,(14):58-60.

[6] 彭亞峰.DCS系統在生產應用中的故障分析[J].內蒙古石油化工,2009,(6):44.

[7] 盂和平,宦曉峰.DCS服務器備份和恢復在熱軋板廠的應用[J].梅山科技,2006,(1):19-20.

[8] 富 強,爾聯沼,關云潔.集散型控制系統網卡通信研究[J].自動化儀表,2003,24(3):59-61.

[9] 吳子龍,劉 茜,軒 東.以太網用于工業控制的主要難點和問題[J].數字石油和化工,2006,(11):17-18.

[10] 陳 磊,馮冬芹,金建祥,等.以太網在工業應用中的實時能力分析[J].化工自動化及儀表,2003,30(1):44-47.

猜你喜歡
控制站網卡組態
基于PLC及組態技術的恒溫控制系統開發探討
法國水師兵營舊址 曾作為法國在長江上游的控制站
ECS-100系統控制站硬件配置及使用
Server 2016網卡組合模式
基于PLC和組態的智能電動擰緊系統
美國無人機地面控制站的改進與發展
中俄界河黑龍江主要控制站設計通航水位研究
PLC組態控制在水箱控制系統的應用
鑄造行業三維組態軟件的應用
挑戰Killer網卡Realtek網游專用Dragon網卡
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合