?

管家式集約化運維關鍵技術研究

2017-03-09 23:26何文金劉江李冬
微型電腦應用 2017年12期
關鍵詞:集約化管家運維

何文金, 劉江, 李冬

(國網信通產業集團 安徽繼遠軟件有限公司, 合肥 230088)

管家式集約化運維關鍵技術研究

何文金, 劉江, 李冬

(國網信通產業集團 安徽繼遠軟件有限公司, 合肥 230088)

針對國網集中式部署運維應用現狀,以集中式部署信息系統運維為研究對象,通過分析國家電網公司運維特點和發展趨勢,探索優化配置運維服務資源,創新運維服務模式,以集約化監控、故障預警、自動恢復為切入點,提升服務質量,提高服務效率和業務可靠性,改善用戶體驗,推進運維管理集約化和智能化。

集中式部署; 運維服務模式; 服務質量; 用戶體驗

0 引言

隨著公司SG-ERP的建成,信息系統逐步實現集中部署,信息資源集中化程度更高,系統架構更加復雜,資源配置更加集約,系統承載壓力大幅增加,傳統的運維模式與集中部署后的運維模式存在較大差異,對運行管理工作提出更高要求。

國網公司信息化的發展,促使信息系統規模、服務用戶數日益增加,信息系統間集成關系日趨復雜。[文獻1]在企業信息系統運維實踐中,經常有業務問題找不到故障。主要是當前監控系統是分離監控業務系統組成部分的工作狀態[2]。[文獻3]云計算技術逐漸成熟,大規模集群在企業部署與應用,使企業IT架構越來越復雜,對運維人員技能的要求越來越高,對運維工作也帶來極大的挑戰和困難。[文獻4]傳統的運維模式沿襲了多年前的保守運維體系,被動式運維。[文獻5]傳統手段無法精確定位故障。已無法滿足日益復雜的IT架構運維,主要表現在:

一是人員成本偏高。運維工作中的操作多為手工作業,不僅重復性工作量大,而且存在誤操作風險,管理難度大,而隨著企業IT結構的越來越復雜,又不得不投入更多的人力。

二是自動化程度低?,F有模式只有發生故障或影響業務連續性時才會被發現,并非是主動預警、修復,所以IT運維往往陷入“救火隊員”的角色中,故障報警此起彼伏,惡性連鎖反應持續發生,還會導致企業對IT運維的滿意度大幅降低[5]。

三是隨著計算、存儲資源的池化,資源利用率提升,以往人工更新、檢測和故障排除的模式,在面臨虛擬化的成千上萬甚至更龐大的資源管理時,將更加困難。[文獻6]云環境中的主要功能之一是用戶可以要求服務,通常是通過自助服務門戶實現的。他們可以從中選擇各種不同類型的服務。

本文根據文獻研究成果,引入管家式保姆理念,研究分析國內外先進的運維管理經驗,開展集中部署信息系統運維差異性分析,研究設計管家式集約化運維管理模型,提出管家式運維體系。通過管家式運維實現對系統運行狀態統一集中監測與評估、故障分析與輔助定位、故障自動處理、自動化巡視巡檢、故障預警等,開展信息系統集約化監控、故障預警、系統自動恢復技術及相關系統研究,以支撐IT服務敏捷、快速的部署,高效、按需分配資源,安全穩定運行,固化運維管理流程,減少重復勞動,提高工作效率和規范性,支撐信息系統運維工作從設備監控向全面監控延伸,從手工操作向自動操作演進,從被動響應向主動服務轉變,促進運維規模、服務水平和工作效率提高。

1 研究目的與意義

本課題通過研究分析國內外企業及國家電網公司的運維特點和發展趨勢,探索優化配置運維服務資源,創新運維服務模式,以集約化監控、故障預警、自動恢復為切入點,提升服務質量,提高服務效率和業務可靠性,改善用戶體驗,推進運維管理集約化、自動化及智能化,具體目標如下:

1)解放管理資源:分離出非關鍵工作,用管家建立“防火墻”;

2)提升服務質量:統一管理、作業、流程、質量標準體系和主動服務。

3)提高服務效率:管家主導,其他服務商配合,接口統一,責任明確。

4)豐富經驗儲備:通過繼遠管家作為媒介,共享其它項目上成功的經驗。

5)優化運維流程:管家式運維服務模式下,運維流程的設計和管理將打破服務商和項目組的界限,對整體職能做統一界定,運維流程整體性更強、端對端扁平化管理趨勢更明顯。

6)提高運維黏性:通過管家對全業務質量監控,提升系統安全性和業務可靠性,增強客戶對團隊的信賴,并因其無可替代的品質而值得依賴。

2 管家式集約化運維關鍵技術研究

2.1 集中部署信息系統集約化運維差異性分析

通過研究分析國內外企業運維特點和新技術發展與應用趨勢,發現企業信息系統運維業務均強調了集約化、扁平化、資源配置管理及自動化管理的發展目標,而集約化、扁平化、自動化管理的實現基礎往往離不開信息系統軟硬件的高度集中,本次調研工作就集中部署及分散式運維的差異性進行了全面的分析,梳理出集中部署信息系統運維工作存在以下幾個方面的問題與不足:

1)人員成本偏高運維工作中的操作多為手工作業,不僅重復性工作量大,而且存在誤操作風險,管理難度大,而隨著企業IT結構的越來越復雜,又不得不投入更多的人力。

2)自動化程度低?,F有模式只有發生故障或影響業務連續性時才會被發現,并非是主動預警、修復,所以IT運維往往陷入”救火隊員”的角色中,故障報警此起彼伏,惡性連鎖反應持續發生,還會導致企業對IT運維的滿意度大幅降低。

3)隨著計算、存儲資源的池化,資源利率用提升,以往人工更新、檢測和故障排除的模式,在面臨虛擬化的成千上萬甚至更龐大的資源管理時,將更加困難。

為了解決上述問題,通過管家式運維實現對系統運行狀態統一集中監測與評估、故障分析與輔助定位、故障自動處理、自動化巡視巡檢、故障預警等,開展信息系統集約化監控、故障預警、系統自動恢復技術及相關系統研究,以支撐IT服務敏捷、快速的部署,高效、按需分配資源,安全穩定運行,固化運維管理流程,減少重復勞動,提高工作效率和規范性,支撐信息系統運維工作從設備監控向全面監控延伸,從手工操作向自動操作演進,從被動響應向主動服務轉變,促進運維規模、服務水平和工作效率提高。

2.2 集中部署信息系統運維發展趨勢研究

集中部署信息系統運維管理發展方面,在信息化建設初期,單個業務系統主要以售后服務模式為運維核心,側重于解決問題;信息化建設中期,企業多業務系統運維主要以流程管理為核心,側重于提高工作工作效率;信息化建設完成后,企業內的業務系統運維則需要對整個運維資源(人員、技術、流程、資源)進行統籌管理與管與分配,形成信息運維標準體系,促進運維服務自動化。企業經歷了運維發展過程中的各個階段, IT系統架構逐漸走向標準化、模型化,通過運維管理平臺,可以對運維服務進行集中的遠程自動化監控。能夠收集運維過程中所有的問題、事件、變更、服務級別等信息并錄入管理系統,不斷完善進而形成一套趨向自動化的運維支撐體系。逐步由被動式、高成本的運維模式向高效率、低成本、規?;募惺竭\維模式發展,具體體現在以下幾個方面:

1)規劃規?;?/p>

為了確保運維服務模式能夠適應不同的運維環境,各企業能在運維體系架構設計時便充分考慮到標準化、模型化,新增業務資源可通過定制進行完成。

2)服務自動化

通過自動化技術,提高日常巡檢、故障告警、故障排除等運維服務的工作效率,以達到自動化運維的目標,運維模型的設計過程中重點要考慮自動化批量處理能力。

3)管理智能化

通過運維管理模型規范運維人員和服務商的工作流程和協調配合,并以平臺工具進行信息查詢、告警管理等操作。智能化:使用新技術,提升運維管理方式的處理效率,引入嵌入式自動化架構,實現智能終端APP化管理。

4)監控平臺化

國內外各企業的運維管理基本都設計了符合各自企業特色的運維管理平臺,通過管理平臺化監控運維服務過程、運維服務質量及運維服務交付等,實現對運維服務的全方位監控。

5)運維組織扁平化

信息技術的發展和運維管理支撐系統的建設完善,使運行維護組織管理的扁平化成為可能,管理的扁平化可以簡化生產作業流程和管理流程,增強運行維護工作的靈活性和適應性,提高工作效率,降低運行維護成本。

2.3 建設管家式集約化運維管理模型

未來,運維管理模式的建設方向是一體化集中管控模式。針對國網公司集中部署模式已逐步完成的運維管理現狀,為了提升國網公司運維服務服務質量,提高服務效率和業務可靠性,改善用戶體驗,推進運維管理的集約化、自動化及智能化??紤]組織特點和未來的發展方向,以及基礎設施、應用的大集中模式現狀,逐步嘗試融合私有云,集中化的運維管理模式來支撐國網公司的運維管理。借鑒IT運維管理發展趨勢,結合國內企業的現狀特點,以統一的技術工具平臺為支撐,以“管家式服務”為理念,遵照統一規范的運維流程執行,明確出人員角色,建設集約化運維管理模型,涵蓋組織模式、管理制度、管理流程、績效考核、知識 管理、技術支撐等內容。

1)組織模式

為了實現一體化集中管控的運維管理,將運維管理團隊、運維執行團隊到后臺支持團隊3個方面進行統一,按照業務 設立統一的運維團隊,為用戶提供統一的IT 運維服務。

2)制度規范

管理制度體系分為 “信息化運維管理辦法”、“各服務管理流程序文件”、 各信息系統項目根據具體情況再制定實施細則和操作指南以及表單4個層次。

3)管理流程

建立統一的服務管理流程,包括分別面向用戶的服務支持流 程,如事件、問題等流程。以及面向客戶服務交付流程,如容量管理、可用性管理等流程。

4)績效考核

績效考核從IT運維管理體系的目標出發,按照組織、流程和崗位角色分解, 形成“IT運維組織KPI關鍵績效指標—流程KPI—角色崗位KPI”3層相互關聯的績效考 核指標體系。

5)知識管理

整合知識資源,建立一套“統一、集中”的運維知識管理平臺,以便為總部及所屬企事業單位IT運維工作提供支持。

6)技術支撐

建立集中統一的運維管理平臺,包括服務流程平臺、監控平臺、知識管理平臺等。

3 創新與技術難點

運維主動式管理:隨著業務系統對網絡的依賴日趨加深,看似輕微的系統故障很有可能威脅到整個公司的運作,而如果IT部門只是從報修電話中體現價值,總是做“事后諸葛亮”是很危險的。如何借助于管家式集約化技術手段,提前預測業務系統潛在的安全隱患,及早緩解潛在風險,成為主動式運維管理的一個難點。

故障自動化處理:故障處理效率不高,人力成本攀升苦不堪言。首先,一線的IT運維人員無法第一時間得到故障通知,而被動讓故障處理再陷泥潭,定位故障源頭的難題讓這種局面惡化。其次,設備和業務系統日常巡檢依靠人力難以維持,工作量過大可能會造成巡檢工作敷衍了事,還會留下運維“死角”。

IT運維與業務脫離:IT運維與業務脫離,無法用非技術化的數據向業務部門表述IT戰略及IT資源的分配狀況,業務部門也無法直觀的看到系統健康狀況。

而管家式集約化運維管理模式能夠對整個IT資源進行統一管理,而通過管家式集約化管理模型的建設,實現從操作調度到基于最佳實踐的標準化流程的統一管理。從被動服務向主動服務轉變,從粗放管理向精細管理轉變,從單項優勢向整體優勢轉變,從運行管理向全生命周期管理轉變。

4 總結

本課題借鑒“管家式保姆”先進理念,研究國內外先進的運維管理經驗及信息技術發展趨勢,結合國網運維管理現狀,整合運維服務資源,改變以往被動式、低效率、高成本的運維服務模式,研究集中部署信息系統運維差異性分析、管家式集約化運維管理模型,實現服務主動式、專業化、自動化、可定制、高標準的要求。

[1] 吳舜,許大衛,魏征,等.基于用戶體驗的信息系統主動運維平臺[J].電信科學,2015,31(3):222-229.

[2] 姜旭,許國平,王珂,等.商業銀行應用系統主動運維規范研究[J].金融科技時代,2016(2):40-43.

[3] 陳康,鄭維民.云計算:系統實例與研究現狀[J].軟件學報,2009,20(5):1137-1148.

[4] 聞屏.構建全鏈路監控打造面向大客戶的主動運維服務新體系 [J].中國通信,2016,18(22):162-163.

[5] 吳舜,許大衛,魏征,等.基于用戶體驗的信息系統主動運維平臺[R].中國電機工程學會電力信息化專業委員會,2016.

[6] ZDNet.應對四大挑戰:實現云環境下的主動運維[J].Network & Information,2011,25(10):279-280.

ResearchonKeyTechnologiesofButlerIntensiveOperationandMaintenance

He Wenjing, He Wenjing, He Wenjing

(State Grid Communication Industry Group CO., LTD Anhui Jiyuan Software CO., LTD, China, Hefei 230088)

According to the national network of centralized deployment operation application, the centralized deployment information system maintenance is taken as the research object. Through the analysis of the national Power Grid Corp operation characteristics and development trend, the optimal allocation of service resources, innovative service model to intensive monitoring and fault warning and automatic recovery is used as the starting point, to improve service quality, service efficiency and the service reliability, to improve user experience, and promote intensive and intelligent operation and management.

Centralized deployment; Operation and maintenance service mode; Service quality; User experience

1007-757X(2017)12-0078-03

何文金(1978-),男,漳州人,工程師,研究方向:電力行業信息化。

劉江(1982-),男,渦陽人,工程師,研究方向:電力信息化工作。

李冬(1984-),男,阜陽人,助理工程師,研究方向:電力行業信息化。

TP311

A

2017.10.21)

猜你喜歡
集約化管家運維
秋季蔬菜集約化育苗生產技術指導意見
郁小文的豬管家
運維技術研發決策中ITSS運維成熟度模型應用初探
做自己的小管家
基于集約化的電費電價管理措施探析
風電運維困局
探究縣供電企業財務集約化實踐分析
雜亂無章的光伏運維 百億市場如何成長
傷口“小管家”
基于ITIL的運維管理創新實踐淺析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合