?

媒體制播系統監控平臺研究

2020-02-23 07:23趙嘉姝
視聽 2020年8期
關鍵詞:日志監控狀態

□ 趙嘉姝

隨著云計算、大數據、媒體融合等新型技術的廣泛應用,媒體的技術系統規模日漸擴大,基本的設備運行已不能滿足現行的節目內容生產和播出業務應用場景。為保障業務、系統穩定高效運行,可采用全局、集中、科學的監控體系,通過直觀的監控顯示頁面,實現對網絡架構、業務狀況、基礎設備的實時監控,及時掌握核心關鍵業務狀態,及時進行預警和精準定位故障,變被動式消障工作為主動式預防,提升技術支持服務能力和水平。

一、監控體系分析

監控體系一般由人工監控和自動監控組成。自動監控平臺需要對網絡層安全、應用層安全和設備安全幾個方面進行監控。監控范圍覆蓋所有播出頻道的在播情況、備播情況、播后情況、系統設備狀態、網絡通信狀態、信號編解碼狀態等,涉及服務器、工作站等信息終端、幾千條網絡線路、數百個業務和中間件應用服務等,管理數據容量非常大,而且存在無法直接穿透訪問的網絡特殊性,以及因應用系統來自多家廠商而導致的軟件版本眾多、日志格式差別大等問題,需要監控平臺作為對全系統規范化、集中化、自動化管理的平臺,提供針對基礎服務器、存儲、網絡設備、業務應用四方面實現完整準確收集全部日志數據、日志間的關聯分析、網絡狀態實時監控等功能,并通過收集的多維異構系統設備日志,經過大數據技術和機器自動學習技術加工,實現告警/故障統計報表功能和軟硬件預警趨勢分析等功能。

監控平臺的體系設計從管理角度提出了以下五個方面的需求。

一是統一管理。監控平臺要實現從基礎架構到業務服務、從性能分析到事件管理、從數據備份到配置管理的統一管理,結合送播系統、播緩系統和總控系統提供送播、上載、技審、總控、播出等相關軟件業務流程的監控和報警功能,集中形成視圖和控制能力,并對運維效率和運維成果進行統一監管和優化。

二是精益管理。通過實時監控業務運行狀態和設備的健康情況,如實時監控各頻道播出切換業務的運行狀態、播出切換系統的主/備播出通道一致性對比監測等,提供相關指導性數據,評估基礎設備的運行負荷量,協助制定合理的資源調配方案,幫助發現信號異常,為制播系統的運行維護工作提供全局且準確的相關數據,同時具備在出現故障時可依據相關數據,實現自恢復或一定程度上的自恢復能力。

三是閉環管理。通過事件管理,實現端到端的預警和瓶頸診斷,以及故障、隱患處理的閉環管理,從戰略上優化制播系統。

四是易用性與實用性。監控平臺應具備操作便捷性、界面簡潔性、數據與設備高關聯性、可下鉆操作等特點。

五是分布式架構。對分布在不同跨物理區域的多種系統,要支持分布式部署,彈性擴大監控系統性能。監控使用的管理單元、數據庫、采集器應支持獨立部署在不同設備中,監控數據應使用便捷、安全的方式上傳到中心數據庫,可以使用同一套管理體系,實現異地集中監控和集中管理,降低異地信號監控運營成本。

平臺化的監控體系不但可以最大程度實現所在系統的監控需求,還能滿足系統的柔性擴展需求,實現跨系統、跨區域的集中管理,具備兼容多種廠家、業務軟件、通信方式的監控能力,可在節省系統運營成本的基礎上,保證媒體制播系統業務的穩定性和安全性。

二、監控平臺設計

根據監控平臺的體系需求,應綜合考慮系統架構管控和節約投入成本等因素,利用分布式處理、海量數據搜索及處理、數據流處理、機器自主學習等技術設計總控系統的監控平臺,在各相關系統部署采集器,收集的數據使用加密方式上傳到制播平臺的監控數據庫內,并對數據做結構化處理,為上層分析提供數據依據。

監控平臺包含展現、功能、數據處理、數據源四層結構。展現層主要為相關使用人員提供展示門戶和數據統計等功能。功能層是根據需要提供各種監控、分析、預警、告警等應用模塊。數據處理層是負責對各區域系統做數據采集和數據處理的工作。數據源層是指被監控對象的集合。

根據監控平臺機構及筆者所在的深圳臺自身業務特點,監控平臺設計整體架構上采用多層分布式的J2EE架構;頁面呈現方式上選擇純B/S架構,支持https配置和Web界面顯示。其中展現層提供實時告警臺、服務臺、知識庫、業務流程狀態監控、業務服務狀態監控和數據統計臺六個功能模塊。功能層選擇資產管理、工作計劃、設計工具、事件管理、問題管理、變更管理、發布管理、配置管理、服務臺、排班管理、知識庫管理、服務目錄、服務水平管理、服務請求分析、運行管理及第三方產品調用等多項功能模塊。數據處理層主要針對告警數據、性能數據、配置數據和業務數據等設置硬件監控管理平臺、機房管理平臺、虛擬環境管理平臺和業務監控平臺,并通過同一個中心配置管理邏輯數據庫——CMDB進行數據采集和結構處理操作。數據源層是數據采集對象的集合,包含網絡、服務器、數據庫、中間件、存儲、機房動力環境、特殊設備、虛擬資源、業務系統和業務數據等。

平臺利用分布式消息隊列管理采集原始數據和結構化處理后數據,滿足擴展設備提升處理能力的柔性系統架構需求。平臺支持分布式計算和存儲功能,選用基于Linux文件系統下的分布式存儲來存放日志索引文件,同時采用流處理技術,將收集到的不滿足結構化要求的數據進行結構化處理,并通過靈活設置結構化數據提取字段,來對其進行統計和分析。平臺還采用交互性良好的Web頁面建立與用戶的連接,降低監控平臺運維和使用難度的同時,還可以利用瀏覽器完成用戶管理、告警設置、數據結構化配置、數據搜索、數據分析、數據導出等操作。

三、監控平臺功能

監控平臺主要針對系統網絡、服務器、數據庫、中間件、存儲、業務數據等數據進行實時性監控,并對這些數據進行統計分析,從而實現排除系統隱患、快速定位故障點等功能。

一是平臺對網絡的監控。主要支持網絡協議如NetStream、NetFlow、IPFIX的分析,通過采集網絡流量,收集每位用戶每個時間段內的流量情況;還支持通過syslog日志收集,掌握交換機、防火墻等網絡設備的軟硬件信息,如硬件故障、配置變化、用戶連接信息、用戶登陸信息、端口狀態、安全威脅、策略應用信息、網絡地址轉換等。

二是平臺對服務器的監控。支持監控Linux系列、Windows系列等多種系統類型服務器的主機服務監測、進程、性能、事件日志、空間、目錄更改、風扇、CPU溫度、機箱溫度等健康狀況,及時發現并預警隱患。

三是平臺對數據庫的監控。通過對訪問狀態、特定進程狀態和數量、連接數量、死鎖數量、讀寫命中率、回滾數量、表空間、碎片百分比、庫中每秒執行事物量等數據的監測和收集,實現對系統內Oracle、MySQL、SQL Server、MangoDB等數據庫的監控,同時支持自定義SQL語句進行監測。

四是平臺對中間件的監控。支持如Tomcat、Websphere、Apusic等各類應用中間件的監控。

五是平臺對存儲的監控。通過存儲內網絡狀態、I/O口流量和性能等信息的監控實現對制播系統和相關系統內的IBM、EMC、華為等多家廠商存儲帶庫和陣列進行監控。

六是平臺對機房環境的監控。通過SNMP采集器和傳感器實現對機房UPS電源、電壓、電流、溫度、濕度、煙感等信息進行監控。

七是平臺對業務數據的監控。通過連接業務數據庫監測業務狀態和變化等信息,實時監控業務狀態,同時圖形化業務服務監控,并通過流程、設備、日志等設定關聯,支持下鉆查詢功能。

八是平臺的統計分析功能。支持歷史、實時等自定義時段分析、生產互動式報表,并通過Excel、PDF等格式輸出。

監控平臺的體系設計宗旨在于“防患于未然”,它的功能與性能直接影響著制播系統的穩定性和安全性。

猜你喜歡
日志監控狀態
The Great Barrier Reef shows coral comeback
一名老黨員的工作日志
扶貧日志
狀態聯想
你被監控了嗎?
Zabbix在ATS系統集中監控中的應用
雅皮的心情日志
生命的另一種狀態
游學日志
堅持是成功前的狀態
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合