?

可視化分析技術在審計中的應用構想

2021-07-30 05:43邱靈峰
中國管理信息化 2021年12期
關鍵詞:模型庫結構化數據中心

肖 茂,邱靈峰

(1.中國人民解放軍陸軍勤務學院,重慶 401331;2.重慶市梁平區審計局,重慶 405200)

0 引言

隨著信息技術的飛速發展,各行業都在新技術的推動下積極推進自身數字化、智能化轉型,產生的數據量越來越大。面對海量電子數據,傳統的驗證型審計方式并不能滿足審計工作擴大審計廣度、審計深度的發展需求,審計工作需要向探索型、發掘型審計方式轉變,而可視化分析技術不失為一種可行途徑[1]??梢暬治黾夹g能夠以其直觀的展現方式幫助審計人員交互分析大量數據,通過采用不同的可視化分析技術來揭示數據的分布、趨勢或相關性,審計人員可以更快地從復雜數據中發現疑點線索[2]??梢暬治黾夹g作為一種新的審計數據分析技術,研究其在審計領域的應用,對審計人員在大數據時代工作的開展有重要意義。

1 可視化分析技術的概念

從可視化分析技術的本質屬性來看,審計領域應用可視化分析的主要目標是幫助審計人員獲得更好的見解,得出更好的結論并最終產生假設。在對可視化分析技術本質屬性理解的基礎上,可視化分析技術的概念可以做如下概括。一是指信息技術層面,支持分析過程的人機交互方式與技術??梢暬治鲋饕敢劳幸欢ǖ墓ぞ撸ǚ治銎脚_、軟件或者編程語言)來實現對電子數據的可視化分析。二是指經驗或知識層面,有效融合計算機的計算能力和人的認知能力,基于實務工作的總結提煉而出的分析方法、模型、技巧[3]。

2 審計領域應用可視化分析技術的需求分析

隨著信息技術在各行各業的推廣應用,年度審計工作中需要采集的數據也越來越多,根據數據采集的類型,可以將數據分為兩類,即結構化數據與非結構化數據。

2.1 結構化數據審計對可視化分析技術的需求

結構化數據即行數據,以固定格式存儲在數據庫里。它通常包括彈性分布式數據集和表格數據。隨著審計監督的廣度和深度越來越大,采集的數據越來越多,傳統的審計方法手段不足以應對審計深度發展的要求,審計數據分析的信息化手段必然要得到補充和加強。對此,可視化分析技術不失為一種解決方案,通過以能夠吸引人類認知和視覺能力的方式呈現信息,可以減少處理和分析大數據相關的信息過載的影響。此外,通過利用數據可視化的解釋性和探索性,審計人員可以在探索過程中獲得更好的見解,并在解釋過程中實現更有效的信息傳達。

2.2 非結構化數據審計對可視化分析技術的需求

非結構化數據是指信息沒有以一個可用的預設數據模型或沒有以一個預設好的定義方式來排列。內容上包括所有格式的辦公文檔、各類報表、圖文、圖像以及音視頻信息等。

隨著審計領域工作的不斷拓展深入,尤其是在政府審計領域中的經濟責任審計工作中,審計內容覆蓋了領導干部任職期間履行經濟管理責任的眾多情況,需要查閱大量文檔、文本或者紙面記錄,這些都是非結構化的數據。傳統的審計查閱方式主要是通過大量閱讀來發現問題線索或者依據此來評價領導干部依法履職盡責的情況,主觀性強。但隨著被監督者的法紀意識不斷增強,審計評價在這方面的說服力略顯不足。通過引入可視化分析技術,運用其中的文本可視化分析方法,可以在這一方面有所突破。通過將這些文件記錄進行可視化分析,可以直觀地展示領導干部研究經濟工作的重點內容和頻率等情況。

3 可視化分析技術在審計中的應用目標

可視化分析技術在審計中的應用目標可以分為兩類,一類是信息技術層面的目標,主要是實現分析工具平臺化和分析過程智能化;另一類是知識或思維層面的目標,主要是實現分析方法模型化。

3.1 分析工具平臺化

分析工具平臺化,即可視化分析技術在審計中應用的遠景目標,其要求構建起審計可視化分析平臺,使可視化分析技術集成到軟件內作為一個單獨模塊嵌入該平臺??紤]到審計實際的發展,該平臺的開發應綜合考慮聯網(因特網或專網)和單機(物理隔離或小范圍局域網)應用兩種環境。聯網應用是在審計數據中心建立的基礎上,以審計數據中心的數據為數據源,審計人員可以依托網絡開展在線的數據可視化分析。單機應用主要是考慮到部分被審計單位信息化支持程度不高,在保持平臺主體功能設計不變的情況下,將該平臺搭建在單個服務器上,便于審計人員在現場審計過程中運用可視化分析技術開展審計工作。

3.2 分析過程智能化

進一步應用可視化分析技術的目標是實現分析過程智能化,也就是將機器學習中的異常檢測技術應用于聯網環境下的審計可視化分析平臺中,實現可視化分析過程的智能化。異常檢測技術是一種用來發現欺詐情況,也就是識別某一用戶/群體行為不符合預期模式的技術,在審計中可以結合可視化分析技術運用的場景主要有兩種。一種是審計人員通過采集某一類項目或者某一類業務的數據,利用可視化分析技術來發現數據的特征,如相關數據的走勢情況,之后通過構建相關異常檢測模型來發現疑點;另一種是在特征尚未發現的情況下,通過利用高斯分布來構建異常檢測算法,再利用可視化分析技術來觀察需檢測數據在帶入異常檢測算法后的離群情況,從而判斷是否屬于異常數據。

3.3 分析方法模型化

分析方法模型化,就是將成熟的可視化分析技術應用方法用數據公式或圖形等形式顯示出來??梢暬治瞿P褪峭ㄟ^R、Python 等編程語言或者審計可視化分析平臺對成熟的可視化分析思路所進行的固化,可視化分析模型庫是來自不同審計事項可視化分析模型的集合。建立可視化分析模型庫與可視化分析作為探索性分析的本質并不沖突,模型庫的作用是將審計人員成熟的審計經驗、審計方法通過信息技術固定下來,以便在今后的審計項目中直接調用,節省審計項目用時,便于快速發現審計疑點線索,其本質仍是對數據的一種探索性分析(因為分析的結果是不確定的),只是建立在前人探索經驗的基礎上。模型庫必須是可擴展且保持動態更新的,因為隨著審計人員對數據的了解,隨著審計整體數據分析能力的提升,勢必會涌現出更多的分析模型。

4 可視化分析技術在審計中的應用原則

可視化分析技術在審計中的應用原則主要是安全性、靈活性、可交互性、可擴展性[4]。

4.1 安全性

安全性應用原則主要出于對數據分析平臺應用系統性風險的考慮。隨著審計技術方法體系的不斷更新,對數據的采集要求越來越高,數據采集量也不斷增加,數據分析過程中的安全影響因素也日益增加,主要體現在3 個方面:一是數據訪問的安全性;二是電子數據存儲的安全性;三是數據管理的安全性。

4.2 靈活性

靈活性應用原則主要出于數據采集的考慮,主要體現在兩個方面。一是數據采集方式的靈活性,數據分析平臺需要在聯網和單機兩種環境中使用,需要考慮聯網采集和人工采集兩種方式的需要;二是數據接口的靈活性,各種信息系統產生的數據其數據結構不一,數據分析平臺需要根據不同的數據結構,采取不同的數據采集接口,確保采集數據歸檔后的標準化,同時從聯網審計的角度考慮,數據接口的靈活性也是數據采集自動化的基礎之一。

4.3 可交互性

可交互性主要出于可視化分析其探索性分析的本質,它需要交互式的可視化界面來輔助審計人員對復雜、大量的數據進行探索性分析和推理,主要體現在兩個方面:一是需要通過交互性探索來發現某一類業務的數據特征;二是需要通過交互性探索來從數據中發現異常值。這也是可視化分析技術能夠成功應用的必然要求。

4.4 可擴展性

可擴展性主要是從數據分析平臺建設的長久性出發考慮,其主要體現在3個方面。一是審計思路和模型的擴展。在可視化分析應用的目標中,有一個重要的部分就是可視化分析模型庫,審計人員在將其應用于實踐時,可以根據具體情況提出優化完善的建議,同時,對于未來審計工作中總結出來的成熟可推廣的可視化分析思路和可視化分析模型,需要及時添加到可視化分析模型庫中。二是數據采集接口的擴展。在確保數據采集標準統一的前提下,要兼顧考慮各行業信息系統逐步發展的實際,數據采集接口要能夠適應未來審計需求,在最初建立時就要考慮為未來的數據采集留有空間。三是審計數據中心的物理擴展。隨著采集數據的不斷增加和可視化分析模型庫的不斷擴充,今后審計人員面對的將是海量數據和大型算法模型庫,為保證平臺運行的穩定性和效率,在建設過程中勢必要留有更新及擴展的余地。

5 可視化分析技術在審計中應用的框架設計

基于上文提及的可視化分析技術在審計中應用的目標和原則,對可視化分析技術在審計中應用的框架做初步探討。

5.1 應用的主體框架

可視化分析技術在審計中的應用主要體現在審計可視化分析平臺的構建方面。審計可視化分析平臺架構按照數據采集與存儲、數據處理和數據分析的思路來設計,主要包含3 個層面:一是發揮數據支撐層作用的審計數據中心,二是發揮數據管理層作用的分布式搜索引擎,三是發揮技術應用層作用的可視化分析軟件[5]。同時,數據安全和標準規范體系作為必須遵守的要求貫穿其中。具體結構如圖1所示。

圖1 審計可視化分析平臺

5.2 審計可視化分析平臺的具體功能

5.2.1 審計數據中心的功能

數據中心主要進行數據的采集與存儲,采集到的數據需要基于ETL(即Extract、Transform、Load)工具進行標準化處理后存入相應類型數據庫中。數據采集的來源主要有兩類。一是從各行業業務系統中導出的數據,基本上都是結構化數據;二是從線下收集的各類辦公文檔、圖件、各類報表、音頻等資料。數據存儲主要依托兩類數據庫,一類是關系型數據庫,是指采用了關系模型來組織數據的數據庫,主要代表有SQL Sever、Oracle、Mysql 等,主要用來存儲經過ETL 工具處理后的結構化數據;另一類是Nosql 非關系型數據庫,基于鍵值對來存儲,結構不固定,主要代表有MongoDB、CouchDB 和Redis等,主要用來儲存經過處理后的非結構化數據。

5.2.2 分布式搜索引擎的功能

搜索引擎采用分布式架構,既可以部署在數據中心,供數據中心數據分析團隊使用,也可以部署在移動端,通過個人電腦調用數據中心的數據。分布式搜索引擎應該具有兩個功能:一是全類型數據搜索功能,也就是不僅要能夠搜索結構化數據,也要能夠建立算法實行非結構化數據的搜索;二是主題數據聚合功能,也就是建立審計業務所需的主題數據庫或索引,在通過搜索功能從數據中心調出所需要的數據庫后,利用數據聚合功能,建成可供可視化分析使用的主題數據庫,建成的主題數據庫一般存儲在移動端,以確保源頭數據不可更改,下一步可視化分析則可以直接調用該主題數據庫。

5.2.3 可視化分析軟件的功能

可視化分析軟件主要由可視化分析模型庫、機器學習模塊、可視化交互分析界面組成。

可視化分析模型庫可以分為集成可視化分析儀表盤和單個可視化分析模型。集成可視化分析儀表盤是指根據審計事項的不同,將某一事項下使用可視化分析技術模型固化下來,通過設計優化相關鏈路,以實現單類審計事項所涵蓋業務的動態實時可視化分析。單個可視化分析模型,主要是在個人客戶端調用,方便審計現場作業,減輕現場作業工作量。

機器學習模塊,目前設想主要是通過使用經過處理的正向數據來發現某些單位或某些事項的共同特征,并據此建立優化異常檢測算法模型,通過與集成可視化分析儀表盤的結合使用,可以在數據中心實現異常數據的實時監測發現。

可視化交互分析界面提供一個操作環境,數據分析人員通過篩選器對分析界面的橫縱坐標分別定義不同的對象,再輔以相對應的可視化圖形庫,通過調用這些相對應的圖形來觀察數據的趨勢和發現離群值。在進行交互分析時,不同結構的數據需要使用不同的可視化分析技術??晒┦褂玫慕Y構化數據可視化分析技術比較多,有折線圖、熱力圖、散點圖、餅圖等;可供使用的非結構化數據可視化分析技術比較少,目前應用的領域主要集中在文本類數據的分析上,主要使用的是標簽云技術。

同時需要指出的是,數據安全和標準規范體系需要貫穿整個平臺。為了保證數據分析安全,必須建立相應的安全規范,對數據的調用、數據的存儲、處理權限、訪問權限等做出體系化設計;對于數據采集標準,可供參考的有2019 年審計署通過國際標準化組織發布的“審計數據采集”國際標準。

6 結語

當前,可視化分析技術在審計中的應用還處于初步探索階段,在審計實務中應用還不多,主要是受制于審計人員自身素質和信息技術發展的影響。為使可視化分析技術在審計中的應用能夠平滑展開,可以首先在審計人員比較熟悉的Excel 軟件中推廣使用數據透視圖功能進行可視化分析,之后逐步推廣到使用R 語言、Python 等編程工具進行可視化分析,待審計人員信息化素質以及信息技術發展到一定階段后,審計可視化分析平臺的應用會是大數據環境下審計數據分析領域不可或缺的工具。

猜你喜歡
模型庫結構化數據中心
酒泉云計算大數據中心
促進知識結構化的主題式復習初探
結構化面試方法在研究生復試中的應用
民航綠色云數據中心PUE控制
基于模型庫系統的金融體系流動性風險預警機制研究
基于圖模型的通用半結構化數據檢索
基于云計算的交通運輸數據中心實現與應用
基于模型庫的現代成本會計計量系統研究
Overlay Network技術在云計算數據中心中的應用
基于軟信息的結構化轉換
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合