?

基于機器學習建模效果的電力數據資產價值量化評估方法*

2020-11-28 12:10孫藝新崔維平雷濤
中國科技縱橫 2020年24期
關鍵詞:檢修建模維度

孫藝新 崔維平 雷濤

(1.國網能源研究院有限公司,北京 102209;2.天云融創數據科技(北京)有限公司,北京 100080)

1.大數據時代的數據資產價值特點

在大數據階段,數據才具備了完整的、獨立的資產屬性,它可以作為一個獨立要素,配置到許多生產、經營或管理場景中,通過機器學習建模預測的方式,實現生產、經營或管理的模式改進或模式創新,直接對增加收入增長、降低成本、減少損失或規避風險等目標產生不可替代的且可以評估的經濟價值。

2.數據資產價值的基本評價方式和基本估值方式

數據資產價值的基本評價方式很明確,就是計算引入一項數據資產要素后,在具體的業務場景中產生的經濟價值。

以電網設備故障預測與智能化檢修方案為例,假設原有檢修方案對應的年故障停工損失為S1,引入新模型后的年故障停工損失為S2,則新模型產生的年經濟價值S為:

S=S1-S2

以個性化電價營銷為例,假設原有電力營銷年收入為S1,引入個性化電價營銷后,年收入為S2,則個性化電價營銷模型產生的年經濟價值S為:S=S2-S1。

但是,某項數據資產在某個具體業務場景中產生的經濟價值,并不等于該項數據資產本身的估值,因為在該業務場景中產生經濟價值的要素并不只有所引入的數據資產要素,還包括所依賴的人力、設備和資金等要素,因此,針對上述業務場景,該項數據資產的正確估值y應該是所產生經濟價值S乘以該項數據資產的要素貢獻度權重x,即:y=Sx。假設某項數據資產能應用到多個業務場景中,則該項數據資產的估值就是針對各個業務場景的估值的加和,即:

Y = y1+y2+y3+……+yn= S1x1+S2x2+S3x3+……+Snxn

總體數據資產中包含多項可以產生經濟價值的數據資產子項,因此總體數據資產Z的估值公式如下:

Z=Y1+Y2+Y3+……+Yn

3.用于機器學習建模的數據資產價值的形態分析

3.1 用于機器學習建模的數據資產的三個基本形態

由于在大數據時代,數據資產的價值,是通過機器學習建模預測的方式,在具體的業務場景中得到實現的,而業界的一個通識就是數據和特征決定了機器學習的上限,模型和算法只是逼近這個上限而已,因此,在對一項數據資產的價值進行量化評估時,就不能僅僅從原始維度的層面去評估,還應包括特征工程和算法實現這兩個層面的量化評估,換句話說,當我們對一項數據資產的價值進行量化評估時,需要區分數據資產的3個基本形態:(1)原始維度;(2)特征工程成果;(3)算法實現成果。

理論上,數據資產的原始維度形態決定了數據資產效用和價值的上限,而特征工程和算法實現的作用和價值是通過機器學習模型實現數據資產的價值,并逼近這個價值上限。

這3個基本形態的區分,不僅對數據資產的交易和定價有著更加清晰的邊界意義,而且對該項數據資產的增值開發,以及對利益相關方的利益分配,也有著更加清晰的邊界意義,因為這3個基本形態,在現實中,很可能分屬于不同的利益方,并且可以單獨交易,也可以組合交易,可以單獨定價,也可以組合定價。

3.2 用于機器學習建模的數據資產的時空形態、維度形態和質量形態

數據資產的時空形態,是指數據所在的時間窗口范圍、空間范圍以及數據的時空粒度,電力數據資產就具備很強的時空形態特性,例如電力生產、傳輸和經營數據可以按年度、季度、月度分片,也可以按地區分片。

由于歷史原因,在電力數據資產中,同一類數據資產在不同的時空范圍內,其維度形態和質量形態也有區別,例如有些范圍內的數據維度不夠豐富或有缺失,或數據質量達不到機器學習建模所要求的標準,這些都會影響對數據資產價值的量化評估。這也意味著,在梳理用于機器學習建模的電力數據資產時,需要先行按維度標準和質量標準對不同時空范圍的數據資產進行分級,使其成為價值量化評估的一個判斷前提或依據。

4.用于機器學習建模的數據資產價值的量化評估

假設某項數據資產的形態和所針對的業務場景已經確定,例如,在某類大型設備檢修場景中,原始維度數據集由某時空范圍內的設備基礎數據、運行監測數據、停工檢修數據(含檢修成本和檢修停工損失數據)、故障損失數據組成,那么可以采用以下方式對其進行價值的量化評估:

(1)定義與業務場景對應的價值評估指標,此例中可定義為:價值量化評估指標S=故障損失總值+(檢修成本總值+檢修停工損失總值)。

(2)將原始維度數據集分割為訓練集和驗證集,以設備需要在哪個時間點進行停工檢修為變量,選擇適用的一個標準算法進行建模。

(3)建模完畢,在驗證集中計算建模前的S值S(0)和建模后的S值S(1),則可得到原始維度形態的數據資產所產生的經濟價值為:Y(1)=S(0)-S(1)。

(4)根據場景業務和數據特點,引入特征工程,在特征工程成果基礎上,繼續選擇第2步中所用的標準算法進行建模。

(5)建模完畢,在驗證集中計算建模后的S值S(2),則可得到提升到特征工程形態的數據資產所產生的經濟價值為:Y(2)=S(0)-S(2),而特征工程所提升的經濟價值為:Y(1)↗(2)=Y(2)-Y(1)。

(6)在特征工程成果基礎上,設計新的算法或直接在建模平臺上優化算法,再次建模。

(7)建模完畢,在驗證集中計算算法改進后的S值S(3),則可得到提升到算法改進后的數據資產所產生的經濟價值為:Y(3)=S(0)-S(3)。

而算法改進所提升的經濟價值為:Y(2)↗(3)=Y(3)-Y(2)。

在具體實踐中,4-7步可以重復進行,直到得到理想的結果。

在其他類型的業務場景中,我們同樣可以用類似的方法得到 Y(1),Y(2),Y(3),Y(1)↗(2),Y(2)↗(3)這一組值,并以此來量化評估不同形態的數據資產價值。

如果需要,對同一類或同一項數據資產,因其內部的時空形態、維度形態和質量形態的分布不均導致不同范圍數據集的價值區別,也可以通過上述方法分別進行量化評估,并進行對比。例如,針對同一個業務場景,有兩個數據集A和B,我們可以計算出以下量化評估值進行比對:

Y(1)Avs Y(1)B

Y(2)Avs Y(2)B

Y(3)Avs Y(3)B

在某些業務場景中,因條件所限,數據資產價值的量化評估指標可能無法以金額方式實現,則可以采用機器學習算法的標準評價指標來作為替代或參考,例如采用AUC值或KS值作為評價指標,在條件具備時再換算為金額。

5.基于價值量化評估的數據資產交易方式

數據資產價值的量化評估為數據資產的對外交易和定價帶來了便利,基于前文描述的價值量化評估模式,數據資產可以采取前述三個形態單獨或組合進行交易。

僅僅擁有數據資產的原始維度形態,往往只能得到最低的估值,僅僅售賣原始維度形態的數據資產,往往只能擁有最低的交易報價話語權,并且只能得到最低的價值回報,還面臨著數據泄密的商業風險。因此,擁有原始維度形態數據資產的企業,一定要重視數據資產的增值開發,主動將數據資產形態提升到特征工程或算法實現這兩個高級的、高價值的形態。

對數據資產擁有者來說,最理想的交易方式是交付模型,而不是交付原始維度形態的數據,因為模型不僅包含了原始維度形態的數據資產價值,還包含了特征工程和算法改進所提升的經濟價值,使得數據資產實現價值最大化。

猜你喜歡
檢修建模維度
聯想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
淺論詩中“史”識的四個維度
檢修
基于PSS/E的風電場建模與動態分析
不對稱半橋變換器的建模與仿真
電力系統繼電保護二次回路的維護與檢修
光的維度
論自動化焊接設備的預檢修
“五個維度”解有機化學推斷題
茂名式大修
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合