?

基于KPCA+LR的電力現貨市場發電企業串謀行為分析

2024-03-11 03:06高麗杰華回春
電器工業 2024年3期
關鍵詞:降維發電樣本

高麗杰 華回春

(華北電力大學)

0 引言

在電力市場的發展過程中,達到資源的優化配置以及保障電力供應安全是市場建設的主要目標。我國各地區資源差異性和互補性較大[1],省間電力資源調劑余缺需求很大,迫切需要建立完善的省間電力現貨市場來保障供應。在省間現貨市場建設初期,由于市場制度的不完善,會出現市場成員濫用市場力的問題,市場力是指發電商改變市場價格并使之偏離市場充分競爭情況下的價格水平的能力。

濫用市場力會降低市場效率,損害用戶利益,妨礙市場健康穩定運行。2000年美國加州出現電力危機,發電商行使市場力使得市場價格飆升,導致諸多公司負債累累并處于破產狀態[2],損害了用戶以及投資人的利益。在我國的電力市場建設過程中,一些市場主體為了謀得暴利采用串謀的方式進行違規報價,嚴重影響市場發電價格的能力,存在部分發電公司故意減產并試圖抬高價格的行為,而合理的價格以及可靠的電力供應對電力市場的健康發展尤為重要,我國的省間電力現貨市場正在初步建設當中,所以對市場進行有效監管以促進公平競爭迫在眉睫。

目前諸多學者進行了對電力市場串謀行為識別的研究,文獻[3]通過對電力市場運營大數據進行分析,建立了完善的風險評估體系。文獻[4]從市場結構、市場供需等多個方面構建了市場力評價指標體系。

文獻[5]提出基于物理潮流分析的市場力評價指標體系,能夠反映機組地理位置以及電網約束對市場力行使的影響。文獻[6]構建了博弈論模型,從機理角度分析串謀,利用均衡模型分析市場主體的戰略行為是電力市場領域的研究熱點[7],但是模型的假設通常不符合電力市場的實際運行條件,在實際中應用價值不高。文獻[8]提出基于云模型和模糊Petri網的串謀識別方法,但是隨著交易數額增大,數據樣本增多會導致該方法的計算量過大。文獻[9]考慮到我國電力現貨市場運行時間不長,帶標簽的數據少,提出使用半監督支持向量機算法訓練可靠分類器。文獻[10]提出基于AdaBoost-DT算法的串謀行為智能識別方法,實時性和準確性較好。文獻[11]提出了基于模糊集理論和層次分析法的電力市場綜合評價方法,該方法既可以從整體上把握市場發展趨勢,又可以反映市場組成的微觀情況,能夠為決策者提供建議。

考慮到省間電力現貨市場仍舊處于初步建設階段,發電企業之間的串謀行為影響資源優化配置并且可能對市場造成破壞,為規避風險并且確保電力市場健康穩定運行,本文設計了KPCA+LR模型進行發電企業串謀行為識別,此方法可避免數據維度過高導致模型過擬合的問題,而且準確率較高,有很高的實用價值。

1 發電企業串謀行為識別指標體系

串謀是發生在兩個及以上的發電企業之間的行為,為了準確評估發電企業的行為,本文從五個方面構建了基于任意兩個發電企業的串謀行為識別指標體系。

(1)市場份額

該指標是指任意兩個發電企業的申報電量占所有發電企業申報電量的比例,具體表示如下:

式中,qi和qj為發電企業i和j的申報電量;N是指一共有N家發電企業參與此次競價。市場份額越高,代表發電企業有更大的操縱市場的能力,發生串謀行為的可能性越大。

(2)持留比率

該指標反映任意兩家發電企業對電量供應的控制程度,具體表示如下:

式中,Qi和Qj表示發電企業i和j的可發電容量,持留比率越高則說明發電企業限制容量并且提高市場價格的可能性越大,那么發生串謀的可能性也就越大。

(3)中標率

該指標表示發電企業i和j的中標電量與申報電量的比值,具體表示如下:

(4)高價中標率

該指標表示任意兩家發電企業報高價中標的電量占中標電量的比率,具體表示如下:

式中,Qhi和Qhj表示發電企業i和j報高價且中標的電量,該指標值越大說明這兩家企業發生串謀的可能性越大。

(5)報價相對比均值

2 基于KPCA+LR的電力市場發電企業串謀識別模型

將串謀識別問題視作二分類問題,由于串謀識別模型所用數據集具有高維特性,綜合考慮模型的復雜度以及分類的準確率等因素,采用核主成分分析法結合邏輯回歸算法構建發電企業串謀識別模型。

2.1 KPCA+LR模型

邏輯回歸算法(Logistic Regression,LR)是一種假設樣本數據服從伯努利分布,利用極大似然估計和梯度下降求解的用作分類的機器學習算法,是廣義線性回歸分析模型,訓練速度快而且可解釋性強。模型使用sigmoid函數將預測范圍從實數域壓縮到(0,1)范圍之內從而提高模型的準確率,函數圖像如圖1所示,函數公式如式(6)所示:

圖1 sigmoid函數

f(x)表示樣本為類別1的概率,x為線性函數,表達式為x=wTu+b,其中,w和b均為參數矩陣,u為輸入的特征向量,樣本被預測為正例和負例的概率表達式如式(7)所示:

y有兩個取值,分別為0和1,y=1表示樣本被預測為正樣本,y=0表示樣本被預測為負樣本。為避免陷入局部最優解,邏輯回歸的損失函數采用對數損失函數,如式(8)所示:

式中,n為樣本數量。

高維特征數據增加了計算的要求,使得數據分析變得復雜,導致模型復雜度增加,易導致過擬合問題。把數據降維在一定的信息損失范圍之內能最大限度反映原始數據中的有用信息,可消除一些噪聲和誤差,并且幫助節省大量時間成本。針對這一問題,本文使用核主成分分析(Kernel Principal Component Analysis,KPCA)對數據進行降維處理。KPCA利用非線性變換將原數據映射到高維空間中進行主成分分析的數據處理,再將主成分映射回原來的空間當中,得到降維之后的數據。針對本文所提問題,考慮到數據具有高維特征,先使用KPCA對數據進行降維處理,再通過邏輯回歸算法實現發電企業的串謀行為識別,模型具體算法如下。

(1)輸入

含標簽的數據集U:

(2)輸出

二分類結果:

1)對輸入樣本進行中心化;

2)利用核函數計算核矩陣;

3)計算核矩陣的特征值和特征向量;

4)將特征向量按對應特征值從大到小排列,取前3列數據作為降維后的數據;

5)載入降維后的數據,使用sigmoid函數進行計算;

6)更新權值。

2.2 實驗分析

以中國某地區省間電力現貨市場交易數據為例進行分析,應用本文方法對其進行發電企業串謀行為識別分析,驗證本文所提出方法的有效性?;贙PCA+LR的串謀識別模型流程如圖2所示。

圖2 基于KPCA+LR的串謀識別模型流程

結合文中建立的指標體系,計算任意兩家發電企業的串謀行為識別指標數據,指標數據樣本總計3655個,部分指標數據集展示如表1所示,標簽值為1代表該樣本為串謀樣本,標簽值為0代表該樣本為正常樣本。

表1 部分指標數據集

將指標集數據進行可視化,如圖3所示。由于指標集為六維數據,普通的三維空間不能完整刻畫數據信息,所以在本研究中使用三個常規軸以及大小、形狀、顏色來可視化六維數據。前三個指標用常規軸表示,指標4用圖中散點形狀的大小衡量,數值越大則形狀越大。指標5由散點形狀表示,數值大于6則很大幾率為串謀情況,因此如果值大于6,那么散點形狀為三角形,否則散點形狀為圓形。紅色代表正常樣本,藍色代表串謀樣本。由圖3可知,原始指標數據的串謀樣本與正常樣本分布位置難以區分,且正常樣本的個數遠多于串謀樣本的個數。

圖3 原始指標數據散點圖

利用KPCA進行數據降維處理,將原始六維數據降維至三維,降維數據如圖4所示,紅色和藍色分別代表正常樣本和串謀樣本。與圖3相比,圖4中的串謀樣本和正常樣本分布位置能夠直觀判斷,發現大部分的串謀樣本集中在某一區域,與正常樣本有明顯的位置區分。

圖4 KPCA降維之后的指標數據散點圖

對降維后的指標數據集進行排序并進行劃分,70%的數據作為訓練集,30%的數據作為測試集。

接受者操作特性曲線(Receiver Operating Characteristic Curve,ROC曲線)是以假陽性率為橫軸,真陽性率為縱軸構成的坐標曲線。AUC(Area Under Curve)是指ROC曲線與橫坐標軸圍成的面積,取值范圍在0.5和1.0之間,越接近1.0,說明方法的應用價值越高。圖5為本文模型的ROC曲線圖,AUC值為0.85,可見模型的分類效果較好,有較高的應用價值。

圖5 接受者操作特性曲線

用混淆矩陣展示本文所提模型的預測效果,如表2所示,負樣本即為串謀樣本。

表2 KPCA+LR模型的混淆矩陣

準確率表示被預測為正樣本的數量與總樣本數量的比值,精確率表示真正為正類的樣本數量與模型將樣本識別為正類的樣本數量的比值,具體計算公式如式(10)和式(11):

式中,V1為正樣本被預測為正樣本的數量;V2為負樣本被預測為正樣本的數量;V3為正樣本被預測為負樣本的數量;V4為負樣本被預測為負樣本的數量。

采用一種有監督模型SVM(Support Vector Machine)與一種無監督模型LOF(Local Outlier Factor)與本文模型進行比較,如表3所示,KPCA+LR可有效檢測樣本的異常狀況。雖然LOF在訓練過程中不需要帶有標簽的數據,但是準確率和精確率遠低于本文模型,具有更高的工程實用價值。

表3 不同模型的串謀識別準確率和精確率

3 結束語

針對省間現貨市場發電企業串謀行為監測問題,本文構建了較全面的適用于中國電力市場的指標體系,提出了KPCA+LR算法。數據維度越高導致模型的復雜度越高,易導致過擬合現象,針對此問題,本研究提出使用核主成分分析方法進行數據降維處理。本文所提方法能夠基于電力交易數據實現對發電企業串謀行為的精準識別,降低市場風險,串謀行為不僅發生于發電企業之間,售電公司以及用戶也會存在一些串謀行為,針對不同主體之間的串謀行為識別問題此方法依舊適用。所提模型能夠為市場監管者提供有力的幫助,有助于電力市場的公平穩定發展。

猜你喜歡
降維發電樣本
混動成為降維打擊的實力 東風風神皓極
“發電”
檸檬亦能發電?
用樣本估計總體復習點撥
降維打擊
推動醫改的“直銷樣本”
搖晃發電小圓球
隨機微分方程的樣本Lyapunov二次型估計
摩擦發電
村企共贏的樣本
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合