謝敬東,魯思薇,黃溪瀅,孫波,孫欣,陸池鑫
(1. 上海電力大學(xué),上海200082;2 國網(wǎng)上海市電力公司市南供電公司,上海200030)
中發(fā)〔2015〕9號文及其配套相關(guān)文件頒布以來,中國電力市場開始了新一輪的改革,提出要以現(xiàn)貨市場發(fā)現(xiàn)價格,建立交易品種齊全、功能完善的電力市場[1]。2020年7月,國家發(fā)展改革委、國家能源局聯(lián)合印發(fā)了《關(guān)于做好電力現(xiàn)貨市場試點連續(xù)試結(jié)算相關(guān)工作的通知》(發(fā)改辦能源規(guī)〔2020〕245號)[2],進(jìn)一步推進(jìn)電力現(xiàn)貨市場建設(shè)。隨著市場改革的不斷深入,社會各界也更加重視市場風(fēng)險防范問題。在市場交易的過程中,市場主體為了獲取高額利潤,利用市場規(guī)則漏洞濫用市場力,嚴(yán)重?fù)p害現(xiàn)貨市場發(fā)現(xiàn)價格的能力[3 - 5]。其中,串謀是濫用市場力的主要方式之一,嚴(yán)重危害了市場的有效性,因此,建立一套現(xiàn)貨市場發(fā)電企業(yè)串謀識別的辦法,對于維護(hù)電力市場的安全、穩(wěn)定、可靠運(yùn)行,具有積極意義。
目前,國內(nèi)外關(guān)于電力市場串謀行為已經(jīng)進(jìn)行了大量的研究,文獻(xiàn)[6]對發(fā)電側(cè)電力市場二級委托代理機(jī)制下發(fā)電商的串謀行為和我國電力市場規(guī)制串謀行為的法律依據(jù)進(jìn)行了研究,提出了一種負(fù)激勵機(jī)制來有效抑制串謀行為的方法。文獻(xiàn)[7]應(yīng)用委托代理理論,構(gòu)建博弈論模型,分析了發(fā)電商采用串謀行為的動機(jī)。文獻(xiàn)[8]對市場主體對于風(fēng)險的厭惡特性進(jìn)行分析,設(shè)計了一套針對中長期電量集中競價市場通過二次分配出清量來抑制市場主體串謀的方法。這些文獻(xiàn)主要采用定性分析的方法,考慮了串謀形成的因素、抑制串謀的方法,但未對串謀行為進(jìn)行識別。文獻(xiàn)[9]提出了一種基于物理潮流分析的市場力分層評價指標(biāo)體系。文獻(xiàn)[10]提出了基于模糊集理論和層次分析法的電力市場綜合評價方法。文獻(xiàn)[11]設(shè)計了一種發(fā)電商報高價的不正當(dāng)合謀競標(biāo)行為識別的綜合評判算法。這些文獻(xiàn)通過構(gòu)建評價指標(biāo),利用綜合評價評估市場中的串謀行為,但該方法不能隨著市場的發(fā)展進(jìn)行自我學(xué)習(xí)。文獻(xiàn)[12]提出基于AdaBoost-DT算法的串謀行為智能識別方法,將AdaBoost-DT集成分類算法用于串謀識別中,解決了串謀行為難以量化識別的問題;文獻(xiàn)[13]構(gòu)建基于排序多元 Logit模型的卡特爾類機(jī)組串謀識別。文獻(xiàn)[14]利用模式識別的辦法,提出基于云模型與模糊Petri網(wǎng)的電力市場濫用市場力識別方法。上述文獻(xiàn)利用有監(jiān)督的智能算法實現(xiàn)了串謀行為的自我識別和自我適應(yīng),但目前我國電力市場正處于起步階段,市場中沒有明確的串謀機(jī)組樣本,而有監(jiān)督的算法需要較多的訓(xùn)練樣本,利用少量有標(biāo)簽數(shù)據(jù)訓(xùn)練出的模型,泛化能力差,難以適用新鮮樣本。而無監(jiān)督的方法利用無標(biāo)簽數(shù)據(jù),根據(jù)建立的模型評估未知數(shù)據(jù),一旦模型建立錯誤,就會造成很大的偏差。
針對以上問題,本文考慮我國電力現(xiàn)貨市場運(yùn)營時間短、運(yùn)營模式仍處于探索時期的現(xiàn)狀,結(jié)合專家經(jīng)驗知識,提出采用半監(jiān)督支持向量機(jī)算法,同時利用有標(biāo)簽樣本和無標(biāo)簽樣本進(jìn)行訓(xùn)練,根據(jù)樣本間的內(nèi)在聯(lián)系,訓(xùn)練出更為可靠的分類器。
半監(jiān)督支持向量機(jī)作為一種半監(jiān)督方法,已經(jīng)應(yīng)用于多個領(lǐng)域。在電力領(lǐng)域,文獻(xiàn)[15]提出了一種基于半監(jiān)督支持向量機(jī)的電壓暫降源定位方法,并表明在少量標(biāo)簽數(shù)據(jù)下,該方法定位準(zhǔn)確率高,能可靠定位出各類電壓暫降源位置。文獻(xiàn)[16]提出了一種基于半監(jiān)督支持向量機(jī)的電壓暫降源識別方法,在少量標(biāo)簽數(shù)據(jù)下半監(jiān)督支持向量機(jī)比傳統(tǒng)支持向量機(jī)具有更高的識別精度。文獻(xiàn)[17]提出了一種基于模糊C均值和支持向量機(jī)的半監(jiān)督支持向量機(jī)分類算法,評估供電企業(yè)的安全性。在圖像分類領(lǐng)域,文獻(xiàn)[18]提出了一種基于均值漂移的meanS3VM圖像分類方法。文獻(xiàn)[19]提出了一種新的圖像分類方法,將基于最優(yōu)標(biāo)號和次優(yōu)標(biāo)號的主動學(xué)習(xí)和帶約束條件的自學(xué)習(xí)引入到基于支持向量機(jī)分類器的圖像分類算法中,獲得較高的準(zhǔn)確率和較好的魯棒性。文獻(xiàn)[20]提出了一種協(xié)同主動學(xué)習(xí)和半監(jiān)督學(xué)習(xí)方法用于海冰遙感圖像分類,獲得較高的分類精度。文獻(xiàn)[21]提出了基于半監(jiān)督徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)自組織臨界態(tài)辨識方法,用時少、正確率高,滿足在線辨識電力系統(tǒng)自組織臨界態(tài)的要求。
綜上所述,本文提出了一種基于半監(jiān)督支持向量機(jī)的電力現(xiàn)貨市場發(fā)電企業(yè)串謀識別方法。首先,分析現(xiàn)貨市場發(fā)電企業(yè)串謀的特點,建立串謀識別指標(biāo)體系;其次,利用Delphi法修正后的Topsis模型,對機(jī)組進(jìn)行初步判定,將機(jī)組串謀的可能性分為“高”、“中等”和“低”3種可能,構(gòu)成機(jī)組串謀識別模型的訓(xùn)練集;然后,利用訓(xùn)練集訓(xùn)練基于半監(jiān)督支持向量機(jī)的串謀識別模型,并利用訓(xùn)練好的模型對現(xiàn)貨市場中大量未知數(shù)據(jù)進(jìn)行識別;最后,將該方法應(yīng)用于某地區(qū)現(xiàn)貨市場,對方法進(jìn)行驗證。
串謀是指參與市場的主體通過主體間的協(xié)商、簽訂合同等方式,締結(jié)為一個“聯(lián)盟”,以獲得更高的利潤[22]。在電力市場中,串謀的途徑大致分為兩類,一類是通過私下簽訂合同的方式,將雙方綁定為一個利益整體。另一類是通過默契串謀,聯(lián)盟內(nèi)成員通過對市場規(guī)則以及市場成員報價行為的掌握,經(jīng)過一段時間后,形成有利于提高聯(lián)盟整體利潤的報價方式[23]。在現(xiàn)階段,現(xiàn)貨市場正處于起步,市場成員對市場規(guī)則不夠熟悉,對市場成員的報價方式也不夠了解,因此參與串謀的成員往往以等報價或者等報價變化的簡單方式進(jìn)行串謀[24]。
在現(xiàn)貨市場中,發(fā)電企業(yè)的串謀是通過其控制的發(fā)電機(jī)組進(jìn)行的,并且串謀往往是發(fā)生在兩臺或兩臺以上的機(jī)組之間的。因此,本文將兩臺機(jī)組作為一個機(jī)組對,構(gòu)建基于機(jī)組對的指標(biāo)體系,旨在通過觀察機(jī)組對的關(guān)聯(lián)性,識別機(jī)組潛在的串謀行為。同時,本文認(rèn)為當(dāng)機(jī)組a和機(jī)組b發(fā)生串謀,機(jī)組a和機(jī)組c發(fā)生串謀,則認(rèn)為機(jī)組a、機(jī)組b和機(jī)組c之間屬于同一個串謀聯(lián)盟。
串謀識別指標(biāo)體系基于系統(tǒng)性、科學(xué)性和可操作性原則,將所有指標(biāo)分為判斷報價相似性的報價相似情況指標(biāo)類、判斷報價變化同步性的報價變化同步情況指標(biāo)類,以及判斷機(jī)組參與市場結(jié)果的中標(biāo)情況指標(biāo)3大類。報價相似指標(biāo)和報價改變同步性指標(biāo)主要是考察發(fā)電機(jī)組在市場中的行為,可以反映機(jī)組是否采用相同的報價策略,即反映機(jī)組是否串通報價;中標(biāo)情況指標(biāo)用來衡量機(jī)組報價策略的成功度,通過中標(biāo)情況指標(biāo)判定機(jī)組是否串謀成功。
下面給出指標(biāo)的具體定義及其計算方式。
1.1.1 報價一致性
報價一致性指標(biāo)表示機(jī)組i和機(jī)組j的報價一致性情況,其計算方式如式(1)所示。
(1)
1.1.2 報量一致性
報量一致性指標(biāo)表示機(jī)組i和機(jī)組j的報量一致性情況,其計算方式如式(2)所示。
(2)
1.1.3 報價曲線差異度[12]
機(jī)組報價曲線差異度定義為機(jī)組i的報價曲線及機(jī)組j的報價曲線之間的陰影面積,如圖1所示。
圖1 報價曲線差異度Fig.1 Difference degree of quotation curve
機(jī)組報價曲線差異度的計算公式為:
(3)
(4)
1.2.1 報價變化一致性
機(jī)組對報價變化一致性定義為機(jī)組i和機(jī)組j報價變化的一致性,機(jī)組i的報價變化是指機(jī)組i本次申報的價格與其前一次申報的價格的差值,機(jī)組j的報價變化是指機(jī)組j本次申報的價格與其前一次申報的價格的差值,其計算公式如下。
Pc,i=[(pi,1,t-pi,1,t-1),…,(pi,h,t-pi,h,t-1),
…,(pi,H,t-pi,H,t-1)]
(5)
(6)
1.2.2 報量變化一致性
機(jī)組對報量變化一致性定義為機(jī)組i和機(jī)組j申報容量變化的一致性,機(jī)組i的報量變化是指機(jī)組i本次申報的申報容量與其前一次申報的申報容量的差值,機(jī)組j的報量變化是指機(jī)組j本次申報的申報容量與其前一次申報的申報容量的差值,其計算公式如下。
Qc,i=[(qi,1,t-qi,1,t-1),…,(qi,h,t-qi,h,t-1),
…,(qi,H,t-qi,H,t-1)]
(7)
(8)
1.2.3 報價變化曲線差異度
機(jī)組報價變化曲線差異度定義為機(jī)組i的報價變化曲線及機(jī)組j的報價變化曲線之間的陰影面積,機(jī)組報價變化曲線差異度的計算公式為:
(9)
在現(xiàn)實生活中,發(fā)電機(jī)組的發(fā)電成本是發(fā)電企業(yè)私有的,機(jī)組參與市場所獲得的利潤是不可知的,因此,本文用機(jī)組中標(biāo)率來判斷機(jī)組間串謀的可能性。
1.3.1 中標(biāo)率
機(jī)組對中標(biāo)率定義為機(jī)組i的總中標(biāo)量與總申報量的比值,其計算方式如下:
(10)
1.3.2 高價中標(biāo)率
機(jī)組高價中標(biāo)率定義為機(jī)組報高價且中標(biāo)電量占報高價的有效申報電量的比例。高價中標(biāo)率通過發(fā)電商成交情況與申報情況的比較反映發(fā)電商的競標(biāo)策略與自身實力的配合情況,用于評價發(fā)電商策略的成功率與所具有的市場力。其計算公式為:
(11)
機(jī)組動態(tài)市場份額定義為機(jī)組的中標(biāo)量占市場總中標(biāo)量的比例,其計算公式為:
(12)
通過計算機(jī)組市場份額,可以評估該機(jī)組的市場力,若該機(jī)組的市場份額過高,說明機(jī)組報價策略較為成功。
智能識別算法可以實現(xiàn)對大規(guī)模數(shù)據(jù)的快速判斷,但需要一定量的訓(xùn)練樣本。對于現(xiàn)階段的電力市場而言,并沒有足夠的串謀機(jī)組樣本來進(jìn)行模型的訓(xùn)練。因此,本文先對機(jī)組進(jìn)行初步判定,借助專家的經(jīng)驗知識,結(jié)合數(shù)據(jù)本身特點,利用上文建立的指標(biāo)體系,利用Delphi法修正后的Topsis模型,對現(xiàn)貨市場的串謀行為進(jìn)行初步判定,為下一階段模型的訓(xùn)練提供數(shù)據(jù)。文獻(xiàn)[25]使用不同的方法研究發(fā)電商串謀,但都考慮了機(jī)組通過串謀獲得超額利潤的特性,因此,參考以上文獻(xiàn),本文采用“漏斗式”分析方法,如圖2所示。首先,重點考察機(jī)組的中標(biāo)情況,并將其作為判斷機(jī)組是否串謀的重要因素,通過判斷中標(biāo)情況,對機(jī)組進(jìn)行初步劃分,當(dāng)機(jī)組中標(biāo)情況評估分值S1低于閾值W1時,認(rèn)定機(jī)組為“低串謀可能性”。然后判斷機(jī)組是否有串謀的行為動作,即考察機(jī)組報價相似情況和報價變化同步情況,對機(jī)組劃分結(jié)果進(jìn)行修正,對修正后的機(jī)組進(jìn)行再一次的劃分。
圖2 機(jī)組串謀判定整體流程Fig.2 Process of unit collusion judgment
步驟1:利用現(xiàn)貨市場數(shù)據(jù),計算相應(yīng)指標(biāo),對指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理;
步驟2:隨機(jī)選取機(jī)組對如機(jī)組i和機(jī)組j;
步驟3:判斷機(jī)組i和機(jī)組j的中標(biāo)情況,若機(jī)組i和機(jī)組j的中標(biāo)情況綜合評價結(jié)果S1低于閾值W1, 則認(rèn)為機(jī)組間有“低串謀可能性”;否則轉(zhuǎn)向步驟2;
步驟4:判斷機(jī)組i和機(jī)組j的報價相似情況和報價改變情況,利用報價相似情況和報價改變同步情況,對中標(biāo)情況的綜合評價結(jié)果進(jìn)行修正,若機(jī)組i和機(jī)組j報價相似或報價改變同步,則認(rèn)為機(jī)組i和機(jī)組j更有可能進(jìn)行串謀,應(yīng)對評價結(jié)果進(jìn)行放大,當(dāng)修正后的評價結(jié)果超過閾值W3時,則認(rèn)為機(jī)組i和機(jī)組j之間有“高串謀可能性”;當(dāng)修正后的評價結(jié)果在閾值W2之間時,則認(rèn)為機(jī)組i和機(jī)組j之間有“中等串謀可能性”;當(dāng)修正后的評價結(jié)果低于閾值W2時,則認(rèn)為機(jī)組i和機(jī)組j之間有“低串謀可能性”;
步驟5:重復(fù)步驟1至步驟4,直至所有機(jī)組對判斷完畢。
Delphi法作為一種主觀賦權(quán)方法,能夠較好適應(yīng)現(xiàn)貨市場的發(fā)展階段,其本質(zhì)上是一種反饋匿名函詢法。其大致流程為:在對所要預(yù)測的問題征得專家的意見之后,進(jìn)行整理、歸納、統(tǒng)計,再匿名反饋給各專家,再次征求意見,再集中,再反饋,直至得到一致的意見。
Topsis(優(yōu)劣距離法)是常用的綜合評價方法,能充分利用原始數(shù)據(jù)的信息,精確反映各個評價方案之間的優(yōu)劣。其基本思路是,在一個評價方案的集合中,分別找出一個最優(yōu)解(每個屬性值都是該屬性的最優(yōu)值)和最劣解(每個屬性值都是該屬性的最差值),并將評價方案集合中的每一個方案與最優(yōu)解、最劣解的距離進(jìn)行比較,既靠近最優(yōu)解又遠(yuǎn)離最劣解的方案,就是方案集中的最優(yōu)方案。
在利用Topsis模型進(jìn)行評價的過程中,引入Delphi法確定的主觀權(quán)重,具體步驟如下。
經(jīng)過正規(guī)手術(shù)及合理的治療后,兒童及青少年甲狀腺癌預(yù)后良好,治療后長期生存率很高,分化型甲狀腺癌長期生存率超過90%;甲狀腺髓樣癌的5年和15年生存率均超過85%。但與成人相比,其復(fù)發(fā)比例仍較高,可達(dá)10%~35%[28-29],故定期的隨訪很重要,包括超聲以及檢測血清Tg水平,超聲隨訪方案為初次手術(shù)后至少6個月內(nèi)需進(jìn)行頸部超聲檢查,之后每6~12個月復(fù)查1次[5]。
步驟1:對于歸一化后的指標(biāo)進(jìn)行正向化處理。
步驟2:利用專家打分法確定指標(biāo)權(quán)重,m個指標(biāo)的權(quán)重分別為{α1,…,αm}。
步驟3:構(gòu)造加權(quán)矩陣如下。
(13)
式中znm為第n個機(jī)組對的第m個指標(biāo)。
步驟4:尋找最優(yōu)解z+和最劣解z-如下。
(14)
步驟5:求解每個方案到最優(yōu)解解z+和最劣解z-的距離。
(15)
步驟6: 求解每個方案與最優(yōu)解相對接近程度。
(16)
式中:Ci為第i個評價方案與最優(yōu)解的相對接近程度,Ci越大,表明評價對象越接近最優(yōu)值。
根據(jù)2.1節(jié)內(nèi)容,先利用2.2節(jié)的Topsis模型求得中標(biāo)情況的綜合評價結(jié)果S1, 對于S1大于W1的機(jī)組進(jìn)行下一步判斷。在S1的基礎(chǔ)上,結(jié)合報價相似情況和報價變化同步情況的綜合評價結(jié)果得到S2, 計算公式如式(17)所示。
S2=S1×eγ+θ-1
(17)
式中:γ為報價相似和報價變化同步情況綜合評價結(jié)果的歸一化值;θ為縮放因子,可以根據(jù)電力市場實際運(yùn)行情況取值,當(dāng)縮放因子取值較大時,對S1的放大程度越大,反之越小。
表1 某地區(qū)現(xiàn)貨市場報價數(shù)據(jù)Tab.1 Quotation data of spot market in a region
由第2節(jié)可以得到初步判定的串謀機(jī)組,利用初步判定的串謀機(jī)組進(jìn)行模型的訓(xùn)練。
支持向量機(jī)是一種二分類模型,它的目的是尋找一個平面對樣本進(jìn)行分割。設(shè)有標(biāo)記的樣本數(shù)據(jù)為{(xi,yi)},i=1,2,…,N, 其中xi∈RP為特征數(shù)據(jù)集,yi∈{-1,1}為類別標(biāo)簽。SVM的判別模型為:
f(X)=sign(ωTX+b)
(18)
式中:ω和b為系數(shù)向量。
設(shè)最優(yōu)分界面為ωTx+b=0, SVM的目標(biāo)是求解其最優(yōu)解,求解問題最終可以轉(zhuǎn)化為式(19)的帶約束的凸二次規(guī)劃問題。
(19)
式中:ξi=1-yi(ωTxi+b)為損失函數(shù);C為懲罰參數(shù),C越大表示對錯誤分類的懲罰越大,C越小表示對錯誤分類的懲罰越小。根據(jù)凸優(yōu)化理論,借助拉格朗日乘子將約束問題轉(zhuǎn)換為無約束問題。
βi≥0,μi≥0
(20)
式中β、μ為拉格朗日乘子。
根據(jù)拉格朗日對偶原理,將式(20)化為其對偶問題。
(21)
解式(21)求優(yōu)化函數(shù)對ω,b,ξ的極小值,令:
(22)
代入拉格朗日函數(shù)中,可以得到:
(23)
則問題最終轉(zhuǎn)化為:
(24)
基于半監(jiān)督支持向量機(jī)的串謀識別模型訓(xùn)練集由有標(biāo)簽機(jī)組樣本和無標(biāo)簽機(jī)組樣本組成,兩者符合獨(dú)立同分布的假設(shè),有標(biāo)簽機(jī)組樣本集為:
(25)
無標(biāo)簽機(jī)組樣本集為:
Unlab={xN+1,xN+2,…,xN+M},xi∈RP
(26)
則基于半監(jiān)督支持向量機(jī)串謀識別模型的求解問題為:
s.t.yi(ωTxi+b)≥1-ξi,i=1,2,…,N
(27)
半監(jiān)督支持向量機(jī)的求解是從無標(biāo)記機(jī)組樣本中,找到使分類超平面的分類間隔最大的標(biāo)記,作為無標(biāo)記機(jī)組樣本的最終標(biāo)記。該方法可以得到全局最優(yōu)解,具有較好的性能。
本文采用某地區(qū)現(xiàn)貨市場報價數(shù)據(jù),選取其中166臺發(fā)電機(jī)組,共計13 695條樣本。在該地區(qū)現(xiàn)貨市場中,采用十段報價形式,參與市場的機(jī)組在日前市場中申報一組價格,同時用于日前市場出清和實時各時段的出清,部分機(jī)組報價數(shù)據(jù)表1所示。串謀機(jī)組的初步判定針對指標(biāo)權(quán)重問題,詢問3位專家,對專家的反饋意見進(jìn)行整理、歸納、統(tǒng)計;然后匿名反饋給專家,再次征求意見,直至意見統(tǒng)一,確定的最終權(quán)重如表2和表3所示。
表2 中標(biāo)情況指標(biāo)權(quán)重Tab.2 Index weights of bidding situation
表3 報價相似和報價變化同步情況指標(biāo)權(quán)重Tab.3 Index weights of similar quotation and synchronous quotation change
表4 中標(biāo)情況評估的最優(yōu)最劣方案Tab.4 The best and worst cases of bid winning
圖3 不同θ下,修正前后結(jié)果對比Fig.3 Comparison of results before and after correction under different θ
由計算得到的串謀識別指標(biāo)體系,分別對各項指標(biāo)進(jìn)行同向化處理,將所有指標(biāo)轉(zhuǎn)化為極大型指標(biāo),然后進(jìn)行標(biāo)準(zhǔn)化處理,可以得到如表4所示的最優(yōu)最劣方案。
根據(jù)最優(yōu)和最劣方案計算相對接近度,得到最終的評估結(jié)果S1, 同理,可以得到報價相似和報價變化同步情況的綜合評價結(jié)果S′2, 利用式(17)對S1的值進(jìn)行修正,即利用報價相似和報價變化同步情況對S1值進(jìn)行縮放,對于報價相似性高和報價變化同步性也高的,通過修正,放大S1的值;對于報價相似性低和報價變化同步性也低的機(jī)組,縮小S1的值,最終得到S2的值,再次對機(jī)組進(jìn)行劃分。10臺機(jī)組對在不同的縮放因子θ下,修正前后的對比如圖3所示。
由圖3中,機(jī)組對1和機(jī)組對2可以看出,當(dāng)S1的值較小,S′2值較大時,通過修正,最終的S2值變大,即當(dāng)機(jī)組中標(biāo)情況評價結(jié)果較低,報價相似和報價變化同步情況評價較高時,最終的評價分值也會變高,此時修正前的分值小于修正后的分值,且θ值越大修正后的評價分值越高;由機(jī)組對7和機(jī)組對8可以看出,當(dāng)S1的值較大,S′2值較小時,通過修正(θ取值合適,例如上圖中的θ=0.5),最終的S2值變小,即當(dāng)機(jī)組中標(biāo)情況評價結(jié)果較高,報價相似和報價變化同步情況評價較低,且θ取值合適時,最終的評價分值也會變低。
最后,通過對串謀機(jī)組的初步判定,“高串謀可能性”的機(jī)組樣本共有1 068條樣本,“中等串謀可能性”的機(jī)組樣本共有1 515條樣本,“低串謀可能性”的樣本共有11 112條樣本,如圖4所示。
圖4 樣本分類Fig.4 Sample classification
為了驗證半監(jiān)督支持向量機(jī)在串謀識別中的有效性。本文將所有樣本分為兩類,強(qiáng)串謀機(jī)組樣本作為正樣本,較強(qiáng)串謀機(jī)組樣本和無串謀機(jī)組樣本作為負(fù)樣本,由于正負(fù)樣本數(shù)相差巨大,嚴(yán)重影響識別的精度,且本文的目的是正確識別強(qiáng)串謀機(jī)組樣本即正確識別正樣本,因此對負(fù)樣本進(jìn)行隨機(jī)分組,分為10組,每組有負(fù)樣本1 263條,將正樣本分別和10組負(fù)樣本進(jìn)行組合,構(gòu)成10個包含正負(fù)樣本的樣本集。
本文采用準(zhǔn)確率、召回率及F-Measure對串謀識別模型進(jìn)行評價,準(zhǔn)確率表示所有被識別為正樣本的樣本中,真正的正樣本的比率;召回率是指所有正樣本中被識別為正樣本的比率;F-Measure是對準(zhǔn)確率與召回率的一個綜合指標(biāo),3個評價指標(biāo)的計算公式如下。
(28)
(29)
(30)
式中:Rpre為識別模型的準(zhǔn)確率,準(zhǔn)確率越大,被評價模型越好;Rrec為識別模型的召回率,召回率越大,被評價模型越好;F為識別模型的F-Measure,越接近于1越好;QTP為被正確識別的正樣本數(shù)量;QFP表示被識別成正樣本的負(fù)樣本數(shù)量;QFN為被識別為負(fù)樣本的正樣本數(shù)量。
不斷改變有標(biāo)簽樣本數(shù)據(jù)的占比,用綜合指標(biāo)F評價來評價模型,對10個樣本集分別進(jìn)行測試,10組數(shù)據(jù)分別訓(xùn)練模型得出的機(jī)組串謀識別結(jié)果統(tǒng)計如表5所示。
表5 機(jī)組串謀識別結(jié)果統(tǒng)計Tab.5 Statistics of unit collusion identification results
由表5可以看出,在10組樣本集進(jìn)行模型訓(xùn)練中,基于半監(jiān)督支持向量機(jī)的串謀識別模型的識別效果明顯優(yōu)于基于支持向量機(jī)的串謀識別模型。
表6 半監(jiān)督支持向量機(jī)模型的識別結(jié)果Tab.6 Recognition results of semi supervised SVM model
圖5為有標(biāo)簽數(shù)據(jù)占比不同的模型結(jié)果。由圖5可以看出,隨著有標(biāo)簽數(shù)據(jù)樣本的增多,模型的F值越近于1,模型越好。但當(dāng)有標(biāo)簽數(shù)據(jù)占比超過30%,模型的F值增加速度變慢,并趨于穩(wěn)定。因此,本文采用30%的數(shù)據(jù)為有標(biāo)簽數(shù)據(jù)來進(jìn)行模型訓(xùn)練。
圖5 有標(biāo)簽數(shù)據(jù)占比不同的模型結(jié)果Fig.5 Model results with different proportion of labeled data
對于每一個包含正負(fù)樣本的樣本集,其中30%為測試集,30%為有標(biāo)簽的樣本,40%為無標(biāo)簽的樣本,進(jìn)行模型的訓(xùn)練。并且將本文的半監(jiān)督支持向量機(jī)方法和傳統(tǒng)支持向量機(jī)方法進(jìn)行對比,其中第1組樣本集的結(jié)果展示如圖6所示。所有10組樣本集訓(xùn)練的模型效果統(tǒng)計如表6所示。
表6對于市場中大量的未知數(shù)據(jù),利用訓(xùn)練完成的模型進(jìn)行識別,識別出“高串謀可能性”機(jī)組。由表6可以看出,機(jī)組對1的中標(biāo)率為1,說明其百分百中標(biāo),且其報價和報價變化均較為相似;機(jī)組對2中標(biāo)率較大,且高價中標(biāo)率指標(biāo)大,報價和報價變化均較為相似;機(jī)組對5雖然其中標(biāo)率和高價中標(biāo)率指標(biāo)較低,但其報價和報價變化非常相似,通過評估分值修正后,依然能夠達(dá)到較高的分值,以上機(jī)組被識別出,驗證了半監(jiān)督支持向量機(jī)模型的正確性。
本文在分析現(xiàn)貨市場機(jī)組串謀特點的基礎(chǔ)上,構(gòu)建了新的機(jī)組對串謀識別指標(biāo)體系。并根據(jù)機(jī)組串謀特征,將機(jī)組串謀狀態(tài)進(jìn)行分類。在電力現(xiàn)貨市場無串謀機(jī)組樣本的情況下,利用Delphi法修正后的Topsis模型,對機(jī)組進(jìn)行初步判別,形成模型的訓(xùn)練集,然后提出了基于半監(jiān)督支持向量機(jī)的串謀識別模型,經(jīng)實例計算證明,該方法對現(xiàn)貨市場串謀機(jī)組的識別有較高的準(zhǔn)確性。得到如下結(jié)論。
1)本文對現(xiàn)貨市場串謀機(jī)組的初步判定,是出于構(gòu)建訓(xùn)練集的目的。在判定的過程中,考慮了專家經(jīng)驗,只適用于現(xiàn)貨市場建設(shè)初期,串謀機(jī)組樣本缺少的情況。當(dāng)市場運(yùn)營發(fā)展過程中發(fā)現(xiàn)了明確的串謀機(jī)組,就可利用市場中明確發(fā)現(xiàn)的機(jī)組作為訓(xùn)練集。
2)綜合考慮現(xiàn)貨市場機(jī)組串謀特征以及串謀識別指標(biāo)體系,將機(jī)組串謀狀態(tài)分為“強(qiáng)串謀”狀態(tài)、“較強(qiáng)串謀”狀態(tài)和“無串謀”狀態(tài),有助于串謀機(jī)組的快速識別。
3)基于半監(jiān)督支持向量機(jī)的串謀識別模型同時利用市場中的有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練,提高了串謀識別的準(zhǔn)確率,有助于防范現(xiàn)貨市場機(jī)組間的串謀行為。