?

基于雙精度神經網絡的RFID企業估值的研究

2012-07-27 08:41李樹剛
統計與決策 2012年21期
關鍵詞:支配正確率排序

丁 嵐,李樹剛

(上海交通大學機械與動力工程學院,上海 201100)

0 引言

物聯網被普遍認為將成為2008年全球金融危機之后經濟發展新的動力之一,在物聯網產業鏈中,射頻識別技術(RFID)在物聯網起步階段就有強大的市場需求,成為了市場最為關注的技術。要想實現成功的投資,正確計算目標企業的價值是關鍵。估值模型的可靠性不僅取決于總體正確率,也應該考慮各個類別的分類正確率。例如某種模型通過對大量樣本的測試驗證了它的總體正確率很高,可是對于其中一種少數情況,卻完全無法正確估值,而假設這種少數情況恰巧是一種極端風險的情況(如企業利潤大幅降低),那么這個模型的可靠性就大打折扣。而目前的估值方法往往缺少對細分情況的考慮,以凈現值方法為代表的傳統估值方法為例,其中未來自由現金流量的判斷就存在著隨意性或單一性的缺點。在預測未來現金流時,無論是以回歸模型、時間序列分析、灰色系統理論為代表的統計方法,還是以模糊方法,進化算法、神經網絡方法等為代表的人工智能方法,都是基于單目標的方法,即只針對模型的總體準確率來優化,這樣有可能忽略了某些關鍵類別的可靠性。本文提出了基于NSGAII優化神經網絡的雙精度神經網絡利潤預測模型,準確度和最小分類精度是優化的兩個目標,以此來降低估值模型的不確定性和風險性。我們提煉了28個可能影響企業利潤的關鍵因素,把這些因素作為雙精度神經網絡的輸入對企業不同年限的利潤進行預測,將預測的利潤值代入實物期權模型中進行短期,中期以及長期的估值。通過對中國RFID企業估值的仿真結果表明,改進的神經網絡能明顯提高實物期權方法估值的準確性。

1 估值系統的設計

1.1 企業估值系統結構

如圖1所示,我們設計的一個企業估值系統主要由三個模塊組成:評估因素、利潤預測和價值評估。

圖1 企業估值支持系統結構

在決策模型中,第一步就是建立評估指標體系作為系統的輸入。由于估值時需要計算企業在未來投資期內的自由現金流,因此我們將采用基于NSGA-II的雙精度神經網絡對企業未來的利潤進行預測,最后我們選擇實物期權的方法來建立企業估值模型,充分考慮了企業的資本價值和投資的機會價值。

1.2 評估因素

在企業估值過程中,對于企業財務狀況的分析是最重要的環節,然而僅僅依靠企業財務信息而不考慮宏觀經濟運行的大方向,很有可能做出危險的預測。因此我們將評估指標分為兩類:宏觀經濟指標和企業財務指標,得到了如圖2所示的指標體系,共28個指標。

2 雙精度神經網絡結構

我們考慮采用最為常用的多層感知器(MLP)神經網絡結構,網絡有3層:輸入層、隱含層、和輸出層。此外對輸出結果進行處理,得到兩個衍生層:未來利潤層和企業價值層,如圖3所示。

圖2 評估指標體系

圖3 決策支持系統網絡拓撲結構示意圖

2.1 雙精度進化目標函數

在該網絡的進化過程中,我們需要考察兩個目標:最小分類精度和總體正確率。我們希望通過NSGA-II進化方法找到能表達正確率和最小分類精度都很高的個體,因此有兩個目標函數:

S代表神經網絡對于輸入樣本的最小分類正確精度,表示各個類別分類正確的概率,A代表總體正確率,表示總體樣本分類正確的概率。以圖4為例,總體樣本40個中,甲類有30個,乙類有10個,第一種分類方法,甲類和乙類的樣本全部分在了甲類,甲類的正確率是30/30=100%,乙類的正確率是0/10=0,最小的分類精度是min(0,100%),故最小分類精度S=0,總體分類精度A=30/40=75%;第二種分類方法中,甲類中有19個分到了甲類,11個分到了乙類,故甲類的分類正確率為19/30=63.3%,同理,乙類的分類正確率是3/10=30%,故S=min(63.3%,30%)=30%,總體的正確率A=(19+3)/40=55%,

從圖4中我們也可以看出,A和S的變化并沒有表現出一致性,這兩個目標函數不存在明確的相關性,有時候還體現出相互沖突性,因此傳統的多目標轉化為單目標的方法無法有效使用。

2.2 輸入層:數據預處理

圖4 正確率和最小分類精度的示意圖

由于在我們的指標體系中,包含了28個指標,如果不加處理全部作為神經網絡的輸入,比如會是網絡結構十分復雜,而且網絡中的神經元均采用S型激勵函數,對于輸入樣本數據進行預處理變換后可防止因凈輸入的絕對值過大而使神經元輸出飽和,繼而使權值調整進入誤差曲面的平坦區。

對于維度太多的問題,我們采用主成分分析的方法來降維處理,主成分分析就是把原有的多個指標轉化成少數幾個代表性較好的綜合指標,這少數幾個指標能夠反映原來指標大部分的信息,并且各個指標之間保持獨立,避免出現重疊信息,起著降維和簡化數據結構的作用。通過主成分分析,保留98%的信息,輸入的數據變成由28個變成10個,降維效果很顯著。

接著,為了防止數據的過度不均勻,我們對這些數據進行歸一化處理,歸一化公式為:

2.3 隱含層和輸出層

設網絡有N個輸入節點,H個隱含層節點,M個輸出層節點,隱含層節點采用S型函數,每個隱含層節點的輸出為:

其中βh表示隱層節點上的偏置,WIH代表輸入層與隱含層之間的連接矩陣,X表示輸入的指標矩陣。輸出層首先按加權求和得到一個輸出fm:

其中γm表示輸出節點上的偏置,WHO代表隱含層與輸出層之間的連接矩陣,V代表隱含層的輸出矩陣。

再采用softmax函數計算樣本落入第m類的概率om,為節點的輸出:

最后樣本所在的類C(X)為輸出最大的節點所代表的類:

2.4 價值評估層:實物期權方法

我們將前一層輸出的結果表達為未來的利潤,為實物期權法計算企業價值時提供必要的參數。

從實物期權的角度出發,企業的價值評估應該包括兩個部分:資產價值和期權價值:

Va:貼現現金流(DCF)方法得到的現實資產的折現值,即資產的價值。

Vc:是未來增長機會的折現值,即期權的價值。

采用自由現金流量折現法計算目標企業的資產價值時,

其中:

Ci—第i年的凈利潤;

r—無風險利率;

S—企業目前的價值。

在我們運用實物期權原理時評估一個企業的價值時,期權價值可以看作我們擁有了在投資末期出售以更比投資初期更高價值出售這個企業的選擇權,因此我們可以采用因此Black-Scholes看漲期權模型(簡稱BS模型),S是這個企業目前的價值,X是投資末期企業的價值。

其中:

參數代表的意義和確定方法見表1。

表1 BS公式中各參數的含義和確定方法

以上可以發現,神經網絡對未來凈利潤情況的預測能幫助我們確定DCF方法中的Ci和BS公式中的X,假設企業的凈利潤全部累積,有:

綜合得到企業的估值公式為:

3 NSGA-II多目標進化算法

NSGAⅡ是帶精英策略的非支配排序遺傳算法,它是Deb等人在NSGA的基礎上加入快速非支配排序算法、引入精英策略、采用擁擠度和擁擠度比較算子,使得Pareto最優解前沿中的個體能均勻地擴展到整個Pareto域,保證了種群的多樣性。NSGA-II算法的基本思想為:首先,隨機產生規模為的初始種群,非支配排序后通過遺傳算法的選擇、交叉、變異三個基本操作得到第一代子代種群;其次,從第二代開始,將父代種群與子代種群合并,進行快速非支配排序,同時對每個非支配層中的個體進行擁擠度計算,根據非支配關系以及個體的擁擠度選取合適的個體組成新的父代種群;最后,通過遺傳算法的基本操作產生新的子代種群;依此類推,直到滿足程序結束的條件。

3.1 快速非支配排序和擁擠度算子

在快速非支配排序過程中值越小排名越優先,故實際上考慮的是:

f1=-A和f2=-S,

假設種群 P,對于 x,y∈ P,若 f1(x)≤ f1(y)且 f2(x)< f2(y),或f1(x)< f1(y)且 f2(x)≤ f2(y),則稱 x支配y。對于每個個體p都有兩個參數np和Sp,其中np為種群中支配個體p的個體數,Sp為種群中被個體p支配的個體集合。算法的

主要步驟是:

步驟1找到種群中所有np=0的個體,并保存在當前集合F1中,故集合F1中的個體沒有被任何其他的個體支配,是Pareto最優邊界;

步驟2對當前集合F1中的每個個體p,其所支配的個體集合為Sp,遍歷Sp中的每個個體p,執行np=np-1,如果np=0,則將個體p保存到集合Q中,故集合Q中的個體僅被集合F1中的個體支配,不被任何F1和Q集合外的個體支配,Q為集合F2;

步驟3重復上述操作,直到整個種群被分級。

一旦非支配集排序完成后,我們就要計算擁擠度。擁擠度是指種群中給定個體的周圍個體的密度。直觀上可表示為個體i周圍僅包含個體i本身的長方形的邊長的和。如圖5所示。

圖5 擁擠度示意圖

對于雙目標排序問題,擁擠度確定方法是:

Fi中的每個個體,邊界的兩個個體擁擠度為無窮,即:

I(d1)=I(dn)=∞

則對于其他個體利用差值法對每個目標函數進行擁擠度計算:

其中f(i±1)m表示集合中從第m維來看,與第i個個體的最相鄰的個體的目標函數m的值,分別為目標函數m的最大最小值(m=1,2)。

這樣,通過快速非支配排序以及擁擠度計算,種群中的每個個體i都有兩個屬性:非支配排序和擁擠度。利用這兩個屬性,可以區分種群中任意兩個個體的支配和非支配關系,也就是說:如果兩個個體的非支配排序不同,取排序號較小的個體(分層排序時,先被分離出來的個體);如果兩個個體在同一級,取周圍較不擁擠的個體。

3.2 染色體編碼和初始化

由于每一個染色體代表著一個參數和結構都具體的神經網絡,包括權值和偏置的大小、隱含層節點數目,連接情況等,因此染色的編碼可以視為三段。如圖6所示,第一段為參數部分的編碼,表示所有權值和偏置的大小,初始化時,輸入層與隱含層之間的參數在[-5,5]之間隨機產生,隱含層和輸出層之間的參數在[-10,10]之間隨機產生;第二段為隱層節點的編碼,“0”表示該位置節點不存在,“1”代表存在,這一段的編碼在初始化時隨機生成“0”或“1”,但“1”的個數在最小和最大節點數之間,我們設定最小節點數為3,最大節點數可以在實驗中靈活設置;第三位表示連接情況,“0”表示該位置沒有連接,“1”表示有連接,同樣初始化時每個編碼隨機生成“0”或“1”,并保證隱含層有節點的位置與前后層的連接不能全為0。

圖6 染色體編碼示意圖

3.3 突變

進化過程中的基因算子只考慮了突變沒有考慮交叉,因為已有文獻表明交叉操作在遺傳進化過程不能幫助優化神經網絡。我們考慮了五種突變的情況,一種參數突變和四種結構突變,發生的概率均為1/5,如表2所示。

表2 五種突變操作

3.4 算法設計

在我們基于NSGA-II算法優化神經網絡的研究中,學習算法可以設計如下:

(1)產生初始種群,染色體表示一個神經網絡的權值和偏置(實值)、連接和隱層節點個數(0/1)。

(2)評價初始種群,將種群中的染色體翻譯成神經網絡,計算準確率和最小分類精度。

(3)快速非支配排序法給種群排序,每個染色體得到一個排名和擁擠距離。

(4)通過錦標賽方法來挑選父代,對父代的每個個體進行突變操作,以各1/5概率發生一種參數突變四種結構突變(加/減隱層節點,加/減連接數),產生子代。

(5)評價子代,計算準確率和最小分類精度。

(6)將子代父代合并在一起用快速非支配排序法計算排名和擁擠度,截去多余的個體,保持種群數量恒定。

(7)檢查是否達到終止條件,如沒有則轉入步驟4,用新種群替代就舊種群。

從以上步驟可以看出,采用NSGA-II優化神經網絡,能得到參數、結構更合適的個體,他們在正確率和最小分類精度上都得到了提高,算法的程序框圖如圖7所示。

圖7 雙精度神經網絡算法程序框圖

4 結論

在投資者對于RFID企業進行投資時如并購、投融資、交易等,至關重要的一步就是對企業有一個可靠的價值評估,從而分析和衡量企業的公平市場價值并提供有關信息,便于投資者和管理者做出建議與決策。但是傳統的現金流預測模型沒有考慮到細分情況下的精度優化,且傳統估值方法忽略了投資機會選擇的價值,因此估值的效果受到了影響。為此本文設計了一個集成雙精度神經網絡與實物期權估值方法相結合的估值系統。與現有文獻相比,該系統的主要特色體現在:

(1)雙精度神經網絡在訓練神經網絡時,以準確度和最小分類精度為進化的目標,基于Pareto邊界法,同時對準確度和最小分類精度這兩個目標進行優化,強化了模型的抗風險性。

(2)采用實物期權方法,克服了傳統凈現值方法忽略對未來投資機會價值的缺點。

(3)在進化過程中,網絡的參數和結構同時參與到變異操作中,傳統神經網絡對于隱層節點數的確定沒有明確的規則,在雙精度神經網絡中,變異算子對每個父代個體均等的發生參數突變和結構突變,最后神經網絡在隱層節點、節點間的連接等結構設計上得到了優化。

未來的研究主要是對輸出結果的進一步優化上,本文主要是搭建了一個分類預測模型,只能給投資者一個定性的決策支持,還缺乏連續量化的手段。其次,對于已有的分類結果,仍需進一步提高精度,在實驗對比中,多值Logistic回歸模型的表現也比較優秀,未來希望吸收各種預測手段的優勢設計出一個更可靠的綜合神經網絡。

[1]中國商業電訊.物聯網風生水起將成下一風投熱點[EB、OL].http://www.prnews.cn/press_release/33424.htm,2010-03-30.

[2]馮文權.經濟預測與決策技術[M].武漢:武漢大學出版社,2008.

[3]漢克,維歇恩.商業預測[M].北京:清華大學出版社,2006.

[4]龐素琳.信用評價與股市預測模型研究及應用—統計學、神經網絡與支持向量機方法[M].科學出版社,2005.

[6]馬明,李松.基于遺傳算法優化混沌神經網絡的股票指數預測[J].商業研究,2010(11).

[7]張鴻,彥林輝.應用混合神經網絡和遺傳算法的期權價格預測模型[J].管理工程學報,2009,(1).

[8]Y.Jin,B.Sendhoff.Pareto-Based Multi Objective Machine Learning:An Overview and Case Studies[J].IEEE Trans.Syst.Man Cybern.C,Appl.Rev.,2008,38(3).

[9]Deb,Kalyanmoy,Pratap,Amrit,Agarwal,Sameer,Meyarivan,T.A Fastand ElitistMulti-ObjectiveGenetic Algorithm NSGA-II[J].IEEE Transactions on Evolutionary Computation,2002,6(2).

[10]P.J.Angeline,G.M.Saunders,J.B.Pollack.An Evolutionary Algo?rithm that Constructs Recurrent Neural Networks[J].IEEE Trans.Neural Netw.,1994,5(1).

猜你喜歡
支配正確率排序
被貧窮生活支配的恐懼
作者簡介
門診分診服務態度與正確率對護患關系的影響
恐怖排序
跟蹤導練(四)4
節日排序
基于決策空間變換最近鄰方法的Pareto支配性預測
生意
品管圈活動在提高介入手術安全核查正確率中的應用
隨心支配的清邁美食探店記
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合