?

企業社會責任與股價崩盤風險:“信息橋梁”或“信息誤區”?

2024-01-18 09:18寧,尉
福建商學院學報 2023年5期
關鍵詞:股價責任預測

李 寧,尉 昊

(蘭州財經大學 會計學院,甘肅 蘭州,730020)

一、引言

資本市場中上市公司股價崩盤現象頻發,如美國1929 年發生的股市大崩盤、日本1989 年股市的泡沫宣告破裂,國內昔日“股王”安碩信息、2016 年萬科股份公司的股價崩盤以及2020 年瑞幸咖啡股價暴跌等事件讓投資者至今談之色變,因此股價崩盤相關研究一直以來受到業界和學術界的廣泛關注。股價崩盤一方面損害投資者的利益,危害金融市場的正常運行,引發金融危機;另一方面使企業產生財務危機,不利于其穩定發展。對于股價崩盤現象的研究,不僅可以糾正投資者自身的投資決策偏誤,而且對促進企業可持續發展和國家金融穩定具有重要意義。

目前,多數學者認為造成股價崩盤的主要原因是信息不對稱,而社會責任報告是企業非財務信息的主要載體之一,其中必然存在著信息不對稱的現象。由于我國社會責任報告披露形式的相關準則不夠完善,披露質量與國際相比差距仍十分明顯,使得企業管理層有機可乘,社會責任報告成為企業進行印象管理的陣地。管理層通過選擇性披露操縱文本信息,主要體現在文本可讀性、文本語調等方面,采用過度強調“正面信息”或者過度隱匿“負面消息”等手段,提升企業聲譽以獲得或維持合法性地位,進而實現企業利潤最大化目標[1]。除此之外還發現上市公司社會責任報告所披露的信息幾乎未作調整,出現變動的僅為某些具體事件和數字,全部套用照搬的現象被稱為“克隆社會責任報告”[2],并且大部分僅是為應對證監會、國資委、上交所和深交所的規定而發布社會責任報告[3]。過度的印象管理其實質是欺詐性的[4]42,所提供的信息會誤導利益相關者的評估與決策行為,最終會造成企業股價崩盤風險增加。

為了探究社會責任披露對股價崩盤的影響,本文基于LDA 主題模型提取2010—2022 年企業社會責任報告中的文本主題指標,構建股價崩盤風險模型,探討社會責任報告文本主題指標與股價崩盤風險之間的關系,以為投資者提供更加可靠的信息,保障投資者利益;同時相比于傳統模型,采用機器學習模型對股價崩盤風險進行預測分析,克服了由于變量過多導致的多重共線性、內生性的問題,增強預測的可靠性。

二、理論分析與研究假設

(一)社會責任文本主題指標與股價崩盤風險模型

在當前經濟市場,有效的股價崩盤風險預測能夠維護國家金融市場的穩定,減少資源錯配,保持實體經濟的正常運行,對于投資者自身的風險管理也具有重要的現實意義。以往研究主要使用專業機構評級數據建立股價崩盤風險模型,但評級機構是以第三方的角度對企業進行評價,可能存在個人主觀評判。企業社會責任報告作為企業非財務信息披露的重要載體,相比于企業評級機構單純的評分分值,更能具體地反映企業履行的社會責任,其披露在一定程度上能夠減緩信息不對稱[5]。此外,企業社會責任報告段落之間的銜接、語言的表達及語調的安排都會影響信息使用者對該報告的理解。所以直接從企業社會責任報告中提取相關文本主題指標,建立股價崩盤模型,不僅可以避免第三方角度的主觀評價,彌補企業評級機構數據的缺陷,同時也能夠獲取更深層次的文本信息。因此,在單一企業評級機構數據指標的基礎上,LDA主題模型提取的文本主題指標可以提升預測股價崩盤風險的能力?;诖?,提出假設:

H1:社會責任文本主題指標能夠顯著提升股價崩盤風險模型的預測性能。

(二)社會責任信息披露與股價崩盤風險

現有的關于社會責任信息披露對股價崩盤風險的影響主要有兩種觀點:(1)企業社會責任信息披露會提升股價發生崩盤的風險;(2)企業社會責任信息披露會抑制股價發生崩盤的風險。其中,持第一種觀點的學者發現當企業的經營成果不理想時,管理層出于維護自身利益的動機會操縱文本信息,進而導致投資者的決策失誤,增加股價崩盤的風險。此外,管理層也會通過印象管理操縱社會責任報告信息,具體表現為隱匿壞消息,回避企業效益不佳等,通過向資本市場釋放好信息,以期利用各種手段來實現自身利益最大化,但壞消息的隱匿終究是紙包不住火,一旦負面消息集中釋放,最終會增大股價崩盤風險[6]。與此相反,一些學者則認為企業履行社會責任間接表明企業管理層擁有更高的倫理和道德標準,更傾向基于自身的優勢去為社會謀福利,重視本身的社會價值,其社會責任報告的披露有助于真實反映企業的社會責任履行情況,從而提高企業財務報告信息的透明度,抑制股價崩盤風險[7]。

綜上所述,企業基于自利性動機選擇性披露企業社會責任報告,即在信息披露時,管理層可以決定如何披露社會責任信息。一般體現為凸顯對自身的有利消息,而對壞消息避之不談[8],粉飾企業社會責任報告,進而使得信息使用者進入“信息誤區”。研究發現過度的印象管理,即欺詐性印象管理會增加企業額外的成本支出,降低信息的可靠性、相關性,不利于企業持久經營[4]41的同時也會導致利益相關者對企業形象識別不清,進而造成信息使用者決策偏誤,損害利益相關者的利益[9]。一旦利益相關者識別出企業釋放的虛假好信息,就會拋售股票,進而造成企業股價斷崖式下跌。與欺騙性印象管理不同,采用適度策略性印象管理有助于獲得公眾的信賴,提升企業自身形象,進而吸引投資者投入更多的資源[10],降低股價崩盤風險?;诖?,提出假設:

H2:社會責任披露信息與股價崩盤風險之間呈現“U”型關系。

三、研究設計

(一)樣本選擇與數據來源

2008 年5 月,上海證券交易所發布《關于加強上市公司社會責任承擔工作的通知》,強制性要求各上市公司定期在上海證券交易所網站披露公司的社會責任報告,使得自2009 年起上市公司披露的企業社會責任報告成倍增加。所以本文選取2010—2022年上市公司公開發布的企業社會責任報告作為樣本。其企業社會責任報告均從巨潮資訊網下載得到,社會責任文本主題指標通過LDA 主題模型提取整理所得,機構評級數據的選取來自和訊網。

(二)變量定義

1?被解釋變量

被解釋變量為股價崩盤風險,若上市公司在經營期間發生了股價崩盤,則將上市公司當期樣本的變量賦值為1,若上市公司未發生股價崩盤,則賦值為0。將股價崩盤的變量定義為Crash[11]:

其中,wi,t為第i家上市公司第t年的特定周收益率,Average(wi,t) 表示第i家公司股票第t年的特定周收益率均值,σi,t表示第i家公司股票第t年特定周收益率標準差,3?09 個標準差對應標準正態分布下0?1% 的概率區間。如果一年時間里第i家公司股票的特定周收益率滿足上式的條件,那就意味著這家公司在該年內發生了股價崩盤事件。

2.解釋變量

選取的解釋變量為文本主題指標、財務變量、和訊網評級數據指標。具體變量及含義見表1。

表1 變量定義表Tab.1 Variable definition table

(1)文本主題指標變量

使用LDA 主題模型進行社會責任主題指標的構建。LDA 主題模型是一種基于概率圖模型的文本主題分析方法,最早由Blei 等[12]在2003 年提出,旨在通過對文本數據進行分析,自動發現其隱藏的主題結構。與相對簡單的潛在變量模型相比,LDA 的優點體現在:是全概率模型,具有清楚明晰的層次結構;引入了Dirichlet 先驗參數,解決過度擬合的問題,更適合處理大批量文檔。LDA 主題模型是基于這樣的假設:文本是一個詞的集合,忽略任何語法或者順序關系。其由多個主題構成,而每個主題又是詞集的一個概率分布,是由“詞-主題-文檔”三個層次構成的概率圖模型,可以將文檔集中每篇文檔的主題以概率分布的形式給出,推測文檔的主題分布,而后便可以進行主題聚類或文本分類。同時LDA 主題模型在文本分析的基礎上考慮了詞語在語義中的上下文關系。

困惑度(Perplexity) 是一種常用的機器學習模型評估方法,通常用于評估語言模型的性能。困惑度可以理解為預測一個測試集中每個樣本發生的概率的倒數,困惑度越低,語言模型的效果越好。一致性檢驗則可以檢驗語言模型生成的每個主題所對應的高概率詞語在語義上是否一致,一致性得分越高,則表示模型效果越好。在以往的研究中選擇最優主題數常用的方法是最小困惑度法,但是基于最小困惑度法得到的最優主題數數量過多且相似,模型預測效果會變差[13]?;诖?,本文將最小困惑度與一致性檢驗相結合,選擇最優主題數。

(2)財務變量

參照荊思寒等[14]3093,將財務指標作為控制變量。選用5 個變量作為財務變量,分別是個股周收益率的標準差、個股收益偏度、當年股票月均換手率-去年股票月均換手率、凈資產收益率、總資產對數。其中,參照荊思寒等[14]3092、尉昊等[15]的研究,預測模型中的個股收益偏度采用個股過去一整年的收益偏度。

(3)和訊網評級數據指標

參考沈紅波等[16]的研究,選取和訊網評級數據指標作為控制變量。和訊網采用綜合評分體系,相比于其他評級機構,該機構評分指標更全面,包含了環境、社會、治理等方面,數據來源更加可靠;其企業社會責任評分數據來源廣泛,包括公司公開報告、第三方調查、媒體報道等多個渠道;評價方法更加科學,主觀評價和客觀評價相結合,評價結果更加客觀準確;評價結果更加透明,其評價過程和評價結果都可以被公眾查詢?;诖?,本文選取了和訊網機構的評級數據指標,分別為股東責任、社會責任、員工責任、環境責任、消費者責任、總得分。

(三)模型構建

在機器學習的有監督學習算法中,需要學習出一個能夠保持穩定,各個方面表現良好的模型,但實際情況并沒有理想中的那么良好,往往只能得到多個具有偏好的模型?;诖?,集成學習克服了單個弱監督偏好模型的缺點,將多個弱監督模型組合起來,得到一個更好更全面的強監督模型。集成學習的基本思想是即便某一個弱分類器進行了錯誤的預測,其他的弱分類器也可以進行糾正錯誤,可能某一個弱分類器無法得出所需的最優解,但是集成學習能夠得到近似解?;诩蓪W習的優勢,本文選用集成學習模型對股價崩盤風險進行預測。以往的研究常用的是滾動時間序列求平均的方法,這種方法是基于模型數據所具有的時間序列屬性,即隨著時間的變動,數據目標值會發生規律的變動。而本文所選用的上市公司的時間序列屬性不強,隨著宏觀經濟的變動以及公司內部經營的改變,企業社會責任報告每年披露數量不同,甚至大相徑庭,所以將所選樣本總體隨機打亂,以訓練集: 測試集——8:2 的比例,對股價崩盤風險進行預測。

其中,Crash 表示股票發生股價崩盤,lda 表示社會責任報告文本主題特征,shareholder 表示股東責任,social 表示社會責任,employee 表示員工責任,score 表示總得分,environment 表示環境責任,consumer 表示消費者責任,ε表示回歸殘差,j表示第j個lda 文本主題特征,i表示第i個股票,t表示第t年,k表示lda 文本主題特征個數。

(四)評價指標

1.準確率(accuarcy)

由訓練集得到樣本內預測準確率Score-Train,并將訓練模型在測試集上進行擬合,由此得到測試集樣本內預測準確率Score-Test。具體而言,預測準確率的計算方法為:

其中TP 為真正例,即實際與預測均為正例的樣本;TN 為真反例,即實際與預測均為反例的樣本;FP 為假正例,是實際與預測出現相反的結果樣本,即實際為反例,預測為正例的樣本;FN 為假反例,是實際與預測出現相反的結果樣本,即實際為正例,預測為反例的樣本。TP 與TN 統稱為預測正確的樣本,而FP 與FN 統稱為預測錯誤的樣本,預測準確率反映的就是預測正確的樣本在總樣本中所占的比例。

2.F1 分數(f1-score)

F1 分數是統計學中用來衡量二分類( 或多任務二分類)模型精確度的一種指標。它兼顧了分類模型的準確率和召回率。F1 分數可以看作是模型準確率和召回率的一種加權平均,它的最大值為1,最小值為0,值越大意味著模型越好。

查準率(precision),是指預測值為1 且真實值也為1 的樣本,在預測值為1 的所有樣本中所占的比例。具體而言,查準率的計算公式為:

召回率(recall),是指真實值為1 且預測值也為1 的樣本,在真實值為1 的所有樣本中所占的比例。具體而言,召回率的計算公式為:

F1 分 數(f1-score), 又 稱 為 平 衡F 分 數(Balanced-Score),其計算公式為:

3?kappa 系數評估方法

kappa 系數是基于一致性檢驗的指標,也可以用于衡量分類的效果。因為對于分類問題,所謂一致性就是實際與假設的結果是否一致,也就是模型預測結果和實際分類結果是否一致。kappa 系數的計算是建立在混淆矩陣基礎上的,取值為-1~1,通常大于0。

基于混淆矩陣的kappa 系數計算公式如下:

其中:

即所有類別對應的“實際與預測數量的乘積”之總和,除以“樣本總數的平方”。

四、實證分析

(一)LDA 主題模型分析

1?主題數的選擇

主題的個數越多,模型的困惑度就越低,但是,當主題數很多的時候,生成的模型往往會過擬合,所以不能單純依靠困惑度來判斷一個模型的好壞。根據困惑度的實驗結果,在合理的范圍內進行一致性實驗,最后確定效果最好的23 個主題(見圖1)。

圖1 LDA 主題模型的困惑度檢驗與一致性檢驗Fig.1 The perplexity test and consistency test of the LDA mode

2?主題詞可視化

對“最小困惑度”與“一致性檢驗”結合得出的23 個主題進行可視化,觀察主題分布情況,結果如圖2 所示。圖中每個圓圈代表一個主題,從可視化圖中可以看出每個圓圈相互獨立,互不重疊,這表示23 個主題間相互獨立,驗證了由“最小困惑度”與“一致性檢驗”結合得出的主題指標是可行的。

圖2 LDA 主題指標可視化結果Fig.2 LDA topic metrics visualization results

(二)模型選擇

為了進一步科學地選取預測股價崩盤風險的模型,通過機器學習算法中的評價指標來評估XGBoost、Gradient Boosting、CatBoost、AdaBoost、RandomForest 這五種模型。相比于股價崩盤的企業數量來說,股價不崩盤的企業數量要更多,這就產生不平衡數據,綜合準確率(accuarcy)、F1 分數(f1-score)、kappa 系數這三個指標,發現Gradient Boosting 模型在處理不平衡數據樣本分類問題上明顯優于其他模型,結果見圖3?;诖?,本文選擇Gradient Boosting 模型進行股價崩盤風險的預測。

圖3 各機器學習模型評價指標Fig.3 Evaluation metrics for each machine learning model

(三)預測結果分析

利用Gradient Boosting 模型分別實證檢驗社會責任報告信息指標、機構評級數據指標對股價崩盤風險的預測作用(見表2)。其原理是一個變量的相對重要性指的是一個變量在模型擬合過程中,相對于其他變量的重要程度。根據 Friedman[17]的思路,首先建立模型進行預測,觀察其預測結果準確度,其次在模型中加入某一變量再次進行預測,觀察其預測結果準確度,若后者預測準確度明顯高于前者,證明該變量是重要變量。

表2 非結構化社會責任報告信息指標對股價崩盤風險的預測作用Tab.2 The predictive effect of unstructured social responsibility reporting information indicators on stock price crash risk

基于此,本文在含有財務指標的模型基礎上分別加入機構評級數據指標與社會責任報告信息指標進行對比分析。在模型1 中,將機構評級數據指標放在模型中進行實證檢驗,其中總得分指標對股價崩盤風險的預測作用排名為第9。在模型2 中,將社會責任報告信息指標放在模型中進行實證檢驗,lda16 指標在社會責任報告信息指標中對股價崩盤風險的預測作用排名為第4,顯然,社會責任報告信息指標相比于社會評級機構指標,有著更好的預測能力。在模型3 數據中,將社會責任報告信息指標與機構評級數據指標同時放在一個模型中進行實證檢驗,發現lda16對股價崩盤風險的預測作用的排名要明顯高于機構評級數據指標score 的排名,而且在加入社會責任報告指標后,機構評級數據的排名也大幅下降,同時lda16 的排名較比之前也有所上升。綜上所述,在初始預測模型中加入重要變量lda16 后,其預測股價崩盤風險的結果準確度明顯提高。即lda16 是一個重要變量,它相對于模型中其他指標的重要程度更高,能夠更好地提高股價崩盤風險模型的預測準確度,進而得出社會文本主題指標對股價崩盤風險的預測能力明顯高于機構評級數據指標的結論。

上述結論出現的原因可概括為:企業評級機構數據存在個人主觀評判,不夠公允。企業社會責任報告披露內容中含有大量的非結構化信息,作為信息使用者了解企業非財務信息的主要載體,同財務信息一樣,這些非結構化信息對于公司治理做出決策也起著非常重要的作用,但是在以往的研究中,非結構化信息未得到學者以及業界的重視,在本文所做的實證檢驗中,發現加入社會文本主題指標后,提高了股價崩盤風險模型的預測性能。此結果表明社會文本主題指標能夠顯著提升股價崩盤風險模型的預測性能,印證了假設H1。

圖4 反映出總得分score 與股價崩盤風險之間的負向關系,雖然有輕微的波動,但是整體趨勢是負向影響,企業總得分越高,股價崩盤風險就越低,即企業社會責任報告披露能夠降低股價崩盤風險。這說明企業社會責任評級數據未考慮管理層會采用過度的印象管理手段,進而得出過于片面的結論。

圖4 專業機構評級數據對股價崩盤風險的預測機制Fig.4 The predicting mechanism for the risk of stock price crash by professional institutional rating data

圖5 表現出LDA 主題模型提取的重要變量lda16 與股價崩盤風險之間非線性的預測關系,即隨著lda16 文本特征數量增加到一定水平,股價崩盤風險先降低后增加,表現出“U”型關系。其理由是:在時間推進中,企業以持續經營為目標,在企業社會責任報告披露前期,適度印象管理能夠提升企業自身形象,成為企業與信息使用者的“信息橋梁”,得到投資者的信任,提升企業的市值,進而降低股價崩盤風險;隨著時間的推移,管理層印象管理行為不斷的累積,達到某一水平之上時,從而形成欺詐性印象管理。管理層通過操縱其文本主題特征,對好消息進行過度渲染,對壞消息避之不談,就會形成“信息誤區”,此時信息使用者若不能有效地避開,就會影響其做出決策,損害信息使用者的利益,進而增加股價崩盤風險。綜上印證了社會責任信息指標對股價崩盤風險之間的“U”型關系,與假設H2 相符。

圖5 社會責任主題指標對股價崩盤風險預測機制Fig.5 Social responsibility theme indicators on stock price crash risk predicting mechanism

五、結論與啟示

利用LDA 主題模型提取企業責任報告中的文本信息,構建社會責任主題指標,使用Gradient Boosting 模型進行股價崩盤風險的預測。研究發現:(1)相比于XGBoost、CatBoost、AdaBoost、RandomForest 這四種模型,Gradient Boosting 模型在處理樣本不平衡數據時優于其他模型,對股價崩盤預測效果最優。(2)相較于社會責任專業機構評級數據的評分,非結構化社會責任報告信息指標對股價崩盤的作用更顯著;在專業評級數據指標中加入社會責任報告信息指標后,股價崩盤模型預測能力顯著提高。(3)社會責任報告信息披露與股價崩盤風險之間呈現“U”型關系。

從債權人、投資者等利益相關者視角來看,由于信息的不對稱,利益相關者作為企業信息的接收方,被動接受企業披露的信息,處在信息獲取的劣勢地位。股價崩盤風險預測模型為利益相關者提供一種新型且有效的判別方式,改變了以往單純分析企業財務指標這一途徑,使其能夠通過社會責任報告文本主題指標提前預知企業發生股價崩盤的風險,在一定程度上減少信息不對稱帶來的風險,避免非必要的損失。從監管視角來看,監管機構應盡快出臺企業社會責任報告披露的相關規章制度,使企業責任報告的披露形式趨于結構化,更好地保障企業社會責任報告披露的作用。

目前來說,僅從社會責任報告中提取信息,來源比較單一,隨著機器學習方法的應用逐步走向成熟,在未來的研究中,可以為大數據挖掘提供更多獲取信息的渠道及更為有效的工具。學者可以利用機器學習技術對會計欺詐、股票市場風險溢價等進行更有效的預測。

猜你喜歡
股價責任預測
?十不該(股市)
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
使命在心 責任在肩
每個人都該承擔起自己的責任
盤中股價升跌引起持股者情緒變化
不必預測未來,只需把握現在
股價創股災以來新低的股票
期望囑托責任
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合