?

投資者日度情緒、超額收益率與市場流動性
——基于DCC-GARCH模型的時變相關性研究

2019-09-16 08:13尹海員吳興穎
關鍵詞:時變流動性收益率

尹海員,吳興穎

(陜西師范大學 國際商學院,陜西 西安 710119)

基于有效市場假說的標準金融理論認為,理性套利者的存在會迫使非理性的噪聲交易者退出市場,所以長期來看噪音交易者不會影響市場定價。然而眾多金融市場異象表明,人的認知偏差和情緒等因素會影響投資者在股票市場的決策行為。投資者情緒是指投資者對未來投資風險和現金流的樂觀或悲觀態度[1],越來越多的研究證明,投資者情緒是股價波動的重要影響因素[2]?,F有文獻中涉及到的投資者情緒指標一般分為三類:直接指數、間接指數和復合指數,直接指數是指通過對投資者的直接調查得到的情緒指數,它雖是投資者對股市未來看法的直接反饋,但難免存在被調查者“知行不一”的現象,而且部分調查者可能會因從眾心理隱瞞真實情感。間接指數是通過采集市場真實交易數據來衡量投資者情緒的指數,它雖較直接指標更具客觀性,但由于指標的單一性,難以避免以偏概全之嫌。Baker和Wurgler[3]1655-1659發展了一種復合指數的提取方法,利用多種主觀和客觀指標進行主成分分析,并消除宏觀經濟變量的影響,構造出投資者情緒復合指數。后續研究文獻大多借鑒其方法構建投資者情緒指標來研究其對股票市場運行的影響,盡管選用源指標和數據處理過程各有不同。

互聯網時代背景下,Twitter、微博、微信、論壇、股吧等新型媒介不斷涌現,深刻影響著投資者的決策心理及行為,進而影響股票市場運行。一方面,由于互聯網的匿名性,投資者更加傾向于表達內心真實情感,發布對股市未來走勢的真實看法;另一方面,信息通過不同渠道的分享、轉發等功能得以快速傳播,投資者能及時掌握海量信息資源,并且可以交互影響。投資者不再單純的是信息的被動接受者,還能通過發帖、留言等方式發布自己的觀點和想法,這從根本上改變了股票市場的信息結構。這些網絡信息一般不會在市場交易數據中得到反映,卻蘊含著對市場運行有顯著解釋力的有效信息?;谏缃幻襟w文本信息挖掘技術研究投資者情緒已逐漸成為當前股票市場研究中的一個熱點領域,許多研究開始利用網絡媒體如網絡新聞、論壇等挖掘投資者情緒,并探討其對股票收益的影響[4][5]183[6]100。

在對股票市場的預測方面,多數學者僅從靜態角度分析了投資者情緒對股票收益或流動性的解釋作用,卻少有提及投資者情緒對股票市場的動態溢出效應。以此為切入點,本文首先利用文本挖掘技術獲取能反映投資者意見表達的文本信息,再對其進行情感分析,獲得直接測度投資者情緒的日度數據,并結合DCC-GARCH模型從動態角度分析投資者情緒與市場超額收益率和流動性的時變相關性關系。

一、相關研究評述

現有文獻涉及到投資者情緒度量常用的3種指數中,直接指數如國外的個體投資者協會指數,國內的央視看盤指數、好淡指數等,均是通過收集投資者對未來股市行情的看漲/跌的數據進行整理獲得。間接指數是指通過采集市場上公布的真實交易數據來衡量投資者情緒的情緒指數,如封閉式基金折價、IPO發行量及首日收益等。鑒于單一投資者情緒指標難免存在以偏概全、代表性不足的缺陷,基于主成分分析提取多個情緒代理變量的共同部分的復合指標應運而生,以Baker和Wurgler[3]1655-1659為代表,利用交易量、封閉式基金折價、IPO數量及上市首日收益、股利溢價等變量進行主成分分析得到初始情緒指標,再剔除宏觀經濟變量影響效應,得到投資者情緒的復合指數,目前在研究中得到廣泛認可。但BW指數仍存在兩點不足:其一,仍然是利用交易數據從側面衡量情緒,在選取基礎指標時可能遺漏其他關鍵的源指標;其二,在數據的時間頻率上仍有改進空間,比如易志高等[7]就指出眾多研究文獻中BW情緒指數等均為年度或月度指標,但是對中國這種新興資本市場來說,構建頻率更高的情緒指標更能準確有效地刻畫投資者情緒狀態。

在網絡信息時代,各類社交平臺上的文本內容蘊含著以往交易數據中捕捉不到的投資者情緒信息。Wysocki[8]最早開始研究網絡論壇信息與股票市場的相關性,選取美國紐交所上市的50家樣本公司,發現網絡論壇上相關公司的討論發帖數量能預測次日該股票的成交數量和收益狀況。Das和Chen[9]通過挖網絡論壇上信息數據,發現論壇中的內容與資產收益水平的關聯性十分顯著。Zhang等[10]研究表明社交媒體用戶悲觀情緒會導致股價在短期內下跌。Bollen和Mao[11]比較分析了傳統投資者情緒度量指標和社交媒體預測證券市場的能力,發現從社交媒體中提取出來的情緒指標能更好地預測市場波動。國內學者近幾年在這方面也做了大量的研究,劉穎等[12]利用網絡關鍵詞搜索量數據,將其合成為股民行動指數、市場行情指數、宏觀形勢指數,利用格蘭杰因果檢驗研究網絡搜索對股票市場的預測能力,發現搜索指數可預測上證指數年度收益率。林振興[13]收集東方財富網股吧的投資者發帖信息,從樂觀情緒、意見分歧和關注度這三個方面構建指標,發現投資者關注度與IPO溢價率有較強的相關性,而樂觀情緒和意見分歧與IPO溢價率無顯著相關性。類似的,孟雪井等[14]利用百度搜索指數數據衡量投資者情緒,發現中國股票市場中,情緒與市場指數之間存在聯動機制。楊曉蘭等[15]147利用股吧發帖數據的文本信息和IP地址分別構建投資者情緒指數、本地關注指數,研究投資者對本地股票的過度關注對股票成交量和股價產生的影響,結果發現當投資者情緒低迷時,本地偏好與情緒的共同作用會使本地股票加速下跌。易洪波和歐云[16]根據網絡論壇發帖內容,構建投資者多、空情緒的關鍵詞詞典,分別對投資者情緒與股票市場收益率、成交量的關系分析結果表明市場收益率會受看多情緒的影響。段江嬌等[5]185以上證A股公司的股吧發帖信息為研究對象,利用文本分析提取帖子情緒,發現論壇情緒會顯著正向影響股票當日收益率,論壇發帖數會顯著正向影響當日股價波動,顯著負向影響股票未來兩日收益率。鐘慧波等[6]100以和訊網、中國證券網等三種不同類型的財經網站的新聞帖為對象,研究媒體新聞對滬深300股價波動的影響,發現新聞的信息強度主要影響投資者關注度,新聞語義則會渲染投資者情緒傾向。

總的來說,國內外學者已經開始基于文本挖掘構建情緒指數,并對未來經濟狀況、股票市場運行進行預測。然而在對網絡數據有效信息的提取上,多數學者關注的是能對證券市場活躍度產生影響的數量指標,如上文提到的關鍵詞搜索量、百度搜索指數、股吧發帖數等,數量指標在反映投資者對股票收益的關注程度上有其可行性,但難以衡量投資者情緒傾向的深層次信息,而從文本語義的角度研究投資者情緒效應仍處于探索階段。

現在多數研究都認為,投資者情緒對股票收益存在預測能力。Long等[17]、Fisher和Statman[18]都發現,情緒是影響股票超額收益率的系統性因子,并且與短期股票投資回報成正相關,與長期投資回報呈負相關關系。金秀和鄒吉娥[19]利用線性和非線性格蘭杰因果檢驗,研究了情緒與股票收益的關系,發現投資者情緒與股票收益間的線性因果關系是單向的,而非線性因果關系是雙向的。陸靜和周媛[20]采用證券投資基金的損失率作為投資者情緒指數的代理變量,據此研究了其對中國A、H股交叉上市公司股票價格的影響。發現投資者情緒對同期A股市場和H股市場都具有顯著正向影響,情緒對A股和H股市場分別在未來12月和6月的收益率具有顯著的反轉預測。此外有學者在投資者情緒種類和時間維度上做了進一步研究,比如Chung[21]發現情緒在經濟擴張期的預測能力顯著,在經濟衰退期不顯著。董孝伍等[22]基于分位數回歸研究了情緒與股票收益間的互動關系,結果發現滯后的市場收益在短期內會對投資者情緒產生沖擊,中長期來看情緒又會影響市場收益。陸江川和陳軍[23]也研究了極端情緒對股票收益的影響,發現無論長期還是短期,極端悲觀情緒都會影響股價指數,但極端樂觀情緒對股價指數無明顯影響。

與總體效應的研究相比,對于情緒的橫截面效應的研究相對較少,但也有一些研究認為,投資者情緒對不同規模、行業的股票收益率的溢出效應存在差異。比如張婷等[24]比較了中國內地、香港和臺灣地區的情緒溢價效應,結果發現投資者情緒對三大股票市場的價值溢價均具有預測能力,但預測效果存在差異。王春[25]基于股票市值對樣本分組,利用GARCH-M模型研究情緒對股票收益的影響,結果發現投資者情緒與股票市場收益之間存在正向反饋作用,大市值股票組合的收益與所受投資者情緒影響程度呈正相關,小市值股票組合的收益情況與之相反。

投資者情緒與股票流動性的聯動關系方面,李春紅和彭光裕[26]基于格蘭杰因果檢驗研究了投資者情緒、股票市場流動性和經濟增長三者間的關系,發現投資者情緒是股票流動性的格蘭杰原因。王丹楓和梁丹[27]發現B股市場向境內居民開放后,投資者情緒變化會增加市場流動性,對股票預期收益的流動性溢價的影響效應也會較開放前的顯著。劉曉星等[28]基于投資者情緒、賣空約束和信息認知研究了投資者行為對股票市場流動性的影響機制,發現在中國股票市場中,投資者情緒會正向影響市場流動性。尹海員[29]研究了投資者情緒對股票流動性的影響機理,發現投資者情緒能單向顯著影響股票流動性,且市值規模差異會增大這一影響效應,賣空機制會反向抑制投資者情緒對流動性的影響效應。

利用不同方法從靜態視角研究投資者情緒與股票超額收益率的文獻近幾年不斷涌現,但靜態方法只能描述樣本總體在均值上的相關程度,無法敏銳的捕捉時間序列間在不同時間段的相關程度。Engle[30]339-343提出的動態條件相關多元GARCH模型(DCC-GARCH模型)為研究時間序列的時變效應提供了很好的技術手段,眾多學者開始基于此模型從靜態視角轉為動態視角研究不同市場間的聯動性。董秀良等[31]利用DCCMGARCH模型分析了中國滬深A、B股市場之間的動態相關性,發現滬深兩市A、B股之間總體上的相關系數為正并具有明顯的時變特征。賈凱威等[32]基于VAR-DCC-GARCH模型研究了中國大陸股市與亞洲其他股市的時變協動性,結果發現中國大陸股市與亞洲發達經濟體如日本、香港等存在顯著的金融傳染效應且具有持續性。除此之外,也有學者將DCC-GARCH模型靈活的運用到其他變量間動態關系的研究中,比如劉偉江和李映橋[33]研究了通貨膨脹率、政府支出、消費者信心指數與經濟增長的動態相關性??梢钥闯?,以上文獻大多利用收益率數據從不同角度分析各金融市場的動態相關性,且得出相近的結論,即金融市場間的相關性并非一成不變的常數,而是在不同的發展階段強度不同。

二、研究設計

(一)樣本選擇與數據來源

1.原始文本數據的抓取與處理

本文選取中國主流金融財經類網站:新浪財經旗下頻道“大盤評述”資訊為研究對象。新浪財經作為財經類專業網站,以其信息及時全面、分析獨到的風格服務于金融從業者。網站中涵蓋的大盤評述內容具有代表性,且保留的信息齊全,提高了信息挖掘的可操作性。本文利用爬蟲軟件從新浪財經網的“大盤評述”中挖掘評述資訊的文本信息,并通過情感分析方法構建投資者情緒指數。樣本區間為2009年4月1日—2018年4月1日,有效日度觀測值2 198個,具體處理過程包括:(1)利用爬蟲軟件挖掘“大盤綜述”的文本數據,初步獲得216 410條文本信息,每條信息中都附帶發布時間、標題等信息。(2)對文本內容進行初步的清洗,比如剔除重復內容、去除無效的外部鏈接、去除雜亂符號,將標點符號變為空格,將情感符號改變為文字等,初步導出文本數據154 341條??紤]到“大盤評述”可能包含少量上證指數之外的內容,在Python語言中導入jieba,對所有文本內容進行分詞,再導入collections模塊的counter類,跟蹤統計各單詞或雙詞出現的次數,在剔除停用詞如“的”“了”之后得到排名前1 000的詞匯,圖1具體展示了前50個關鍵詞。(3)識別出與大盤無關的關鍵詞,利用這些詞匯篩選并剔除無關的文本信息共8 738條,剔除周末、節假日的文本樣本,最終獲得有效的大盤評述數據累計141 770條。

2.文本數據的情緒量化

圖1 新浪財經“大鑫評述”前50個關鍵詞

利用Python語言編寫文本分析程序,量化大盤評述中蘊含的情緒傾向,具體步驟為:選取SnowNLP中自帶的語料庫、中國知網(Hownet)情感詞典和臺灣大學簡體中文情感極性詞典(NTSUSD)作為基礎情感詞典語料庫。將SnowNLP中的 positive(negative)詞典、知網 (Hownet) 和 NTSUSD 的 正(負)面評價詞語、正(負)面情感詞語詞典的積極與消極詞匯分別消重后進行組合,由此獲得訓練數據。接著,對這些數據集中加以訓練,并利用詞庫匹配法對所有樣本數據逐條進行量化處理,獲得取值區間為[0,1]情緒值。由于部分文本內容中沒有情感詞匯,這會導致少量分類結果中含有情緒值為0.5的中性類別的量化結果,針對中性類別的內容,利用Python編寫程序,安裝jieba并在Python中導入NLTK資料庫,對這些內容進行分詞后,跟蹤統計排名前1 000的單詞和雙詞,把單詞和雙詞一起作為特征,重新構建訓練需要的數據格式,為積極文本賦予“pos”,為消極文本賦予“neg”,形成一個新字典,再次利用SnowNLP將這些原始信息重新進行劃分。本文最終獲得94 726個樂觀文本和47 044個悲觀文本。圖2展示了“大盤評述”文本內容的獲取和處理流程。

圖2 “大盤評述”數據處理流程

3.市場運行數據來源

實證分析中涉及的市場超額收益率、市場流動性數據、宏觀經濟變量數據均來源于萬德(WIND)金融數據庫,為確保數據的準確性,對這些市場交易數據又通過瑞思金融數據庫以及國家統計局網站進行了分批核實。

(二)變量指標設計

1.投資者情緒

投資者情緒是本文核心解釋變量,借鑒楊曉蘭等[15]148的思路,基于量化得到的當日樂觀/悲觀帖子數構建投資者日度情緒指數,所得情緒值介于(0,0.5]之間的視為悲觀帖子,情緒值介于(0.5,1]的視為樂觀帖子。上證綜指第t日的投資者情緒為

其中,post代表第t日的樂觀帖子數;negt代表悲觀帖子數??梢钥闯?,當第t日的樂觀與悲觀帖數相等時,投資者情緒保持中立;樂觀貼數大于悲觀帖數時,投資者情緒值大于0,反之小于0。

2.市場超額收益率

市場超額收益率指股票市場指數收益率與無風險收益率之差,即風險溢價

其中,rt代表上證指數第t日的超額收益率;Rt代表上證指數的對數收益率;Pt、Pt-1分別為上證指數第t日和t-1日的收盤價;Rf代表無風險收益率,選取SHIBOR隔夜利率的1/360作為日度無風險利率。

3.市場流動性

現有流動性水平衡量有多種方法,比如換手率、買賣價差等。張崢等[34]分析了多種指標和衡量思路的相關性和適用性,證明了在不易獲取收盤時買賣差價數據時,Amihud[35]非流動性測度指標是一個不錯的指標,它不僅能夠把握交易成本維度,還能較為準確地反映價格沖擊的維度,并且數據的可得性較好。本文選取Amihud非流動性指標來衡量股票流動性水平,計算公式為

其中,$VOLt代表上證指數在第t日交易金額;Rt代表上證指數在第t日收益率;Illiqt代表上證指數在第t日的非流動性水平,Illiqt值越大代表市場流動性越小。

(三)DCC-GARCH 模型

為充分提取資產收益率的波動集聚特征,Engel[36]最早提出了自回歸條件異方差(ARCH)模型,由于其在使用過程中需要估計的參數較多,Bollerslev[37]在ARCH模型的基礎上直接引入了殘差平方的滯后項作為被解釋變量的影響因子,提出了廣義自回歸條件異方差GARCH模型。GARCH模型在波動率建模方面起到了重要作用,但其缺陷在于只能描述單一資產的波動率特征,不能反映不同資產波動率的相關關系。為此許多學者在模型的擴展上做出了探索,提出了對角VECH、CCC-GARCH等,各有優缺點。比如對角VECH不能全面刻畫波動率特征,CCC-GARCH忽略了序列之間相關系數的時變性特征。為了進一步彌補這些不足,Engle[30]339-343提出了DCC-GARCH模型,又稱為動態條件相關多元GARCH模型,它能夠很好地描述多個時間序列間的動態相關性。 假設 rt=(r1,t,r2,t,…,rk,t)是 k 個金融時間序列,DCC-GARCH 方程可由式(5)~式(8)得出

式(4)為單變量GARCH模型的均值方程,ut為已知過去信息Ft-1下的條件期望,對大多數收益率序列,對ut采用一個帶外生變量的簡單向量ARMA結構就夠了。式(5)表明殘差項et服從零均值,方差—協方差矩陣為Ht的正態分布,其中,h為單變量經 GARCH(p,q)過程擬合后所得的條件方差,其進it一步被分解為式 (6)的形式,表示單變量GARCH模型求出的時變標準差對角矩陣,為時變相關系數矩陣。式(7)中的條件協方差矩陣Q正定性可以保證R的正定條件,具體的表達tt式為由Q矩陣對角元素的平方根構成??偟膩碚f,式(6)和式(7)則是序t列Rt的動態相關結構過程,需要關心的正是根據兩式解得的。式(8)中的為標準化殘差的無條件方差矩陣,即;其中是將GARCH過程中的均值方程所得到殘差進行標準化處理;α為前期標準化無條件協方差矩陣的系數,反映了滯后一期的標準化殘差乘積對動態相關系數的影響;β為條件前期條件協方差矩陣系數,反映了相關性的持續性特征,二者均為動態相關系數且需要滿足(α+β)<1。

DCC-GARCH模型通常經過兩個步驟完成:首先,對單個時間序列進行單變量GARCH模型的估計,利用所得條件方差除以殘差得到標準化殘差;其次,利用第一階段標準化殘差進行估計,得到最終的動態相關結構參數。整個模型的擬合過程中,參數α和β的求解都是基于最大似然估計,通過兩步法得到的DCC估計量具有很好的漸進正態性和一致性。

三、實證研究與結果分析

(一)描述性統計分析

圖3~圖5分別為投資者情緒、市場超額收益率和市場流動性水平(用非流動性指標衡量)的走勢圖,可以發現,盡管波動程度有差異,但各序列都存在顯著的波動集聚效應,說明各序列的波動性存在時變特征。具體來看,投資者情緒在2011年之前的波動較小,隨后波動有增大的趨勢,2015年下半年—2016年年底的波動最為劇烈,這段時間也恰好是中國股市經歷了高速上漲后的回調階段。市場超額收益率在2009—2014年的波動率總體上有下降的趨勢,在2015年波動十分顯著,且超額收益率極值也出現在這一樣本區間,2015年后波動性逐漸降低。市場非流動性的波動集聚特征在2009—2013年相對較為顯著,并于2016年初達到極值,此時流動性水平最差。

圖3 上證指數投資者情緒

圖4 上證指數股票超額收益率

表1進一步給出了變量描述性統計結果,從均值來看,投資者情緒、市場非流動性水平均大于0,市場超額收益率的小于0,說明投資者情緒總體上呈現樂觀趨勢,而流動性程度以及市場超額收益較低。從標準差來看,投資者情緒、市場超額收益的標準差都大于市場非流動性,且偏態程度小于市場非流動性。各變量峰度均大于3,呈現出明顯的“尖峰厚尾”特征,J-B統計量進一步表明,各變量在1%的顯著性水平下都異于正態分布。后續模型構建的前提是序列平穩,表2中的ADF檢驗和PP檢驗結果表明各變量均在1%的顯著性水平下拒絕了存在單位根的原假設,直接對這各序列進行建模不會出現偽回歸問題。Q(5)、Q(10)統計量的檢驗結果表明 3個變量在1%顯著水平下均存在序列相關性。

圖5 上證指數股票非流動性

表1 變量描述性統計結果

表2 變量平穩性和自相關性檢驗結果

(二)協整檢驗與滾動回歸

1.E-G兩步法

采用E-G兩步法對投資者情緒與其他兩個變量分別進行全樣本的協整檢驗,以驗證各變量間是否有長期穩定的均衡關系。第一步,對各變量進行標準化處理以消除變量差異的影響,再將市場超額收益率和股票流動性對投資者情緒按照方程 yt=c+βxt進行OLS 回歸,結果如式(9)和式(10)所示,其中括號內的為t統計量

第二步,將方程(9)和方程(10)所得到的殘差分別記為RESIDR和RESIDILLIQ并進行單位根檢驗,結果如表3所示。

表3 殘差序列的平穩性檢驗

表3表明回歸方程的殘差均在1%的顯著性水平下拒絕原假設,即投資者情緒與市場超額收益率和流動性間均存在長期穩定的均衡關系。從兩個方程β系數的符號及顯著性看,投資者情緒與市場超額收益率在總體上呈顯著的正相關關系,與市場非流動性呈顯著的負相關關系。這說明投資者情緒越高漲,市場超額收益率越高,也會加大市場流動性。

2.滾動回歸

靜態角度的簡單協整分析僅反映了樣本均值間的長期穩定關系。為了檢驗投資者情緒與市場超額收益率和流動性間的時變協動性,本文選取固定時間窗口的滾動回歸模型,初步描述序列間的時變相關特征,滾動回歸模型的特點是可以更敏銳地捕捉β系數及常數項c受樣本區間變化的影響。定義固定滾動窗口為60個交易日(約一個季度),滾動步長為1,將樣本進行滾動回歸估計,得到的參數β反映了情緒對因變量的時變影響效應,結果如圖6和圖7所示。

圖6 市場超額收益率與投資者情緒的滾動回歸

圖7 市場非流動性與投資者情緒的滾動回歸

從圖6和圖7可以直觀地看出:(1)滾動回歸參數c和β均具有時變性特征,說明投資者情緒對市場超額收益率和市場流動性的影響程度隨時間的變化存在差異;(2)由β系數符號可以看出,投資者情緒與市場超額收益率的相關系數為正,與市場非流動性的相關系數大體為負,這意味著在投資者情緒不斷高漲的過程中,樂觀情緒會推動股價上揚,市場超額收益率隨之增加;同時,高漲的情緒會增加市場流動性水平;(3)對比情緒與超額收益率、流動性的動態相關β系數可以看出,市場非流動性與投資者情緒間的相關性相較于前者變動幅度更大,說明當投資者情緒變化時,流動性對這種沖擊表現得更為敏感;(4)二者的走勢大致相反,由于股票非流動性是股票流動性的反向測度指標,這意味著情緒對市場超額收益率、流動性的溢出效應在時間分布上大體趨同。

(三)DCC-GARCH模型構建及實證

構建GARCH模型的前提是各變量均為平穩的時間序列數據,表2的ADF檢驗結果表明這一條件得到滿足。對各序列和序列平方項的自相關圖和偏自相關圖以及滯后5階和10階的Ljung-Box Q統計量檢驗發現投資者情緒、市場超額收益率和市場非流動性均存在低階的序列相關性。因此本文采用ARMA模型建立GARCH模型的單變量均值方程,以剔除原始數據的線性依賴。依據AIC和SC準則以及模型簡潔性,利用EVIEWS8.0軟件多次比對之后,建立3個變量的最優均值方程形式分別為ARMA(4,2)、ARMA(3,2)和 ARMA(3,1),式(11)~式(13)中括號內為統計量。

對以上方程的殘差序列分別進行自相關檢驗,Ljung-box Q統計量對應的p值均大于0.1,表明方程不再有自相關。對殘差序列進行ARCH-LM檢驗,均拒絕原假設,即各序列存在顯著的ARCH效應,可進一步用GARCH模型進行建模。由于GARCH(1,1)模型可以很好地刻畫金融序列的異方差特征,因此采用該模型對投資者情緒、市場超額收益率及市場非流動性均值方程的殘差序列進行擬合,結果如表4所示。再次對模型殘差進行ARCH-LM檢驗,均無ARCH效應,說明所設定的方程已充分提取了殘差的異方差特征。

從表4可以看出,各序列回歸參數均在1%的顯著性水平上顯著,α與β之和均小于并接近1,符合模型的基本約束條件,各序列的波動性在時間上均呈現顯著的持續性。具體的來說,α均顯著的異于0,表明條件方差會受到前期殘差平方項的影響,但影響較??;投資者情緒以及市場超額收益率的β值均大于股票流動性的值,表明當面臨沖擊時,投資者情緒和市場超額收益率需要更長的時間吸收和反映,序列波動有更大的持續性。

基于模型(11)~模型(13)的估計結果,可得到各單變量GARCH模型的參數和標準化殘差,據此進行DCC-GARCH模型的擬合,其中DCC模型的階數與以上單變量GARCH模型保持一致,均為1階。從表5給出的回歸結果可以看出,各參數均大于0,具有很強的顯著性,表明前一期的波動情況會顯著地正向影響當期的波動相關性。α值分別為0.010 5和0.016 3,表明動態相關系數受前期的標準化殘差乘積的影響較??;β值均接近0.90且十分顯著,表明投資者情緒市場超額收益率和流動間的動態相關程度在時間上的影響較為持久。

表4 GARCH(1,1)的參數估計結果

表5 DCC模型估計結果

圖8和圖9更直觀地展示了兩組動態條件相關系數的變化趨勢,具體如下:(1)從動態條件相關系數的大小可以看出,投資者情緒與市場超額收益率的相關系數主要分布在 (0.266,0.444)之間,與市場非流動性的相關系數主要分布在(-0.314,-0.008)之間,說明投資者情緒發生波動時,會傳導到股票市場,且傳導效率因時而異。(2)從動態條件相關系數的符號可知,整個樣本區間內投資者情緒與市場超額收益率的相關性為正,與市場非流動性的相關性為負,意味著情緒對股票收益和流動性具有顯著的正向溢出效應。(3)從路徑圖走勢可知,圖9中投資者情緒與流動性間相關系數的波動相對更為頻繁,這意味著股票流動性對投資者情緒波動更為敏感,情緒發生的微小波動會很快引起流動性發生變動,而股票收益率的反應相對平緩。

圖8 投資者情緒和市場超額收益率的動態條件相關系數

總體來看,DCC模型刻畫的結果與滾動回歸的結論大體相符,比如相關系數、走勢和波動幅度等。滾動回歸雖能描述相關變量的時變相關特征,但其結果會受到固定時間窗口和步長值大小的影響,時間路徑圖上各點的相關系數僅是指定樣本區間內均值回歸的結果。相比之下,DCC-GARCH模型的擬合不受模型之外無關條件的約束,它不僅可以充分提取各變量的異方差特征,也能得到所有樣本觀察值所對應的相關系數,其結果相對更為精確和完整。

圖9 投資者情緒和市場非流動性的動態條件相關系數

(四)不同市場環境下時變相關性的差異

為進一步探討各變量的動態相關程度在不同市場運行條件下的規律,接下來將市場環境狀態劃分為牛市和熊市,對動態條件相關系數的差異性進行分析?,F有文獻對牛/熊市的劃分尚無統一的標準和方法,本文借鑒Pagan和Sossounov[38]的方法,用一種簡便的非參數估計方法來確定市場狀態,具體過程為:首先對股票價格指數設定一個單向運行周期,將樣本區間細分為多個子區間;其次將各運行周期中第t日股票價格指數與相鄰日度進行對比,運行周期中會交替出現極高點和極低點,選取這些連續極值點中的最高者(或連續波谷中的最低者)作為該周期內牛熊市狀態轉換的轉折點。本文將上證指數的單向運行周期設定為6個月,可以將樣本區間大致劃分為表6所示的4個階段。將牛市和熊市階段的動態條件相關系數分別合并為新的序列,基本統計性特征如表7所示。

表6 股票市場狀態階段的劃分

表7 不同市場環境下動態條件相關系數的統計分析

通過t檢驗對不同市場狀態下的相關系數進行差異性比較,發現相關系數在(牛/熊)市下的t統計量對應的p值分別為0.002和0.000,均在1%的顯著性水平下存在差異,說明不同的市場環境下各變量間的動態條件相關系數不同。由表7可以發現均值的絕對值分別從0.334和0.125上升到了0.337和0.161,表示超額收益率和流動性在熊市環境中更容易受到投資者情緒變動的影響,這可能是因為在熊市環境中投資者的“殺跌”效應大于牛市環境中的“追漲”效應。相關系數標準差分別從0.023和0.049下降到了0.020和0.043,熊市中投資者情緒與市場的時變相關性較牛市中更為穩定。

(五)變量之間時變相關性的影響因素

接下來探討宏觀經濟變量是否會影響投資者情緒與市場超額收益率、市場流動性的動態條件相關系數。將投資者情緒與市場超額收益率和非流動性的動態條件相關系數分別記為COR1和COR2,選取國內生產總值月度增長率(GDP)、通貨膨脹率(INF)、無風險收益率(MRF)、失業率(UNEMPLOY)4個宏觀經濟變量,加入因變量(COR)的滯后1、2期變量,構建公式(14),為與宏觀經濟變量的頻率保持一致,將因變量CORt作月度算術平均處理。

為方便對比宏觀經濟變量對動態相關系數的影響差異,對所有變量提前進行了標準化處理以消除量綱的影響。限于篇幅省略列示的Pearson相關性分析表明多數解釋變量與COR1和COR2序列均存在相關性,同時各解釋變量的方差膨脹因子VIF值均小于10,說明解釋變量間不存在多重共線性,可將以上解釋變量納入回歸模型,平穩性檢驗結果也表明各序列均平穩?;貧w結果如表8所示,兩個回歸結果的調整R2值分別為0.62和0.66,表明整體的擬合度較好,自相關檢驗統計量F和Obs×R2等統計結果顯示模型不存在自相關和異方差性。

表8 動態條件相關系數的影響因素分析

表8的結果可以看出:(1)兩個回歸方程的滯后1階、滯后2階的回歸系數都在5%的顯著性水平下顯著,表明各變量的時變相關系數在很大程度上會受到前期影響;(2)通貨膨脹率與COR1顯著正相關,與COR2顯著負相關,說明通貨膨脹率的上漲會提高情緒與超額收益率、市場流動性的相關性。(3)無風險利率與COR1負相關,與COR2正相關,且在統計上顯著,說明當資金的機會成本提高時,會降低投資者情緒與市場超額收益和流動性的相關性。(4)GDP增長率與COR1顯著正相關,與COR2顯著負相關,說明宏觀經濟環境較好時,投資者情緒與股票運行的相關性隨之增強。而失業率均未通過顯著性檢驗。

(六)日度序列與月度序列的時變相關性的差異性分析

為了分析不同數據頻率下各變量的時變相關性是否存在差異,進一步構建相對低頻的變量月度時間序列,與上文的研究結果進行對比??紤]到投資者情緒的復合指標的優勢,參照Baker和Wurgler[3]1645-1680的方法,分兩步構建投資者情緒的復合指標變量。

第一步,選取5個源指標:IPO首日溢價率(RIPO)、封閉式基金折價率(CEFD)、消費者信心指數(CCI)、滬深兩市月度換手率(TURN)、新增投資者開戶數(NIV),以及這5個源指標的一階滯后作為基礎變量,對各變量進行標準化處理后,運用主成分分析提取投資者情緒的初始變量。主成分因子的選取標準是各成分的累計方差解釋率大于85%,對前5個主成分以特征值為權重進行加權平均,得到相應的因子負荷和情緒因子變量,各變量的因子負荷作為初步情緒指標(sentimentt)中的各主成分的變量系數,具體結果如下

第二步,為了剔除投資者情緒中的理性成分,選取消費者物價指數(CPI)、月度無風險利率(MRF)、貨幣供應量(MS)、工業生產增加值(IAV)作為宏觀經濟變量,按照式(16)對投資者情緒初始變量(sentimentt)進行回歸,所得的殘差即為月度投資者情緒變量

與上文DCC模型擬合的步驟一致,對月度變量分別進行單變量GARCH擬合,得到相應參數以及標準化殘差后,進行第二階段的擬合,DCC結果如表9、圖10、圖11所示。

表9 DCC模型估計結果

根據結果可以看出,α和β的估計值仍滿足模型的約束條件,但與日度數據的實證結果相比,有如下特點:(1)月度指標下,投資者情緒與股票市場的相關程度普遍比日度指標有明顯降低,投資者情緒與市場超額收益相關系數的均值由0.335變為0.083,與市場流動性相關系數的均值由0.143變為0.048。(2)變量間相關性的時變特征不再顯著,對于投資者情緒與市場超額收益率而言,盡管二者的相關性分別在2012年和2015年發生了相對較大的波動,但在其他樣本區間內的相關性僅僅在區間(-0.1,0.1)內震蕩;投資者情緒與市場流動性間的相關性幾乎不存在時變特征,相關程度幾乎維持在0.048的水平恒定不變。造成這一現象的原因可能在于,低頻數據往往是多個時間點內的市場信息相互均衡得到的結果,因此過濾掉了許多有效的市場信息,無法準確地表征投資者和股票市場的實時狀態,導致二者的相關性較弱。相比之下,更高頻的日度指標在刻畫情緒與股票市場相關程度時,能捕捉到即時且準確的信息。

圖11 投資者情緒和市場非流動性的動態條件相關系數

四、研究總結

本文選取2009—2018年共2 198個交易日觀測值,利用爬蟲軟件挖掘了新浪財經旗下“大盤評述”文本內容,利用Python自然語言處理技術進行量化分析,構建了投資者情緒的日度指標,從均值和方差層面分析了投資者情緒與市場超額收益率、市場流動性的時變相關性關系,并進一步分析了宏觀經濟因素對這一相關性產生的可能影響,以及不同市場環境下變量間動態條件相關系數的差異性。實證發現:(1)投資者情緒與市場超額收益率和市場流動性間不僅存在顯著的靜態相關性,也存在時變協動性。投資者情緒和市場超額收益率、市場流動性間具有顯著的正向相關性,且這種相關性具有長期記憶性,其中流動性對情緒的波動要更為敏感。(2)投資者情緒與市場的時變相關系數會受GDP增長率、通貨膨脹率等宏觀經濟因素的影響。而且投資者情緒與股票市場的動態條件相關系數會因市場環境而異,相比于牛市環境,熊市環境中股票市場運行受到情緒波動的程度更大,且這種時變相關性較牛市中更為穩定。(3)相比之下,更高頻的日度指標在刻畫情緒與超額收益率、流動性的相關性時,更能捕捉到即時、準確的信息,時變相關性的結果更精準。

本文可能的創新之處體現在以下幾點:首先,依托數據挖掘手段獲取了網絡平臺上的文本信息,直接利用情感分析算法得到投資者情緒的日度數據,構建了頻率更高的情緒指標,有利于深入挖掘投資者情緒與股票市場運行的內在聯動性。其次,從動態角度利用DCC-GARCH模型研究了投資者情緒與股票市場超額收益率和流動性間之間的時變相關性。利用投資者情緒的日度指標,在確定相關變量存在時變協動關系的前提下,充分提取投資者情緒的異方差特征,利用DCC-GARCH模型從動態角度研究了投資者情緒與市場超額收益率和流動性間之間的時變相關性。最后,在以上基礎上進一步分析各變量時變相關性的影響因素,并將樣本區間分為牛/熊市不同階段,對DCC模型分析求得的動態條件相關系數作了對比,揭示不同市場環境下時變相關性的表現有何差異,這可以進一步理解投資者情緒與股票收益和流動性的聯動機理??傊?,互聯網時代的信息傳播具有即時性、廣泛性和互動性等特點,通過大數據挖掘方法進行投資者情緒的度量并研究其對股票市場運行的影響規律,對深入理解投資者情緒與股票市場運行的聯動機理有一定意義。

猜你喜歡
時變流動性收益率
美聯儲縮表、全球流動性與中國資產配置
2020年二季度投資策略:流動性無憂業績下殺無解
|直接引語和間接引語|
基于馬爾可夫時變模型的流量數據挖掘
基于時變Copula的股票市場相關性分析
基于時變Copula的股票市場相關性分析
融資融券對我國股市的流動性影響
融資融券對我國股市的流動性影響
2016年10月債券平均久期、凸性及到期收益率
2016年10月底中短期票據與央票收益率點差圖
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合