?

基于CGSS2003數據關于住房影響因素的報告

2016-12-01 15:26盧亞寧
智富時代 2016年12期
關鍵詞:回歸分析影響因素

盧亞寧

【摘 要】目的:分析收入、教育水平、家庭總人口數對住房的影響,選取使用面積為自變量,探討人口基本特征因素對住房狀況的影響。方法:基于全國綜合社會調查(CGSS)2003年的調查數據,并用SPSS18.0對引用數據進行回歸分析和方差分析。結論:受教育程度越高,家庭住房面積相對越高;收入越高,家庭住房使用面積相對越高,并且隨著家庭總人口數的增加,住房使用面積相對應增加。

【關鍵詞】住房狀況;影響因素;回歸分析

住房是生活的基本需求,住房狀況會對人們的生活、工作和健康等方面產生深遠影響。住房狀況受到了住房制度、地區自然環境、社會文化和家庭狀況等多因素的影響,它反映了住戶的居住質量,并影響個人身體健康和社會穩定。

隨著市場化改革的逐步深入,我國貧富分化越發顯著,家庭人均住房情況也隨之出現較大差距。在當前社會中,很多因素對家庭住房產生了影響,本文就收入、教育水平以及家庭總人口數進行了分析。

一、數據來源與指標選取

本文數據來源于全國綜合社會調查CGSS(2003),是中國人民大學于2003年和香港科技大學合作下,實施的中國第一次綜合社會調查(GSS)。此次調查只包括城鎮,共涉及了125個縣級單位,559個居委會,5900名被訪者,收回有效數據5894條。該調查的學術研究主題包括社會分層、社會流動和社會網絡,具體指標包括:(1)住戶成員部分(2)個人基本情況(3)戶口變動(4)家庭情況(5)社會交往(6)教育經歷(7)職業經歷(8)目前職業等方面。本文根據需求選取了3317個樣本,選取收入、教育水平、家庭總人口數、作為自變量,選取住房使用面積為因變量進行分析。

二、研究方法

本文采用SPSS18.0進行數據分析,在原始樣本數據中,剔除那些回答不明或者作廢的數據,采用線性回歸分析方法研究現象。

三、變量

1、本文進行了三次分析,因變量分別為市值、使用面積和其他住房處,選取能夠直觀反映住房狀況的住房使用面積作為因變量,按照慣例對因變量計算對數值,以便使其更接近正態分布。

2、收入水平,這一變量在cgss2003數據中用被訪者“全年家庭總收入”這一數據表示。

3、受教育水平

4、家庭人口數,使用cgss2003中家庭人口變量,選取有效值重新編碼為不同變量。

四、研究假設的確立

本文的主要目的是探討樣本的性別、教育程度、收入、家庭人口數對住房使用面積的影響,按照一般理解,性別的影響程度應該有一定區別;一般收入越高、住房面積也越大;一般而言,教育程度高,收入相應也會越高,推到住房面積也相應越大,但不可忽視社會中也存在相當部分低學歷、高收入人群,暫時先預假設學歷高,住房面積高;家庭人口數一般越多,住房面積越大,由此提出以下假設:

假設1:教育程度對住房面積存在影響,且教育程度越高,住房面積越大

假設2:收入對住房面積存在影響,且收入越高,住房面積越大

假設3:家庭人口數對住房面積存在影響,且家庭人數越多,住房面積越大

五、數據分析驗證

(一)原始變量的統計描述與轉換:

原始的變量中,教育程度為分類變量,先統計教育各個類別分布的人數與百分比,初步觀測數據分布情況。

教育程度

教育程度統計結果可見,此次調查的樣本中,初中人數最多,有989人,比例是29.8%,其次是高中學歷,有624人,比例是18.8%,而最高學歷碩士的人數是16人,比例是0.5%,為最少人群;再者,觀察高等教育總人群,經過對比可以發現,此次調查的樣本群,以低學歷為主。

另外幾個原始變量家庭人口數、收入、使用面積均為連續性變量,與分類變量不同,連續性變量的統計以均值、標準差為主要參考指標,以初步觀察數據的分布特征。

描述統計量

家庭人口的統計結果可見,最小為1人的單身家庭,最多居然有16人的大家庭,總體均值為3.33人的正常數據,可見為常態。

描述統計量

收入統計結果可見,最小存在零收入者,最高的收入為300000,總體均值為11303.99,可見總體存在很大差距;同時,由于數據位數存在大的差距,通過SPSS運算的功能,除以10000,以消除數據差別。

描述統計量

最后是因變量使用面積的統計結果,可見:最小只有5平米,最高的有800平米,總體均值為61.606,可見總體差距很大。為了消除影響,將該變量去自然對數,以下是統計結果:

描述統計量

可見最小值為1.61,最大值為6.68,均值為3.93

(二)住房面積在不同性別、不同教育程度的差異檢驗:

性別與教育程度屬于分類變量,首先驗證一下住房面積是否存在顯著差異,針對性別采用T檢驗,而教育程度由于是多分類,采用方差分析

1.住房面積在不同性別的T檢驗結果:

組統計量

以上即為不同性別的T檢驗結果,由顯著性檢驗P值=0.80可知,不同性別的住房面積不存在顯著差異,也就是說,性別的影響不顯著。

2.住房面積在不同教育程度的方差分析結果:

不同教育程度使用面積統計量

ANOVA

使用面積

以上為不同教育程度的住房面積的方差分析結果,由表格2的差異顯著性檢驗結果可知,P值=0.000<0.05,表明不同的教育程度人群,住房面積存在顯著差異,參考表格1的均值數據、以及均值圖都可以發現:初中、高中、職高人群都處在相對較低水平,而2類大專、以及本科人群處在相對較高水平。其中,最高的是非全日制大專,均值為4.066,最低的是初中人群,為3.855。

1. 建立多元回歸模型,研究性別、教育水平、收入、家庭人口數對住房面積的影響

模型匯總b

a. 預測變量: (常量), 家庭人口 , 性別, 教育程度, 年齡, 收入A。

b. 因變量: 使用面積

表格1首先給出的是自變量與因變量的復相關系數R、決定系數R方以及校正的決定系數調整R方,由結果可見,5個自變量與因變量的相關系數是0.266,此外,決定系數R方是檢驗回歸方程擬合是否良好的指標,由決定系數R方值=0.071可知,5個自變量可以解釋的因變量的變異是7.1%,相對較少;Durbin-Watson統計量是檢驗因變量的殘差獨立性的非常重要的指標,若該項指標不通過,則表明需要向模型中引入時間因素、或直接使用時間序列模型來分析,而不是普通的線性回歸模型。

Durbin-Watson序列檢驗的判斷標準是:若該值在2附近,則表明殘差間是相互獨立的,觀測可知在此模型中該值=2.543非常接近2,表明無異常。

Anova b

a. 預測變量: (常量), 家庭人口 , 性別, 教育程度, 年齡, 收入A。

b. 因變量: 使用面積

表格2是模型的整體顯著性檢驗結果,所用的是方差分析,可見F值=50.432,SIG值<0.05表明模型整體檢驗顯著,若該值>0.05表明模型整體檢驗不顯著,觀測此處SIG值=0.000表明模型整體顯著。

系數a

以上是整個回歸方程結果中最重要的表格,是各自變量在回歸方程中的檢驗結果,各個自變量的檢驗是否有意義主要是看SIG值,如果SIG值<0.05,表明該自變量在回歸方程中是成立的,同時也說明該自變量對因變量的影響是顯著的,如果SIG值>0.05,表明該自變量在回歸方程中是不成立的,同時也說明該自變量對因變量的影響不是顯著的。

性別的SIG值=0.366>0.05,表明對住房面積不存在顯著影響,假設1得以認證;

教育程度的SIG值=0.000<0.05,表明對住房面積存在顯著影響,考察回歸系數值=0.025可知,教育程度為正向影響,也就是說教育程度高的住房面積相對也大,假設2得以驗證;

收入的SIG值=0.000<0.05,表明對住房面積存在顯著影響,考察回歸系數值=0.037可知,收入為正向影響,也就是說收入高的住房面積相對也大,假設3得以驗證;

家庭人數的SIG值=0.000<0.05,表明對住房面積存在顯著影響,考察回歸系數值=0.112可知,家庭人數為正向影響,也就是說家庭人數多的住房面積相對也大,假設4得以驗證;

比較3個顯著的自變量可以發現,家庭人數的影響程度最大、其次為收入水平,而教育程度的影響相對最低; ?線性回歸分析中多重共線性是可以通過指標來識別的,通常有方差膨脹因子、容差等等。此處我們以方差膨脹因子(VIF)為例,當0<VIF<10,不存在多重共線性;當10100,存在嚴重多重共線性。

見表格3最后的VIF統計量:3個自變量都是在1附近,容差統計量低于1,可見不存在共線性問題。

左兩圖分別為標準化殘差的直方圖以及PP圖,由直方圖可見,殘差分布呈現出典型的正態分布特征,而PP圖中可見散點圍繞直線呈均勻上升,無異常點出現,可見回歸方程的這一條件得到滿足

六、總體結論

經過以上分析,驗證了自變量教育程度、收入和家庭人口數對于因變量(住房面積)都有著顯著的影響的同時,意外的是結果與研究假設有一定差異?;貧w方程總體驗證物無共線性、殘差獨立性、分布正態性均得到滿足,本身無重大缺陷。從研究結果回應研究假設來看,教育程度和收入以及家庭總人口數對住房面積的影響基本符合假設。

【參考文獻】

[1]中國城市住宅問題研究會、住宅社會學學術委員會主編,《住宅社會學導論》 安徽出版社 1991年

[2]劉米娜. 中國城鎮住房產權的區域差異分析——基于CGSS(2003)數據的實證研究[J]. 蘭州學刊, 2009(5):114-119.

猜你喜歡
回歸分析影響因素
城鄉居民醫療費用的相關性與回歸分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合