?

理論導向的體育社會學定量研究:問題、策略與展望

2024-01-28 10:21邊燕杰張伊雪魯肖麟
上海體育學院學報 2024年1期
關鍵詞:社會學定量理論

邊燕杰,張伊雪,魯肖麟

(1. 西安交通大學 實證社會科學研究所,陜西 西安 710049;2. 西安電子科技大學 體育部,陜西 西安 710126)

體育社會學是一門科學,必然依賴循證為本的定量研究方法以實現其研究目標。作為一門交叉學科,體育社會學聚焦體育與社會的關系,是構建中國特色哲學社會科學學科體系、學術體系、話語體系的重要陣地。在現實層面,體育社會學關注體育在推進全民健身、建設現代化強國、提升國民健康水平和生活質量實踐中發揮的重要作用;致力于理解和指導體育產業發展,促進經濟社會發展,為實現中國式現代化作出貢獻[1]。在學科層面,定量研究的客觀性、精確性和可重復性有助于體育社會學研究深入理解體育現象,驗證理論假設,推動理論創新。當下,我國體育社會學定量研究處于上升期,不斷涌現出具有理論價值和現實意義的科研成果,但現有研究在理論導向、問題意識和方法規范性等方面也遇到了諸多困境,在數字社會時代面臨新的挑戰[2]。為此,本文重點回答以下兩大問題:體育社會學需要定量研究嗎?如何開展規范的定量研究才能實現體育社會學的科學研究目標?從以下方面展開論證:①定量研究的科學價值;②體育社會學定量研究的問題意識和深究理論;③我國體育社會學定量研究面臨的困境及解決策略;④體育社會學定量研究的機遇和使命。

1 定量研究的科學價值

1.1 定量研究方法應用的學科背景

體育社會學研究具有鮮明的學科交叉特征。大量體育社會學研究的定量模型來源于經濟學領域,使用的調查數據來自社會學領域,研究問題則屬于體育學領域。那么不同學科領域對于定量分析方法的要求是一致的嗎?答案是肯定的。本文簡略回顧定量研究方法在經濟學、社會學、體育學3 個學科中的發展和應用脈絡,以便對定量研究方法的普遍應用價值建立歷史唯物主義認知。

(1)經濟學中的定量研究。西方經濟學定量研究已有三百多年歷史。早在18 世紀,數學表達就已經出現在經濟學研究中。在之后的一百多年里,新古典經濟學家們逐漸納入描述統計學、回歸分析等數學手段研究供需關系、貿易平衡等經濟問題,開啟了實證經濟學研究,最后產生了計量經濟學[3]。計量經濟學是利用數學和統計學的方法驗證經濟學理論的一個經濟學分支領域,以1933 年《計量經濟學》期刊的創辦為標志[4],成為當代經濟學研究的主流。對80 種經濟學優秀期刊1980—2015 年發表的全部13 萬篇文章的統計發現,實證類文章的歷年占比均超過50%,至2015 年占比接近70%[5]。

我國經濟學的定量研究起步較晚,但發展勢頭強勁。在我國經濟學研究中處于理論指導地位的是馬克思主義經濟學,在《資本論》《剩余價值學說史》中將數學方法作為經濟分析的輔助工具,將利潤率視為多種可變函數的組合,用以分析再生產理論問題[6]。在新中國成立初期的計劃經濟體制中,數學運算和統計分析亦被運用于宏觀經濟規劃,輔助制定經濟政策。20 世紀80 年代初,計量經濟學方法自美國引入我國,90 年代中后期開始占據一席之地,21 世紀成為主流研究方法[7]。在我國經濟學領域的重要期刊《經濟研究》每年的發文中,使用計量方法的論文比例在1991 年前幾乎為0,1998 年提高到11%,2007 年超過50%[3,8],2019 年超過80%,其中4 期達到100%[9]。由此可見,定量分析在中外當代經濟學研究中均為主流方法。

(2)社會學中的定量研究。體育人文社會學知識建構來源主要集中在體育學、社會學、應用經濟學等一級學科,其中貢獻率僅次于體育學的便是社會學[10]。社會學的研究方法和視角深刻影響著體育社會學,推動了體育社會現象與問題研究的規范化。早在社會學創立時期,定量實證研究的思想便具有學科奠基作用。19 世紀上半葉,孔德在《實證哲學教程》中首次提出“社會學”概念時,便主張以科學實證代替哲學思辨,強調使用觀察和實驗等自然科學方法研究人類社會[11]。涂爾干是將定量研究方法納入社會學實證分析的先驅,其在1897 年的著作《自殺論》[12]中利用描述性統計方法分析了自殺現象的社會成因。此后囿于社會現象的復雜性和統計資料與方法的有限性,定性研究長期占據社會學研究方法的主導地位。20 世紀70 年代以后,計算機技術與統計學的迅速發展推動了定量研究方法的長足進步。從20 世紀80 年代起,基于社會調查數據、使用計量模型的定量研究逐漸成為西方社會學研究的主流[13]。一項關于社會學權威期刊的研究[14]結果顯示,使用調查數據的實證論文比例由1940 年的18%上升至2015 年的50%。另一項針對英國社會學權威期刊論文的研究[15]也印證了類似趨勢:定量分析論文的比例由1977—1979 年的20%上升至1992—1994 年的31%。

我國社會學經歷了特殊發展歷程。20 世紀初社會學自歐洲傳入中國后,經歷了50—60 年代的中斷,至改革開放初期恢復重建,與美國社會學界交流頻繁[16]。當時恰逢美國社會學定量研究飛速發展,所以定量分析方法很快為我國中青年社會學者所接受。據統計,1986—2016 年社會學領域的重要期刊《社會學研究》刊發的定量研究論文平均占30%,每年呈波動上升趨勢,最近幾年穩定在35%左右[17]。定量研究是我國社會學的主流研究方法之一,早已成為不爭的事實。

(3)體育社會學中的定量研究。體育社會學聚焦于體育、文化和社會結構之間的關系,被視為“最為活躍、最為碩果累累”的體育學分支學科之一[18]。20 世紀50 年代,體育社會學研究領域迅速擴張,基于定量研究方法的體育社會學研究成果開始出現。早期研究主要采用匯總數據、描述性和相關統計等初級分析方法,受學科交叉整合不足、專業學者短缺的制約,20 世紀60—70 年代定量研究在體育社會學領域的占比遠低于質性研究和理論研究[19]。20 世紀80 年代后,體育社會學也經歷了從質性研究向定量研究的科學主義轉變,定量研究逐步成為主流研究方法。針對《國際體育社會學評論》(International Journal for the Sociology of Sport)的研究[20-21]發現,在1966—1975 年刊發的定量研究論文平均占比僅為55%,而1986—2005 年間增至70%。

我國體育社會學的定量研究起步較晚。直至20 世紀90 年代后期,問卷調查與統計模型等定量研究方法才被廣泛運用于該領域[21]。據統計,在2000—2007 年300 篇體育學博士學位論文中,使用統計分析方法的占38%,其中,體育人文社會學占31%[22]。博士學位論文反映了每個學科最為前沿、最具潛力的發展方向,因此在可預見的未來,定量研究將在體育社會學研究中占據主要地位,引領體育社會學研究的科學化發展趨勢。

1.2 定量研究的三段式:問題、理論、證明

經濟學、社會學、體育學是相互獨立的社會科學領域,分別有其相對獨特的學科視角和議題。那么,為什么不同的學科視角和議題都依賴同一套定量研究方法實現其研究目標呢?答案是理論。學科視角和議題雖各不相同,但任何學科視角下所能捕捉的現實問題都必須轉化為理論問題才能開展以循證為本的科學研究?,F實問題是現象層次所能觀察感知的,但其本質和內在變動邏輯需通過由表及里的理論分析,才能實現從感性認識向理性認識的飛躍。在此過程中,認識現象的本質就產生了理論概念,挖掘現象的內在變動邏輯就形成多個概念之間相互聯系的理論命題,而理論創新在狹義上就是指理論概念創新和理論命題創新。定量研究方法之所以具有跨學科的適用性以及普遍的科學研究價值,是因為它可以用來測量理論概念和證明理論命題。問題、理論和證明是所有社會科學領域開展定量研究的3 個核心要素,缺一不可。

自2002 年以來,筆者提出和倡導理論導向實證研究的學術理念,用“想問題、究理論、重證明”來概括理論導向實證研究的3 個步驟[23],其實就是定量研究的三段式。①“想問題”的問題來自社會實踐過程,來自研究者對相關社會現象的觀察和感知,具有經驗知識成分,但是進入科學實證研究的問題必須是一個理論問題,即用抽象概念認知社會現象的本質,用因果命題闡述社會現象的內在變動邏輯。②“究理論”是通過對已有理論的審視和批判,提出更為切合研究問題的理論假設,通過嚴格定義概念、確定概念聯系、闡明因果機制的理論分析步驟,實現理論認識的突破和創新。③“重證明”是通過實證方法來驗證理論的真偽。未經實證的理論僅僅停留在思辨層面,是缺乏實際支撐的抽象理念,無法確知其真理成分。盡管廣義的實證方法包含定性分析與定量分析,但是定性分析的觀察范圍有限,研究過程欠缺規范化和可復制性,雖有強大的問題揭示和科學發現功能,卻不是科學證明的理想方法。相反,定量研究具有數據代表性、模型規范性、分析客觀性的特征,符合科學研究范式,是檢驗理論真偽及其條件性的最佳選擇。

按照上述框架,筆者以2023 年6 月發表在《上海體育學院學報》的論文《種植方式與全民健身:體育鍛煉參與的南北差異及其文化溯源》[24](以下簡稱《南稻北麥》)為例,分析理論導向的實證研究如何展開。該文作者觀察到的經驗知識是我國體育鍛煉參與的區域差異,北方農村居民體育鍛煉參與平均水平高于南方。由此提出的理論問題是:如何解釋這一差異?作者從“體育起源于生產勞動”的馬克思主義唯物論觀點出發[25],尋找我國農業種植方式的地區差別與體育鍛煉的南北差異的內在聯系。這是《南稻北麥》的“想問題”。面對若干已有理論,包括自然條件論、經濟影響論、體育設施論、文化優勢論、社會資本論等,《南稻北麥》認為均不能解釋體育鍛煉參與的北高南低現象,為此提出南稻北麥種植方式的溢出效應論,通過教育中介與閑暇中介2 個理論推導,分別闡述南稻北麥種植方式影響體育鍛煉參與南北差異的因果路徑。這是《南稻北麥》的“究理論”。在“重證明”方面,《南稻北麥》使用2010 年中國家庭追蹤調查(CFPS)數據進行定量分析,檢驗上述研究假設的真偽。通過多元回歸、固定效應模型、工具變量分析、傾向值匹配分析等方法檢驗證明,南稻北麥種植方式對于農民體育鍛煉參與程度的影響穩定存在??梢钥闯?,《南稻北麥》遵從了科學實證規范,既有問題意識,又有理論推演,還有扎實的數據分析證明,是一篇符合“想問題、究理論、重證明”的定量研究范式的論文。

2 體育社會學定量研究的問題意識與深究理論

圍繞近年我國的體育社會學定量研究,可以從問題意識、深究理論和證明方法3 個方面,對相關困境加以剖析,為提出解決路徑提供范例和建議。

2.1 體育社會學定量研究的問題意識

提問題是理論導向實證研究的起點。問題也是引導體育學科高質量發展、有效改造客觀世界的動力[26]。筆者將《上海體育學院學報》近5 年刊載的論文納入觀察范圍。2019 年1 月—2023 年11 月,該刊共發表了532 篇論文,259 篇為體育人文社會學方向的論文,占48.7%,其中147 篇屬于體育社會學領域的論文,占27.6%。如表1 所示,在方法取向上,體育社會學研究仍以理論分析和文獻綜述為主,占48.3%,定量實證研究占28.6%,質性研究占23.1%。

表1 近5 年《上海體育學院學報》刊載體育社會學論文的研究方法與議題分布Table 1 Research methods and topics of sociology of sport papers published in the Journal of Shanghai University of Sport in the past 5 years

論文的議題分布顯示了研究者的問題意識。占比最高的議題是體育參與的影響因素及其結果,其次是體育政策的演進過程、實施策略、跨國比較等方面。體育文化研究涵蓋了體育文化傳播與傳承、體育領域的象征符號分析等研究方向,體育公共服務議題包括社會體育基礎建設、體育社會組織、賽事承辦等方面。學科發展和理論與方法的反思探討占12.2%,體現出體育社會學研究者不斷強化的學科自覺。體育參與和健身活動在健康促進中的作用及其背后的社會因素分析等研究占10.9%,還有少量關于體育領域女性權益和性別意識的研究。

體育社會學是從社會學視角開展競技體育和大眾體育問題的研究領域[19]。雖有其他不同定義,但大多數學者對于體育社會學的界定都強調“社會學的視角與方法”以體現其學科屬性[27]。結合社會學視角來審視《上海體育學院學報》近5 年刊載的體育社會學論文發現,研究者的問題意識在3 個方面可進一步提升:①議題的豐富度。體育參與和體育政策等傳統議題研究較為充分,但對于新興的數字化技術和社交媒體如何影響體育發展的研究較少,對體育領域中的社會歧視和邊緣群體的體育參與問題探討亦不足。②研究方法的選擇。定量研究占比低、實證研究不足限制了理論與證據的結合。③研究的國際視野。體育社會學研究應加強與國際學界的對話,提升中國研究的主體性。那么,定量研究者的問題意識應如何改進和提高呢?

2.2 從現實問題到學術研究問題

定量研究中的問題意識需要層次轉化?,F實問題是現象層次的、可觀察的,屬于感性認識;而隱藏在現象背后的深層本質及內在變動邏輯,需要通過理論分析來挖掘,從而實現從感性認識到理性認識的飛躍,即實現從現實問題到學術研究問題的轉化。轉化成功與否取決于以下2 個環節。

(1)理論概念的提出。學術研究中的理論創新大多圍繞一個原創理論概念展開理論論證和實證證明。例如,筆者提出體育社會資本的新概念,從社會資本與大眾體育的辯證關系中論證此概念的理論內涵和行為意義,并進行了相關測量[28]。提出此概念的現實背景是我國的體育強國建設目標,而廣泛、持續、深入的大眾體育參與是實現這一目標的社會基礎。從社會學的群體性視角看,大眾體育的本質特征是群體性,很多鍛煉形式和運動項目都依靠群體組織和共同參與而開展。從社會學的聯系性視角看,群體性的大眾體育參與其理論本質就是以人際互動為表現的人際聯系性,由此產生了雙向的體育社會資本效應:一方面,人際聯系中所蘊藏的彼此認同、相互支持、互相激勵的關系資源能夠提升大眾體育參與率;另一方面,群體性體育鍛煉參與將擴大和增強人們的社會網絡與社會資本,提升群眾體育參與率,有利于體育強國目標的實現。簡言之,體育社會資本概念是對大眾體育的群體性和聯系性雙重理論本質的抽象概括。

(2)理論命題的提出。有價值的理論概念應能解釋相關社會現象,并有助于形成新的理論命題以進行實證研究。理論命題是對2 個概念之間內在因果關系的抽象表述。以體育社會資本的理論框架為例,體育社會資本是一個可測量且有效的分析概念:一方面,社會群體的優勢地位提升個體的體育社會資本(命題1);另一方面,體育社會資本顯著提高人們的身心健康水平和生活滿意度(命題2),促使他們更積極地參與體育強國建設(命題3)[28]。在提出理論命題時,要明確理論概念與現實問題的聯系。例如,體育社會資本的概念要幫助我們揭示其對個體和群體體育參與的廣泛影響。此外,有效的理論命題應基于數據和現實觀察,能夠經得起實證研究的驗證。理論命題必須能夠操作化為可檢驗的假設,通過測量核心概念使得數據為理論命題提供實證基礎。

2.3 從學術研究問題到深究理論

提出學術問題后,首先要深究理論,才能實現理論創新。原創性理論創新的不足正是當下體育社會學研究的局限之一[1]。人類社會行為的差異性、復雜性、發展變遷性都能夠激發社會科學的理論創新。針對深究理論、實現創新,筆者提出以下3 條建議。

(1)觀察經驗現實,發現理論問題。發現理論困惑并提出理論問題往往有3 種角度:①現有理論存在解釋缺陷,其前提假定和內在邏輯存在矛盾,例如《南稻北麥》的文獻綜述提出,在體育鍛煉南北差異的已有解釋中,經濟投入、氣候環境、文化因素的解釋邏輯均不成立;②生活經驗缺乏理論解釋,這些經驗背后的規律性有待挖掘,《南稻北麥》提出的理論觀點屬于這一角度;③現有理論與現實經驗存在矛盾,例如西方理論在解釋本土現象時適用性不強,本土現象的因果機制和適用條件需要進一步研究。這一困惑為研究者挖掘本土知識、推進理論創新提供了絕佳的機會。社會網絡分析中的“強弱關系”理論爭辯就是一個范例[29]。西方學者提出的弱關系理論認為,在諸如求職等社會行動中,弱關系因為能夠提供異質性信息,往往比強關系更為有效,這一假設被西方實證研究反復證明。但是中國的生活經驗是,強關系往往才是目標達成的中介機制。這是西方理論與中國現實的矛盾。產生此困惑是由于我們尊重本土生活經驗,并結合經典理論對本土經驗進行凝練和概括。為此筆者提出了更具本土現實解釋力的“強關系”假設,并在此基礎上開拓了“關系社會學”這一中國主體話語體系的學術研究領域[30],完成了從借鑒西方理論到本土概念創新再到國際傳播的理論創新過程。

(2)文獻挖掘注重相悖的理論邏輯。在提出和深化體育社會學理論問題時,考慮并行和相悖的理論邏輯至關重要,在此基礎上可以提出對立的或有差異的理論假設。例如,在分析體育參與與公民健康不平等的關系時,有研究采納了結構主義和個體主義2 種視角。結構主義強調社會地位和資源對健康的影響,而個體主義側重于個人行為對健康的作用。通過這種對比分析,形成關于體育參與如何影響健康不平等的不同理論假設,如“優勢累積與劣勢效應”“年齡中和效應”等可以進行實證檢驗的假設[31]。這種方法不僅揭示了理論之間的交叉點和潛在沖突,也為理論發展和實證檢驗提供了新的視角。

(3)善于表述理論。表述理論一般有三步工作:嚴格定義概念、確定概念聯系、闡述因果機制。在筆者的《體育社會資本的理論建構和現實意義》[32]一文中,理論表述的第一步是將體育社會資本定義為通過體育活動建立的人際關系和網絡結構,展示了概念定義的嚴謹性和原創性。在確定概念聯系的環節,厘清核心概念間的聯系,表述理論命題。論文探討了體育社會資本與個體健康、社會參與和生活滿意度之間的關系,闡述了這些概念之間的聯系。最后是闡述因果機制,提出了體育社會資本通過增強社會支持和社會網絡來提升個體健康水平和生活滿意度的具體因果機制。

2.4 從深究理論到定量思維

深究理論的直接成果是理論創新。理論創新完成了對前人理論認識的突破,但是這種突破是否具有分析有效性,是否具有科學研究價值,這是需要通過實證數據的定量分析來證明的,即開展定量分析之前需要實現從深究理論到定量思維的轉化,其標志是將抽象的理論概念轉化為可測變量,將抽象的理論命題轉化為可驗證的研究假設。

先看理論概念到可測變量的轉化,即概念的操作化。概念的操作化過程可以分為界定概念維度、將不同維度轉化為指標、設計測量方法3 個步驟。界定概念是指明確理論概念的不同方面或屬性。以“體育參與社會資本量表”的開發為例[33]:第1 步是將社會資本的概念定義為網絡、信任和互惠3 個關鍵組成部分;第2 步是將此3 個維度分別轉化為可測指標,通過一起參與跑步活動的親朋好友數量來測量網絡,通過對這些“同跑者”的信任度打分來測量信任,通過詢問與“同跑者”的各種資源的分享程度來測量互惠;第3 步是通過專家小組對上述3 項指標題器開展有效性評估,通過因子分析來驗證和優化指標,確保較高的指標效度和信度。由此成功地完成了從理論概念到可測變量的轉化。

再看抽象理論命題到可驗證假設的轉化。這是從深究理論到定量思維的關鍵環節。仍以《體育社會資本的理論建構和現實意義》為例,筆者分3 個步驟將抽象的理論命題轉化為可驗證的假設:①理論命題的提出。論文提出了關于體育社會資本促進個體身心健康的理論命題。②理論概念的變量化,即將理論命題中的概念轉化為可測量的變量。由于數據的限制,該文以集體鍛煉項目的參與情況來間接測量體育社會資本的概念,分別用自評健康和壓力感來衡量身體健康與心理健康。③可測量指標的選擇與變量賦值。例如,在體育社會資本的測量中:將不參加任何形式鍛煉的居民賦值為 0,代表不鍛煉群體;將只參加個體項目的居民賦值為 1,代表個體項目鍛煉群體;將既參加集體項目又參加個體項目的群體和只參加集體項目的群體合并,賦值為 2,代表集體項目鍛煉群體。體育社會資本這一抽象概念被具體化為可以通過數據和實證研究來檢驗的變量和指標,從而實現了理論命題向定量思維的轉換。

3 體育社會學定量研究分析證明的困境與對策

如前所述,理論導向的實證研究包括3 個環節(問題、理論和證明),而證明是實現前2 個環節的保證。能否系統而規范地利用數據證明理論認知的真理成分及其條件性,往往對定量實證研究的質量高低起著決定性作用。定量分析作為證明的核心工具,其有效性依賴于3 個關鍵要素:概念測量、數據收集和分析方法。首先,概念測量的準確性直接影響研究結果的有效性。其次,數據收集的全面性和系統性對于確保研究的可靠性至關重要。最后,選擇恰當的分析方法是實現理論驗證的關鍵,這不僅要求研究問題、數據類型、方法模型相互匹配,還需要確保分析過程的規范嚴謹。

3.1 概念測量與數據收集

3.1.1 理論概念的有效測量

對理論概念的準確測量是定量證明的第1 步,也是實證分析規范性的基礎。在國內現有的體育社會學定量研究中,概念測量的信度和效度存在較為突出的問題。理論概念與測量指標的匹配性如果不高會極大地動搖定量研究的根基。例如,一些研究使用被訪者的“每周上網總時長”來測量“人工智能發展”這一概念,就是將產業和地區層面的人工智能發展的宏觀概念降維到個人使用層次進行測量,出現了理論與實證的斷裂、分析單位的錯位,另外也混淆了互聯網使用和人工智能應用這2 種不同的行為,對概念的測量效度不高。這類問題使得實證分析達不到證明理論假設的研究目標,使所有論證的努力都偏離了方向,會帶來對定量分析結果有效性的根本質疑。

要解決測量效度問題,體育社會學研究者應深入挖掘體育學和社會學兩大母學科的學術資源,并采用具有堅實理論基礎和符合學術規范的測量指標。這一過程涉及對母學科理論與方法的深入理解和應用,包括學術理論的歷史演變、關鍵概念的定義發展,以及研究方法的系統構建。概念測量的準確性和系統性可從社會學領域的社會資本經典研究中窺見一斑?;趯涷灥挠^察,一些個體通過社會關系獲得了優勢教育資源和優質的、薪水更高的工作。定量研究者將這一現象概念化為社會資本,包含人際關系及附著的社會資源兩部分[34],并采用3 個指標測量此概念:①達高性,個人中心網絡內部地位最高的關系人及其資源;②異質性,個人中心網絡內部不同關系人的地位及資源的差異幅度;③廣泛性,個人中心網絡內部所有關系人的規模和資源總量[35]。通過定量研究方法的準確測量,學者們將抽象的社會資本概念轉化為可量化的數學形式,從而方便進一步探索其背后的規律。因此,從母學科中汲取學術資源,采用符合學術規范的測量指標,不僅能夠更準確地反映研究對象的實際情況,而且還能夠與母學科中的其他研究形成對話,推動知識積累和理論發展。

3.1.2 一手數據的規范采集

一手數據采集的規范性是實證分析規范化的重要基礎。目前,可供采集的數據類型包括統計數據、調查數據、實驗數據、線上大數據等。統計數據多由國家統計局、國家體育總局等機構收集并公布,獲取較為方便。調查和實驗數據主要由研究者基于研究目標而設計并收集。線上大數據包括人們的數字化行為痕跡,一般通過合作機構或商業化平臺進行采集,或通過技術手段自行獲取。

我國體育社會學領域中相當一部分定量研究使用一手調查數據。一手數據的優勢在于能夠涵蓋研究者所感興趣的相關變量,更好地滿足研究者的需求,更有針對性地達到調查目標。但數據采集過程不規范、數據介紹不充分是現有一手數據研究中普遍存在的問題。近年來在體育社會學高水平期刊發表的定量研究中,有相當一部分沒有對調查的開展過程、抽樣方式、數據收集工具、樣本的特征和構成等重要信息進行詳盡、充分的介紹。因此,對于抽樣偏差對分析結果可能帶來的影響也缺乏重視和討論。數據來源的規范性存疑就會損害樣本代表性,從而影響分析結果的有效性和結論的推廣意義。

在目前體育社會學最為常用的調查數據采集中,需注意調查研究的基本原則。調查研究通過抽樣設計與隨機抽樣的方法確定被調查的人群,并借助結構化的調查問卷,獲得人類行為和態度等信息。規范的調查研究過程需要遵循系統性與客觀性兩大原則。系統性既體現在確定而清晰的抽樣框,還體現在抽樣的隨機性,以保證樣本對于研究對象總體的代表性??陀^性原則體現在:一是調查設計過程中減少研究者的主觀性影響;二是數據收集過程中減少調查員對于被調查者的任何干擾;三是以安全、準確、無偏、共享等原則來使用和傳播數據。對大多數研究者而言,獨立收集系統且客觀的一手大型調查數據是可望不可即的,為此開展廣泛合作建立大型公共數據庫迫在眉睫。

3.1.3 公開數據庫的使用與建設

大型公開數據庫的建立和使用,以及在此基礎上的規范測量,是基于調查數據開展高質量定量研究的重要路徑。目前社會科學領域的理論創新更多是基于已有的公開數據庫,相同領域的研究者往往基于共同的數據展開對話,而體育社會學領域常用的公開數據庫主要是國家統計局、國家體育總局提供的統計數據,雖然具有一定的權威性,但前者涉及體育的指標較少,后者的連續性和結構性不強。

體育社會學公開調查數據庫的缺失已經為該領域的發展帶來阻礙。首先,缺乏能夠共同使用的數據,定量分析就無法得到復制研究和科學檢驗,不同研究結論只能各執一詞,缺乏對話的平臺。其次,相同概念的不同測量方法之間由于樣本、數據來源不同,也無法相互比較、持續優化。再次,對理論假設的檢驗如果不能基于共同的數據和測量來開展,就無法在諸多結果的對比中去偽存真,推進理論的創新和發展。

只有基于優質的公開調查數據和規范的測量,才能形成不同研究之間的對話平臺。以社會學為例,中國社會學定量研究者往往共同使用一些公開大型數據庫展開實證分析,這些數據庫為研究人員提供了豐富的數據資源和開放的對話平臺。已經取得實效、具有廣泛影響的社會學大型數據庫包括:中國人民大學主持的中國綜合社會調查 (CGSS,2003 年至今)、中國社會科學院主持的中國社會狀況綜合調查(CSS,2006 年至今)、西安交通大學主持的“社會網絡與職業經歷”調查(JSNET,2009 年至今)、北京大學主持的中國家庭追蹤調查 (CFPS,2010 年至今)、中山大學主持的中國勞動力動態調查 (CLDS,2012 年至今)?;谶@些公開調查數據,社會學領域持續產出了大量高質量的定量研究成果,對于中國社會學的學科建設厥功至偉。

建立和使用大型體育社會學公開數據庫展開研究,能夠大大提升定量分析的可復制性、可驗證性,使得學術共同體內部形成統一的定量分析規范,也能夠基于相同的數據和分析處理方式,對既有研究進行檢驗和證偽,從而提升體育社會學定量研究的科學性。因此,體育社會學學術共同體內部應建立共識、開展合作、整合資源、共建共享,通過收集一手數據、建設高質量公開數據庫,進一步推進學科發展,為促進體育參與、建設體育強國提供科學依據。

3.2 數據分析與方法選擇

研究方法與研究問題、理論假設的高度契合是理論導向落腳于實證分析的關鍵。目前體育社會學定量研究普遍存在以下2 個問題。①研究方法的選擇與問題、假設或數據不匹配。例如《南稻北麥》就存在此類瑕疵。該文在論述南稻北麥種植方式溢出效應時,基于歷史文化發展進行理論闡述,但是作者使用的是2010 年的截面數據,存在時間謬誤風險,需用跨年代數據驗證。在數據分析中,南北方農民的受教育程度和閑暇時間變量在組內差異大而組間差異小,導致回歸模型中變量系數值低,其統計顯著性可能由大樣本引起。②某些研究過分追求復雜模型,忽視基礎方法和描述統計的價值。特別應該避免的做法是,在沒有進行數據描述和初步分析的前提下,就開始進行回歸分析和反事實模型分析,這會讓讀者無法分析樣本的基本狀況,無法識別復雜模型分析的有效性。定量分析的目的是證明理論假設是否成立,而對定量研究方法的不求甚解和一味炫技會將簡單問題復雜化,導致分析結果看似精美繁復,實則空洞平庸經不起推敲。分析方法與數據結構、研究問題的匹配才是選擇分析方法的最佳標準。為此,筆者強調數據分析的以下3 類有用性。

3.2.1 單變量描述的有用性

描述研究問題是科學研究的基礎。為此,數據的準確描述是獲取確切結果、形成有效知識傳播的重要前提。在社會科學領域,盡管復雜的社會現象很難用符號和公式充分描述,但定量研究通過變量形式提供了描述體育現象的有用手段。在單變量描述分析中,頻數分布、集中趨勢、離散趨勢等關鍵統計量有助于理解變量的基本屬性,例如,均值和標準差不僅能用于群體間比較,識別差異,還能分析樣本的代表性。比較實驗組和控制組的均值和方差能夠揭示不同體育鍛煉方式對健康狀況的潛在影響。頻數分布有助于發現異常值,驗證變量測量的有效性。

結合一些新的數據形態,單變量描述統計還能揭示潛在的趨勢和模式,為深入分析提供重要線索。例如:在搜索引擎數據中,某些賽事搜索熱度的時間變化趨勢與空間分布特征可以描述體育賽事關注度的時空規律[36];來自可穿戴設備和運動應用程序的數據描述可以實時反映鍛煉者的生理狀態、使用情況、身體活動變化等重要信息[37]。

3.2.2 多變量分析的有用性

多變量分析通常以可視化和數學建模的形式探索和確證變量間的關系,包括從簡單到復雜的因果關系。多變量分析可以識別哪些變量顯著影響某一結果,以及它們之間因果關系的方向、條件和路徑。例如,筆者在《找回強關系:中國的間接關系、網絡橋梁和求職》一文中,通過數學建模驗證了強關系在中國求職時的優勢作用,進一步提升了中國的關系研究在國際上的影響力[38]。多變量分析中的多元回歸模型允許研究者在控制其他影響因素后,更準確地評估感興趣的自變量的凈效應;多變量分析還允許聯合估計多個回歸方程;各類反事實模型可以在排除混淆變量的干擾后更準確地推斷因果關系的存在、大小與方向。

擬合優度較高的多變量模型可以用于對未來事件發展方向進行預測。例如,回歸分析既可以用來預測運動與健康的關系,也可以解釋疾病發病率與環境因素之間的聯系。近年來,備受青睞的大數據已經被廣泛應用到經濟、政治與社會研究的眾多領域中預測個體或群體的行為。研究者可以使用不同的多變量模型來比較不同的理論假設或解釋機制,以找出最佳的模型解釋觀察到的數據??傊?,多變量分析提供了多層次的工具和方法,可以幫助研究者更深入地理解數據、發現因果關系、預測未來趨勢,支持科學決策和政策評估。

3.2.3 推論分析的有用性

首先,定量分析有助于獲得有效研究結論。嚴密的研究設計能夠清晰界定研究問題,確定適當的數據采集方法;用大樣本和隨機抽樣保證樣本的代表性,有效降低選擇偏差;用問卷調查和實驗觀察等精確的測量工具確保數據的可信度和準確性;用恰當的統計方法來分析數據,保證結果的可靠性;以數值形式呈現結果使之易于理解和解釋。其次,定量分析的代表性樣本和科學性質使其結論可以被廣泛推廣至其他研究和情境,有助于科學研究的復現和擴展。最后,定量分析的方法和結論可以在不同學科領域之間傳播和應用。例如,體育學定量研究可以用來評估體育設施建設對當地經濟的影響。經濟學家可以借助這些研究來確定新體育場館、體育中心或運動場的建設是否值得投資。定量分析之所以成為科學的推論工具,依賴于其使用的一套可復現、可驗證、可交流的數學語言,這為定量研究在各領域和學科中的應用提供了堅實基礎。

3.3 內生性問題與因果推斷

回歸分析是基于調查數據開展推斷統計分析最重要的工具,通常用于探究和檢驗多變量間的相互依賴關系。但由于缺乏嚴格的實驗設計,使用基于調查數據的社會科學回歸模型分析得出的因果結論一直面臨著內生性問題的困擾。內生性問題在計量經濟學中廣泛指代解釋變量與殘差相關的現象。忽略內生性問題會違背高斯-馬爾可夫定理,導致產生有偏的估計量[39]。直到20 世紀70 年代唐納德·魯賓(Donald Rubin)提出潛在結果模型,才真正揭開了因果推斷的時代序幕[40],多種反事實因果模型相繼而生。近年來,“貝葉斯網絡之父”朱迪亞·珀爾(Judea Pearl)提出了與“潛在結果框架”相對應的“結構因果框架”,通過構建關鍵要素的因果圖描述變量之間的因果關系,研究者能夠更加直觀地進行因果效應的定量評估[41]。因果推斷向調查數據中注入了像自然科學實驗數據那樣的隨機性,盡可能得到對因果關系更為可靠的估計。

近十年來,我國經濟學和社會學領域在應對統計分析的內生性問題上已經達到國際前沿水平[42],但是體育社會學研究者對此問題仍然重視不足?!赌系颈丙湣肥巧贁抵匾晝壬詥栴}、開展反事實模型分析的體育社會學論文之一。即使如此,《南稻北麥》所使用的反事實模型未必徹底排除了內生性問題。例如,作者選取的“省級年平均氣溫與降水量”是否嚴格滿足工具變量的全部條件,值得商榷。又如,文中的工具變量與因變量直接相關,氣溫和降水量在一定程度上也能夠直接影響居民的體育參與,尤其是戶外體育鍛煉的參與。此時模型中觀察到的統計顯著性可能不是由變量之間真實的關聯關系引起的,而是由其他因素造成的。此外,傾向值匹配分析的樣本量僅存不足25% 容易導致樣本嚴重偏誤,也可能會影響模型結果的推論價值。

在體育社會學定量研究中,首先要對內生性問題的來源具有清晰的認識和區分,才能在此基礎上選擇不同方法。例如,針對聯立性因果帶來的內生性問題,可以引入時間序列,通過面板數據的固定效應模型來解決。對于遺漏變量導致的內生性問題,工具變量法是較為常見的處理策略。對于樣本選擇偏誤可以用樣本選擇模型來解決,對于自選擇偏誤可以用傾向值匹配法來解決[43]。下文筆者針對體育鍛煉(解釋變量)與健康狀況(結果變量)的因果關系,推介下列幾種反事實模型的應用方法。

(1)工具變量法。此方法通過引入與解釋變量(體育鍛煉)相關但與隨機誤差項無關,而且與結果變量(健康狀況)無直接關聯的第3 個變量來解決內生性問題[44]。例如,使用地區體育設施的可獲得性作為體育鍛煉的工具變量。2021 年的3 位諾貝爾經濟學獎得主正是因引領了因果推斷和經濟學中自然實驗的興起、改進了工具變量法而獲此殊榮。已有研究運用這一方法分析體育鍛煉對青少年非認知能力的影響[45]、估計體育鍛煉習慣為居民帶來的收入優勢[46]等問題。在難以找到合適工具變量的情況下,隨機前沿模型等新技術也可用于處理內生性問題。該模型使用Copula 方法度量內生自變量和隨機項的相關性,然后使用數值積分和極大模擬似然方法估計目標模型[47]。

(2)雙重差分法。此方法能夠控制不隨時間變化的不可觀測因素,并估計干預措施的因果效應。通過比較處理組(參與體育鍛煉的人群)和對照組(未參與體育鍛煉的人群)在干預前后的健康狀況變化來估計體育鍛煉的效果[48]。假設某地區新建了一批體育設施,可以將這個地區的居民作為處理組,而另一個未建設體育設施的相似地區居民作為控制組。比較兩組在建設前后健康狀況的變化差異,這個差異的差異(“雙重差分”)即可被認為是體育鍛煉對健康影響的凈估計。合成控制法、回歸合成法與此原理類似。我國體育社會學領域已經出現了相關方法的應用探索,通過對比實際情況和“反事實”情況的差值,評估北京2022 年冬奧會對北京旅游業的影響[49]。

(3)斷點回歸設計。經濟學領域常用的斷點回歸設計由諾貝爾經濟學獎獲得者Imbens 等[50]提出,通過利用自然發生的“間斷點”來解決內生性問題。斷點回歸設計假設在某個特定間斷點附近其他所有條件都保持不變,只有一個關鍵變量發生了改變[50]。通過比較間斷點兩側的數據,可以估計這個關鍵變量對結果的影響,有效分離因果關系和其他可能的影響因素。假設某個城市為65 歲以上的老人提供免費的體育設施使用權,可將65 歲作為間斷點,通過比較小于和大于65 歲兩類人群的健康狀況差異,估計免費體育設施政策對健康的影響。已有研究[51]利用強制退休制度,用體育鍛煉參與在法定退休年齡前后的極限值之差來識別退休對體育鍛煉參與的因果效應。

(4)固定效應模型。如果有同一批樣本的體育鍛煉和健康狀況的多期追蹤數據,可以使用固定效應模型來控制不隨時間變化的個體特征(如性別、遺傳因素等)和混淆因素,只分析體育鍛煉行為變化與健康狀況變化之間的關系。此外,基于多期追蹤數據,還可以使用交叉滯后面板模型(cross-lagged panel model),引入時間效應,從而分離并估計出解釋變量和被解釋變量之間的雙向因果效應。該方法在運動生理學領域已有諸多應用,但在體育社會學研究中尚不普遍[52]。

(5)傾向值匹配模型。傾向值匹配是指通過匹配樣本中處理組和對照組中相似的個體來模擬隨機分配的情況[53]?;谀挲g、性別、社會經濟地位等可觀測的個體特征,為每個樣本計算其進行體育鍛煉的概率,即傾向得分。將鍛煉的個體(處理組)與未鍛煉但在傾向得分上相似的個體(對照組)進行匹配,確保處理組和對照組在其他重要特征上是相似的。通過比較匹配后的處理組和對照組在健康指標上的差異,可以估算出體育鍛煉的凈效應。

4 結論與展望

4.1 結 論

體育社會學領域中的定量研究不僅是必要的,更是推動該領域科學發展的關鍵要素。從經濟學、社會學和體育學的發展脈絡可以看出,定量研究在社會科學研究中占據著重要和主流的地位,其客觀性、精確性和可重復性有助于深入理解體育現象,驗證理論假設,實現理論創新。

我國目前的體育社會學定量研究雖然存在諸多困境,但可以從定量研究的3 個核心環節來解決困境、提高質量,即想問題、究理論、重證明?!跋雴栴}”的要領是首先從經驗觀察中發現現實問題,進而將現實問題用理論概念抽象為學術研究問題,最后以變量思維將學術研究問題操作化為可量化、可觀察的測量指標?!熬坷碚摗钡年P鍵是將研究問題的本質通過抽象概念來把握,將概念之間的關系通過理論命題和研究假設來表述,并力求在概念、命題、假設等要素上都有學術創新和突破?!爸刈C明”的途徑是努力把握概念測量的準確性、數據收集的規范性和分析方法的匹配性,同時嘗試使用恰當的因果推斷方法來解決相應的內生性問題。盡管面臨概念測量和數據收集的挑戰,但標準化的數據收集、規范的測量、恰當選擇和使用研究方法,以及公共數據庫的建設,可以幫助研究者有效地克服這些障礙。

4.2 展 望

數據科學的興起為包括體育社會學在內在所有社會科學的定量研究創造了新的發展機遇。在計算科學、機器學習、人工智能等新技術日益普及的時代,新設備、新數據的可及性不斷提高,推動社會科學研究范式轉型,但在體育社會學領域,利用這些新形態的數據、技術和方法進行的定量分析還十分有限。例如,在人工智能的運用方面,目前國內體育學研究主要集中于自然科學尤其是工程應用領域,而體育社會學領域還停留在圍繞這類新興技術的理論性探討和綜述[54-56],尚未出現數量可觀、質量過硬的實證研究。少數已有研究[57-58]對大數據、人工智能等新興技術的應用分析也不夠深入。未來的體育社會學研究可以從以下不同的方向繼續探索。

(1)計算社會科學賦能理論創新。隨著社會科學和計算科學的深度交叉融合,學者已提出“計算扎根”的新范式[56],強調通過數據挖掘、機器學習和歸因算法篩選自變量,提出新的理論假設,推動理論創新[59]。結合新興的數據結構和計算科學方法,可以幫助體育社會學定量研究建構理論體系、提升問題意識,使理論導向與新方法、新技術相輔相成。新興的數據結構和計算科學方法使得研究者可以從大量數據中尋找模式和關系,驗證和改進現有理論,并在必要時建構新的理論框架[60]。這種方法論強調數據和理論之間的動態互動,鼓勵研究者在數據分析和理論構建之間尋求平衡,提高了對復雜社會現象的預測能力。計算社會科學將社會科學理論導向與新數據、新技術融為一體。這種融合不僅為大數據分析提供了新的研究議題和問題意識,而且在數據挖掘的結果中還可以找到建構和驗證理論的線索,從而推動預測模型的建構。計算社會科學的發展將社會科學理論引入數據挖掘之中,不僅能夠使用新形態的數據來驗證理論中發展出來的假設,而且在理論機制不夠明晰時,也能從數據挖掘結果中得到啟發。通過解釋數據挖掘的結果,與相關理論開展對話,能夠驗證已有理論、發展新興理論[61]。

(2)新興數據形態拓寬機制分析。物聯網和分布式存儲等信息技術的發展使非結構化大數據在社會科學研究中的應用增加。相較于問卷調查,大數據有諸多優勢:一是降低經濟、時間、人力成本,提升時效性;二是解決樣本代表性不足問題,減少抽樣偏差;三是不受傳統統計假設限制,可用復雜編程語言分析人類行為[62-63]。此外,大數據為社會科學研究者帶來了宏觀視角,研究者得以用較低的成本獲得傳統方法難以企及的宏觀指標及其隨時間變化的全過程[64],為體育政策制定和體育活動的組織提供數據支持。例如,通過分析社交媒體平臺上的在線討論、活動分享,以及圍繞特定體育事件的輿情數據,可以了解體育活動參與者的互動模式和社會關系,研究大型體育賽事(如奧運會、足球世界杯賽、馬拉松)對城市或國家的社會影響。線上大數據與時序分析、空間分析方法相結合,可以分析賽事前后的社交媒體情緒變化、參與者和觀眾的地理分布[65],以及賽事對本地經濟和社會結構的長期影響。通過類似的分析,可以更好地理解體育賽事如何塑造國家認同、促進國際交流、影響社會心態。通過分析健身追蹤器和智能手表等可穿戴設備收集的行為數據,研究人員可以更好地理解體育活動對個人健康的影響[66]。如果能夠將參與者的運動頻率、強度、持續時間、生理響應(如心率、能量消耗)與問卷調查所反映的社會因素相結合,就能提供具有社會學意義的深刻洞見。

(3)前沿技術應用推進范式革新。機器學習和人工智能技術可以用于分析和預測體育活動對個體和群體的影響,催生了“社會預測”[67]、“理論與數據雙向驅動”[68]、“理論引導的大數據分析”[61]等兼具學術價值、治理價值和話語價值的新范式。機器學習技術改變了傳統體育社會學只能實現關聯分析和因果分析而無法進行預測的歷史。例如,機器學習可以基于歷史數據來預測體育活動參與度的變化趨勢,或者預測特定體育項目對特定人群健康的潛在影響,為體育政策制定和活動組織提供更有針對性的數據支持[69]。我國體育社會學領域目前也出現了采用機器學習算法對奧運冠軍臨場運動表現的影響因素進行的分類分析[70],以及將ChatGPT 用于輔助體育社會學文獻梳理和數據分析的技術性實踐總結[71]。這都是體育社會學定量研究中具有重要意義的探索。

新數據、新技術和新方法的應用能夠賦能理論創新、揭示新的因果機制、催生新的研究范式。未來的體育社會學研究不會再局限于單一范式,而應融合過程思維、結構思維、反事實思維和前景思維等多種思維途徑[72]。多元化的研究范式結合新數據、新技術和新的因果識別策略,將會為體育社會學定量研究帶來新的機遇和可能。體育社會學定量研究應積極利用新技術和新方法,不僅關注實證分析的規范性和創新性,更要探索數據和現象背后深層次的社會機制,以開展更富有理論價值、現實意義和國際影響力的研究。

致謝在本文修改過程中,科羅拉多大學張磊博士、西安交通大學繆曉雷博士提出了建設性意見,特此致謝。

作者貢獻聲明:

邊燕杰:確定論文選題,提出核心觀點和理論框架,指導撰寫論文,修改審定論文;

張伊雪:梳理相關文獻,起草論文,修訂體例;

魯肖麟:修改論文框架,梳理相關文獻,撰寫論文。

猜你喜歡
社會學定量理論
堅持理論創新
神秘的混沌理論
中國社會學會農業社會學專業委員會成立
理論創新 引領百年
邊疆研究的社會學理路——兼論邊疆社會學學科建構之必要性
相關于撓理論的Baer模
顯微定量法鑒別林下山參和園參
第八屆全全科學社會學學術會議通知
當歸和歐當歸的定性與定量鑒別
10 種中藥制劑中柴胡的定量測定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合