?

方言文化與廣東省內人口流動
——基于百度遷徙大數據的研究①

2023-12-25 05:00胡少東林曉博
南方人口 2023年6期
關鍵詞:方言廣東省人口

胡少東 林曉博

(汕頭大學 商學院,廣東 汕頭,515063)

1 引言

“雞同鴨講眼碌碌?!边@是廣東家喻戶曉的《外來媳婦本地郎》的歌詞,形容21 世紀初匯聚不同方言背景的廣東家庭成員交流情況。廣東省作為我國改革開放的前沿地區,一直是全國熱門的人口遷入地。流動人口以省外流入為主,而且集中在珠三角地區[1-2]。然而,近些年來,廣東省的跨省流入規模在縮減,但省內流動人口持續增長[3]。截至2020 年第七次全國人口普查,廣東省省內流動人口超過兩千萬人,占全省流動人口總數的43%。

廣東省是我國漢語方言最復雜的省份之一,省內方言紛繁復雜、犬牙交錯[4]。主要分布著粵方言、閩方言以及客家方言三個方言大區,具體可以細分為11 個方言片。隨著普通話的推廣,普通話已成為人們在正式場合使用的語言。不過,在非正式場合,人們的用語并沒有明確的規定[5]。廣東省語委2014 年在深圳、珠海和汕頭開展調查發現,這三個地方的居民一方面既高度認同普通話,另一方面又習慣在非正式場合使用自己的母語方言進行交流[6]。此外,在粵東地區,只有一半的受訪者表示會在工作場合使用普通話進行交流[7]??梢?,方言依然流行于廣東居民的日常生活中,形成了方言和普通話并用的情況??紤]到語言能夠影響到人口流動的決策[8],地級市之間的方言文化差異是否會影響省內人口的流動呢?

本文借助“百度遷徙”所收集到的海量人口流動數據,從社會網絡角度分析廣東省省內人口流動情況。同時,實證探究廣東省內地級市之間的方言文化差異對于省內人口流動的影響作用。相較于現有研究,本文的貢獻可能有兩個方面:第一,本文將從文化的視角解釋廣東省省內人口流動,補充了廣東省省內人口流動的影響因素研究。第二,借助實時和海量的數據把握廣東省省內人口流動的情況與變化,為廣東省各地因地制宜地制定人口政策提供參考。

2 文獻綜述

地區之間語言的同質性和相似性增加了人口流動的可能性,語言的差異則會形成人口跨地區流動的非正式壁壘[9-11]。在德國,標準德語的普及減少了人們交流的困難,但是德語方言在現代社會中更體現為一種持久的地區文化差異,仍對人口遷移產生顯著影響[12]。在我國,勞動力流動的范圍在空間距離上會更偏好鄰近城市,在空間位置上則是偏好方言相近、文化背景相似的地方,而普通話的推廣能夠有效減少文化的負向作用,從而促進勞動力跨文化區域流動[8][13-14]。相關研究認為方言距離對勞動力流動的影響是呈現出先促進、后抑制的倒U形結構[15]。

語言主要通過信息溝通、身份認同和人力資本這三個方面影響人口流動決策。首先,語言是交流的載體。唐寅在《閶門即事》中寫道“五更市賣何曾絕?四遠方言總不同?!蔽覈莻€多方言的國家,北方地區的方言內部差異不大,溝通較為方便;而南方地區的方言種類多,語音、語調等都比較復雜,方言之間存在著較大的差異,造成人們交流中存在一定的障礙[16-17]。其次,語言會影響身份認同?!额伿霞矣枴ひ艮o》中寫道:“夫九州之人,言語不同,生民已來,固常然矣?!狈窖允侨藗冇脕韰^分不同群體的工具之一,人們在交談過程中往往會根據口音來判斷彼此身份[18]。在一些方言占強勢地位的地區,語言的差異不僅會讓外來人口被貼上“外來人”標簽,同時還會讓他們感受到來自主流社會的排斥,使得他們難以融入當地[5]。最后,語言能力是一項人力資本。掌握方言溝通可以有助于外來人口擴大在當地的社交網絡和提高自身的社會認同度,減少創業壁壘,增加遷入人口創業機會,增加收入,提高定居的可能性[19]。

廣東省是我國人口流動活躍的地區之一。同時,透過人口普查和全國流動人口動態監測調查數據,可以發現珠三角城市群的省內流入人口增速要快于省際流入,在此趨勢下珠三角城市群流入人口將逐漸呈現省內和省際并重的特征[20]。

通過總結已有研究可以發現:第一,廣東省內人口流動比重在增加,這會成為未來省內人口流動趨勢。目前關于廣東省內人口流動的研究還仍不足,而且基本是借助人口普查數據。隨著人口流動的變化,需要借助及時、海量的數量來分析以便更好了解人口流動變化。第二,對于人口流動影響因素的研究從經濟、社會層面拓展到更為深層的文化層面。文化的差異會增加人口跨地區流動的負擔從而阻礙人口的流動。我國疆域廣闊、方言眾多,“十里不同音”,即使在一個省內,也是存在多樣化的方言文化。方言對于同一省內的人口流動是否會產生影響?特別是占比較高的廣東省內人口流動,是否會受到方言文化差異的影響?現有研究尚未探討這個問題。

3 廣東省省內人口流動網絡

大數據時代的到來使得海量的人口流動可以被及時觀察到。本文將采用百度地圖慧眼平臺(https://qianxi.baidu.com/#/)提供的人口遷徙大數據進行研究。百度地圖平臺為用戶手機里的APP 提供定位服務,服務范圍涵蓋航空、鐵路、公路等交通運輸方式。百度地圖平臺可以基于定位服務判斷用戶所在位置的變化來分析用戶的流動軌跡,是國內數據源最廣的LBS(Location Based Service)平臺[21]。該平臺通過采集用戶位置信息進行處理,從而得出每日各省市的人口流動數據,并按日公布數據,實現人口流動數據的及時性和可視化。

春運是中國獨特文化現象,一年一度的大規模返鄉是中國人口流動的寫照。大量人口被經濟發達、資源更豐富的地區所吸引,但以戶籍制度為基礎的二元社會體制存在,這些流動人口大多只能以“暫住居民”的身份生活在城市中。中國人具有濃厚的鄉土情結,春節回家團聚是中國人一年一度的重要儀式。大批外出人口會在春節前一段時間里集中返鄉過年,過年后又會返回到城市工作[14]。因此,春運期間的數據對于反映我國區域間人口流動的方向具有特殊作用[22]。

根據國家發改委的信息,2020 年春運的起始時間為“2020 年1 月10 日(臘月十六)到2020年2 月18 日(正月二十五)”。2020 年春節期間新冠疫情爆發,為有效控制疫情,我國部分地區采取交通管制、旅行限制等措施,使人口的跨區域流動受到一定影響。但是,2020 年春節前,人口跨區域流動受到的限制極小[23],在一定程度上可反映正常情況下的人員流動情況??紤]到疫情防控從2020 年1 月24 日開始且省內城市地理距離較近,為更好反映人口返鄉情況,本文選擇春節前一周的人口流動數據作為研究,并收集了廣東省21 個地級市在2020 年1 月17 日(農歷臘月二十三)至2020 年1 月23 日(農歷臘月二十九)期間人口流動的數據。同時收集了2023 年農歷同時期(2023 年1 月14 日至2023 年1 月20 日)的人口流動數據,以對比兩個時期人口流動的網絡。

百度遷徙頁面里提供的不是i 地流向j 地具體人數,而是i 地流向j 地的人口數占i 地總流出人口數的比例,是一個相對重要數值,需要進行處理[24]。同時,頁面中還提供了每個城市的“遷徙規模指數”。根據百度平臺的解釋,這個指數可用來反映遷入或遷出人口規模,城市間的數值可進行橫向對比。因此本文將百度遷徙頁面提供的每個城市每日的“遷出規模指數”乘以遷往每個城市的比例從而得到每日i 地流向j 地的指數,加總形成研究時間段內i 地遷往j 地的指數[23],具體如下:

其中,Tindexi,j為i 地在t 時間段內前往j 地的總指數;indexi,t為i 地每日的遷出指數;percenti,j,t為每日i 地遷出人口中遷往j 地的占比。

最后,本文構建了以流出地為縱坐標和流入地為橫坐標的關系矩陣,并利用遷移指數(Tindexi,j)作為邊的權重,得到一個21*21 的有向多值網絡矩陣,用于分析廣東省省內人口流動情況。同時借助Gephi 軟件將人口流動網絡進行可視化。其中,節點越大表示度數越大,點之間的連邊越粗則表示權重越大,見圖1 和圖2。

圖1 2020 年廣東省內人口流動網絡

圖2 2023 年廣東省內人口流動網絡

Gephi 軟件的模塊化功能可以借助節點之間的聯系緊密程度的大小對節點做歸類,將網絡中的節點劃分到不同的子群當中。模塊化表明了同一個社區成員之間存在著較高的密集和相對較強的、直接的或者積極的聯系,因此這個功能可以用于網絡中的社會發現[25]。為了研究人口流動關系,本文借助Gephi 軟件的模塊化功能將網絡進行模塊化,結果見表1。

表1 網絡模塊化結果

表2 變量描述性統計

同一模塊中大多城市都在地理位置上相近或接壤,例如模塊1 中的廣州市與佛山市,模塊2中的深圳市與惠州市,模塊3 中的粵東潮汕揭三市。除外,還發現各模塊中的城市在方言文化之間具有一定程度的相似性。2020 年模塊1 的“廣州市、佛山市、江門市”在方言上都是使用粵語中的廣府片,在2023 年模塊1 中的城市里也分布著粵語方言。在模塊2 中,2020 年深圳市、惠州市、韶關市都是既有使用粵語也有客家方言的城市,2023 年的城市大多都是有使用粵語或者客家方言的,例如深圳市、東莞市、河源市、梅州市。另外,模塊3 中兩個時期的城市保持穩定,均是粵東地區的“汕頭市、揭陽市、潮州市”,這三個城市不僅地理上相近,而且文化高度同源,均使用閩語中的潮汕片??傊?,廣東省省內城際人口流動在除了地理距離上的關聯性外,在方言文化上也具有相近性。

4 方言距離對廣東省省內人口流動影響實證分析

在上述網絡分析中,人口流動關系密切的城市在方言文化上存在著相近性。方言距離是否會對廣東省省內人口流動存在一定的影響?為避免疫情防控對人口流動的影響,本文將選取2020年春 節前(2020 年1 月17 日至2020 年1 月23 日)即人口正常流動狀態下的數據作為研究數據。

4.1 模型構建

在現有的文獻中,引力模型常被用來分析區域之間人口流動。最早的引力模型來源于物理學中的萬有引力公式,后來被應用到人口流動的研究當中。在基礎引力模型中,地區的人口流動是由遷出地與遷入地之間的地理距離以及這兩地的人口規模所決定的,見公式(2):

對公式(2)的等式兩邊取對數可以得到公式(3):

若以i 地為人口的遷出地,j 地為人口的遷入地,則公式(3)中的Mij表示從i 地遷往j 地的人口規模,POPi和POPj分別表示i 地和j 地的人口規模,DISij則代表i 地和j 地的地理距離。

本文借鑒已有研究做法[12]使用修正的引力模型檢驗德國方言對德國歷史上人口流動影響的做法,在公式(3)的基礎上加入了方言文化距離和相關控制變量得到公式(4):

其中,DIAij為i 地和j 地之間的方言距離變量以衡量遷入地與遷出地的方言文化差異,Eij代表相關的控制變量。

4.2 變量處理及描述性統計

4.2.1 解釋變量:方言距離

鑒于數據可得性,本文使用的賦值測量方法來構建廣東省21 個地級市之間的方言距離指標的[15]。首先根據廣東省現行的行政區域將1986 年廣東省各縣匹配到2020 年的地級市當中。然后,對縣與縣之間的方言差異進行賦值,具體規則為:如果兩個縣使用的方言屬于同一方言片,那么我們賦值1;如果兩個縣使用的方言屬于同一方言區中的不同方言片,就賦值為2;如果兩個縣使用的方言是同一方言大區而方言區不相同時,賦值為3;如果兩個縣分別屬于不同的方言大區則賦值為4。方言數據采用徐現祥團隊的研究結果[26]。同時,考慮到地區之間方言的使用范圍及影響力,對方言差異進行人口加權,利用公式(5)計算出地級市之間的方言距離。

其中,假設i 縣和j 縣分別由A 市和B 市管轄,diaij是根據i 縣和j 縣的方言差異賦值規則得到的數值。POPAi和POPBj分別表示i 縣人口占A 市的總人口比重和j 縣人口占B 市的總人口比重。由于使用的數據是按照1986 年我國的行政區劃登記各縣方言,為了更好地匹配上各縣人口數據,本文使用距離1986 年最近的《人口普查分縣資料2000》中各縣的人口數據。DIAA,B則為經過人口數量加權計算得出的地級市方言距離。

4.2.2.被解釋變量:人口流動

隨著我國戶籍制度改革的推進和地區交通基礎設施的完善等,中國的流動人口在快速增長。戶籍制度雖然對公民在非戶籍地定居有一定的阻礙作用,但對其自由流動選擇是沒有任何影響的。流動人口的增多和流動行為的多樣化也使得在現在的實證研究中對于“人口遷徙”和“人口流動”這兩個概念也不再進行明確的區別[27]。本文采用的人口流動數據來源于“百度遷徙”,平臺提供的數據是關于城市之間人口的流動比例。在現有研究中[8][28],學者們使用地區的人口遷移率研究方言文化對人口遷移影響。由于在“春運”期間流動人口主要是從外地返回其家鄉,為了更好地反映城市之間的流動,本文采用春運期間人口遷入來源地的比重來衡量人口在日常流向其他城市的數據,然后計算研究時間內數據的平均值形成人口流動數據。

4.2.3.其他控制變量

本文結合引力模型以及相關研究,在實證中控制了影響人口流動的其他因素。第一,地理距離?,F有研究認為地理距離對人口流動和遷徙有重要的影響。廣東省在地理上東西跨度較大。因此,本文借助百度地圖獲取21 個地級市的經緯度數據,計算出兩兩之間的地理距離。第二,是否接壤。根據兩個城市是否接壤可以來刻畫城市的區位特征[28]。對此,本文將通過設置虛擬變量來表示城市之間是否接壤,如果兩個城市有交界則記為1,沒有交界則記為0。第三,經濟發展水平差異?,F有研究表明地區之間的發展差異、就業機會、工資水平是促進人口流動的經濟動因。本文以兩地之間的人均GDP 差值的絕對值來衡量地區經濟發展水平差異。此外,實證分析中還考慮了地區人口規模,采用各市年末戶籍人口數進行衡量。相關數據均來源于《廣東統計年鑒2020》。

4.3 實證結果及分析

4.3.1.基準回歸結果

為了探究方言距離對于廣東省省內人口流動的影響,本文使用公式(4)作為基準回歸方程,具體的估計結果如表3 所示。首先,第(1)列只將方言距離和人口流動分別作為解釋變量和被解釋變量,回歸結果顯示兩者具有相關性而且“方言距離”顯著為負,這表明兩地的方言距離越大則省內人口流動的可能性會越低。然后我們在第(2)列和第(3)列中進一步控制了地理因素、人口規模、經濟發展因素和地區固定效應??梢?,“地理距離”的估計系數顯著為負,說明城市之間的地理距離較近則人口流動的可能性比較高。同時,經濟因素對廣東省省內流動具有顯著影響,經濟發展水平差異越大,人口流動的可能性會更大,經濟發展水平是影響人口流動的重要因素。在控制上述變量后,本文關注的“方言距離”的估計系數依舊為負數而且通過顯著水平檢驗,顯示了城市的方言文化因素對于人口流動具有一定的影響,即兩地的方言距離會顯著降低人口流出的可能性。因此,如果遷入地和遷出地有相近的方言文化則能夠有效地減少流動人口的交流困難,加強身份認同,從而增加了人口流動的可能性。

表3 基準回歸結果

4.3.2.穩健性分析

(1)更換變量指標

首先,參照現有研究做法[14],本文構建城市人口流動機會比率來替換被解釋變量。人口流動機會比率意思為:對于流出地i 而言,人口流動到j 地的概率與沒有流動到j 地的概率比值。其計算方式見公式(6):

其中,odds 表示人口流動機會比率,p 表示從i 地流向j 地在觀測期間的平均比重。本文將被解釋變量由“人口流動比例”變更為“人口流動機會比率”。將人口流動機會比率作為被解釋變量進行回歸,回歸結果如表4 第(1)列所示。估計結果與基準回歸結果接近,說明人口流動的衡量指標變更不會影響到我們回歸結論。

表4 穩健性檢驗結果

在方言距離的測量中,對于方言差異采用“1-2-3-4”的賦值方法可能存在主觀性。為此,根據各縣方言的不同,將方言差異賦值數值由“1-2-3-4”調整為“1-5-25-50”,得到新的方言距離數據?;貧w估計結果在表4 的第(2)列。由于“1-5-25-50”的數值比“1-2-3-4”要大,因此得到的方言距離也變大,回歸系數仍通過顯著性檢驗,而且依然為負數,估計結果穩健。

(2)子樣本回歸

雖然百度遷徙平臺是根據海量用戶的定位信息形成的數據,但是目前數據仍無法獲取每個個體的具體信息。有些個體可能是由廣東省外到達廣東省內城市再轉回目的地或者從廣東省內某個城市出發經過中轉后返回其他省份,這時候該地就可能不是流動人員真正的遷出地或者遷入地,而是其從廣東省外返鄉或者從廣東省內返回外省的一個中轉城市。為了減少這部分的影響使得結果更為穩健,本文剔除了廣州市和深圳市的樣本,原因在于這兩座城市既是廣東省經濟中心,也是廣東省的兩大綜合交通樞紐,是重要的目的地和中轉地。剔除后的子樣本回歸結果如表4 第(3)列所示,檢驗結果沒有發生大的變化,所有變量仍保持顯著。同時,可以發現經濟發展水平差異的重要性有所下降,而地理距離和方言文化的影響較基準回歸結果有所上升。

(3)變化研究時間段

2023 年我國對新型冠狀病毒感染調整為“乙類乙管”,經濟社會有序恢復正常。本文收集了2023 年農歷同時期(2023 年1 月14 日至2023 年1 月20 日)的人口流動數據以檢驗研究結論。表4 的第(4)列結果顯示,在2023 年,廣東省內人口流動同樣受到方言文化的影響,即方言文化越接近,人口流動越密切。

4.3.3.內生性檢驗

人口流動現狀可能會受到早期的移民活動、流動人口的個體社會關系等因素的影響,在回歸中遺漏了不可觀測的變量,從而形成內生性問題。

戲劇藝術具有濃厚的地方特色,我國民間的戲曲大部分是采用當地語言進行表演的[29]。由于表演語言的特殊性,戲劇的受眾群體通常是使用該種方言的居民[30]。廣東省的戲劇類型分布與省內的方言區劃在地理上基本重合[31],例如,以閩語潮汕話演唱的潮劇主要流行在粵東潮汕方言地區,在省內其他地區則難以見到潮劇的表演。同時,戲劇是在長久歷史積淀中形成的文化,與方言文化存在相關性,而對于現代人口流動則不產生影響,因此選做工具變量是合適的。

本文根據《廣東省地方戲曲劇種普查報告(2019)》對于廣東省21 個地級市本土戲曲劇種的調查結果設置虛擬變量,即如果兩個城市的本土戲曲劇種相同記為1,有差異則記為0,從而形成方言距離的工具變量。本文采用2SLS 方法進行內生性檢驗,結果見表5,第一階段的結果顯示方言距離與兩地戲曲類型差異存在顯著的負相關關系,戲曲種類相同的地區方言距離會越小。第一階段的F 值為24.38。根據經驗法則,該數值大于10 則可以排除弱工具變量問題。在使用工具變量之后,第(2)列中方言距離的估計系數依然顯著為負。

表5 內生性檢驗

5 研究結論與建議

傳統的人口理論關注經濟因素、家庭因素等對人口流動決策的影響,如推拉理論、新勞動遷移理論。不過這些理論并沒有關注到方言文化對人口流動決策的影響?!吧傩‰x家老大回,鄉音無改鬢毛衰?!弊孕×暤玫姆窖园殡S并影響著人的一生。本文的研究表明,方言文化是影響人口流動決策的重要因素之一,人口理論需要加強對方言文化的關注。

本文基于百度遷徙大數據研究得出:第一,在廣東省內人口流動網絡中,將城市進行模塊化分析以發現城市子群,位于同一模塊中城市具有兩個特點:地理位置臨近和方言相近。第二,實證分析結果表明除了地理距離、經濟發展水平差異、人口規模等經濟社會因素對廣東省內人口流動產生影響外,方言文化差異也會影響到省內的人口流動。如果流出地與流入地的方言距離越小,人口流動的可能性會越高,即方言文化背景相似地區對于省內流動人口具有一定的吸引力。穩健性檢驗和內生性檢驗進一步表明,方言文化差異對廣東省省內人口流動具有顯著的抑制作用。

城市因人而興,隨著省內人口流動規模的增長,促進城市和區域協調發展需要進一步做好流動人口管理與服務工作。本文從文化和春運視角出發,探究方言文化差異與廣東省內人口流動的關系,研究結論具有一定的政策啟示:第一,對于粵東西北而言,目前普通話水平較低,需要進一步發展深化基礎教育和中等教育、在保護本土方言的基礎上推廣普通話、提高當地人的語言能力,減少溝通障礙以增加地區的吸引力。第二,2022 年8 月廣東省自然資源廳發布了《廣東省都市圈國土空間規劃協調指引》,明確了廣東省未來規劃建設的五大都市圈,分別為廣州都市圈、深圳都市圈、珠西都市圈、汕潮揭都市圈以及湛茂都市圈。結合本文的研究,這五大都市圈各自內部人口流動活躍,在地理和文化上具有相近性。未來在加強都市圈建設的同時,需要開展都市圈之間的交流與協作,減少地域文化差異,增加省內不同文化背景人口的交流,促進廣東省區域協調發展。

猜你喜歡
方言廣東省人口
方嚴的方言
《世界人口日》
人口轉型為何在加速 精讀
方言
說說方言
留住方言
廣東省鑄造行業協會十周年會慶暨第四屆理事會就職典禮成功舉行
人口最少的國家
1723 萬人,我國人口數據下滑引關注
廣東省海域使用統計分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合