?

語料庫語言學的本體論思考及闡釋

2012-04-13 22:23
關鍵詞:語料語言學語料庫

劉 國 兵

(北京外國語大學 中國外語教育研究中心,北京 100089)

語料庫語言學的本體論思考及闡釋

劉 國 兵

(北京外國語大學 中國外語教育研究中心,北京 100089)

語料庫語言學的快速發展要求我們認真思考和探討其學科屬性等基本問題。語料庫語言學是一門獨立的學科,它以語料數據為出發點,基于現有理論和假設,根據真實數據對其進行驗證;語料庫研究采用自上而下與自下而上相結合的綜合方法,研究過程涵蓋歸納與演繹兩個步驟,實際操作過程包括理論假設、數據驗證、完善理論、邏輯類推等具體環節;語料庫語言學的研究對象是實際語境中給定的語言使用系統,語言意義蘊含于語言運用之中,但我們不完全贊同“語言一元論”說法;從意義單位出發觀察文本意義是語料庫語言學研究的基本視角,但對意義單位進行研究時把書面語和口語區別開來,這種做法有些不妥,在對這兩種文本進行解讀時不存在本質上的差異。

語料庫語言學;本體論思考;闡釋

雖然語料庫語言學在過去四五十年中得到快速發展,時至今日其影響還在不斷擴大,但不同的研究視角、目的以及語料庫研究者內部的認識分歧等,都給語料庫語言學帶來了研究方法的日益分化。過去幾十年來困擾語料庫研究的一系列問題不但沒有得以解決,而且隨著語料庫語言學的發展,這些問題又凸顯出來。問題不僅來自語料庫研究領域以外的學者,語料庫研究者內部的聲音也不盡一致:語料庫語言學是否已成為一門獨立學科,抑或是一種研究方法甚至工具?語料庫語言學的研究對象、研究方法及研究視角是什么?對于這些基本問題,學者們給出的答案不盡相同。在此情況下,認真思考和探討語料庫語言學的學科屬性等本體論問題就顯得尤為亟需。

一、語料庫語言學的學科地位

關于語料庫語言學的學科地位問題,目前主要有三種觀點。一種觀點認為語料庫語言學沒有發展成為一個新的學科,而是研究方法的一個新視角,或者說是一種新的研究方法。持有此種觀點的學者以英國語言學家McEnery為代表。McEnery等人認為,語料庫語言學只是一種研究方法,與音位學、句法學、語義學等語言學的分支學科有著根本不同。語料庫語言學可以定義為將語料庫應用于語言研究及教學的一系列方法。所以它有一定的理論基礎,但理論基礎并不等于理論本身[1]。第二種觀點認為語料庫語言學有自己的研究對象和理論體系,但要具有獨立的學科地位從而成為語言學的一個分支學科還有些為時尚早。從目前發展態勢來看,語料庫語言學具有發展成為一門獨立學科的巨大潛力[2]。第三種觀點與前兩種截然不同,持此觀點的學者們認為語料庫語言學已經完全發展成為一門新興的學科,其學科地位毋庸置疑。語料庫語言學擁有明確的研究目標和獨特的研究方法,擁有具體的研究對象及完整的研究理念,因此已經成為具有全新研究視野的新學科[3]。我們不禁會問,同屬一個研究領域,學者們為何會有如此大的分歧呢?究其原因,持第一種觀點和第三種觀點的研究者在對待語料庫數據的作用及態度上存在根本差異。持第一種觀點的研究者采取基于語料庫的方法(Corpus-Based Approach),即基于先前的理論或假設,利用所得數據對已有理論或假設進行驗證,從而實現對語言學理論的證實或證偽。這種做法明顯體現了語料庫的工具性價值及方法學意義,也基本繼承了提出假設、找出數據從而驗證假設的傳統科學研究過程。持第三種觀點的研究者完全采用語料庫驅動方法(Corpus-Driven Approach),研究過程重視語言的自給自足性,認為語言本身構成了一個完備的自參照體系。語言學家不需要基于已有先驗假設,研究過程中也不需要到語料庫之外尋找證據,任何已有的理論或假設都是多余的。研究者唯一而又重要的工作就是認真觀察語料,從語料中總結和概括理論。這兩種觀點鮮明地體現了英國語料庫語言學歷來的學派之爭。第二種觀點則介于以上兩種研究方法之間,既不承認語料庫語言學的獨立學科屬性,也不把它僅僅看做一套方法或原則,因此在認識上具有明顯的折中性。

基于近年來所做的研究,我們認為,以上三種觀點都有道理,也都有科學性的成分。但語料庫語言學內部出現“學科地位之爭”,根本原因在于學者們對語料庫語言學缺乏宏觀認識,爭論過程中缺少辯證思維。特別是持第三種觀點的研究者,他們在評價對方研究立場時,往往只關注對方研究范式的缺點與不足,沒有對其長處及優勢給予充分認識和肯定。語料庫驅動研究中,任何理論都是在觀察和分析語料過程中形成的,而不是預設的、先驗的。所以,語料庫驅動研究提倡干凈文本原則,極力反對文本標注,認為標注時人們不可避免地對文本附加了預設信息。這一研究范式要求研究者對建立在直覺基礎上的語言學理論持反對態度。分析語料時,拋棄已有理論和假設,從語料本身總結能夠反映語言事實的理論及描述。但我們知道,人類語言是一種極其復雜的生理與社會現象。近一個世紀以來,人們已從音位、詞素、短語、句子及篇章等諸多語言內部層面以及社會、心理、認知、神經及解剖等外部層面對其進行過深入研究,并且取得了豐碩成果。從一定程度上來說,這些成果在指導著我們今天的諸多研究,今天的語言研究很大程度上是對過去研究的繼續與深入。試想在今天的研究中,如果拋棄已有成果,把理論產生的可能完全依托于對現有語料的分析上,我們的研究恐怕會舉步維艱,其結論也會失之偏頗。再看基于語料庫的方法。采取這一方法的學者們在研究中,依據已有理論或假設,借助其內部的分類框架,選擇性地使用語料庫證據,并以此對理論或假設進行證實或證偽。這一方法本身并無可厚非,但問題在于,很多采用此種方法的研究者經常陷入一種認識誤區,即理論是預設的,具有已知的主體性,而證據是補充的,證據為了驗證理論而存在。這種認識框架下,語料庫就淪為驗證理論的一種工具或方法。這顯然突出了其工具性及方法論特征,從而忽視了語料庫本身具有的意義及價值。持第二種觀點的研究者在申明立場時,只是對另外兩種觀點做了綜述,表達態度上有些含糊,也沒有提出自己明確的主張。

總之,語料庫語言學發展至今,雖然只有短短幾十年時間,但其作為一門新興的獨立學科,其學科地位是毋庸置疑的。我們的理由是,判斷語料庫語言學是否成為一個獨立學科,根本標準不在于對待數據的態度,而在于研究對象的確立。語料庫語言學的研究對象就是具體文化環境與實際語境中給定的語言使用系統。我們主張以語料庫數據為根本出發點,參考現有理論與語言直覺,基于語料數據對理論和假設進行驗證和判斷,從而實現語言學理論的豐富、完善、創新及發展。這是語言研究的基本范式,也是語料庫語言學研究的根本內涵。

二、語料庫語言學的研究方法

人類用于科學研究的方法,基本上可以概括為兩類:一類是自上而下;一類是自下而上。這里所謂的上下與邏輯學上的上下在指稱上大體相同,具體說來,上指抽象的語言學理論;下指來自真實語料的數據。對于語言研究來說,很多學者認為,自下而上的方法適合于語料庫語言學研究,而自上而下的方法則廣泛應用于傳統語言學研究。例如衛乃興提出,語料庫語言學的基本研究方法是自下而上,其一切問題探索都源于對數據的處理和觀察。它體現為語料的提取、觀察、概括和解釋這樣的基本研究過程,這一過程與已有理論及假設無關[4]。之所以得出此種結論,顯然是受語料庫驅動思想的影響。語料庫驅動研究主張擯棄所有先驗理論,一切從語料數據出發,通過檢索及統計軟件提取、觀察、分析語料,根據觀察到的語料特征概括相關理論。這是一種典型的自下而上的歸納方法。那么,在語言學研究中,還有可能采用自上而下的研究方法。具體說來,很多問題的探索始于某些理論或假設,由預設的理論或假設驅動研究步驟及相關環節;從語言材料中尋找與理論及假設有關的數據,整理并進行分類;能夠支持該理論的證據被充分挖掘,不支持該理論的證據則棄之不用。證據的作用在于用來支撐或反駁某個理論。由此看來,自上而下的研究具有極強的演繹方法特征。

在此問題上,我們認為,語料庫語言學采用的是自上而下與自下而上相結合的綜合研究方法。對于很多研究,我們通?;谀撤N理論或假設,依靠直覺尋找支撐該理論的有效證據范圍;然后在語料庫中進行檢索,收集大量人類肉眼無法捕捉到的數據信息,從而對原有理論或假設進行證實或證偽。在語料庫語言學研究中,片面地采用一種方法,反對與拋棄另一種方法,其研究框架都是站不住腳的,得出的結果也是不可靠的??茖W發展到今天,任何研究要想有所創新和突破,都需要基于前人的成果。語言學研究也不例外,已有理論對我們的研究起著重要的指導作用。語料庫語言學與傳統語言學相比,在對待語料數據的態度上存在根本不同,語料庫數據的作用是主導的而不是輔助的,更不是為了驗證理論而存在。所以從方法論上來講,二者在語料庫語言學的研究中應該是一種既各具特色又互為補充的關系。研究者要根據實際需要,采用二者相結合的方法并實時對其進行調整,真正實現二者的優勢互補。某種研究方法從一定程度上說可能更適合于某類研究,但方法與研究之間不存在必然聯系。對于語料庫語言學來說,采用自上而下與自下而上相結合的研究方法,一是能夠充分發揮現有理論對研究的實際指導作用,避免我們在研究過程中走彎路;同時也能夠充分發揮此方法的演繹作用,因為語料庫無論大小,都是語言的抽樣,由語言抽樣得出的語言學理論適用于同類語言現象,也同樣適用于抽樣所在的語言整體。二是該方法能夠充分體現歸納的優勢,研究者根據大量語料數據,不但可以對現有理論進行驗證,而且還可以在歸納的基礎上發展現有理論,從而有效實現理論創新。采用二者相結合的研究方法,其操作過程應該包括理論假設、數據驗證、完善理論、邏輯類推等具體環節,這本質上也是一種歸納與演繹的綜合過程。

三、語料庫語言學的研究對象

語料庫語言學的研究對象是具體文化環境與實際語境中給定的語言使用系統,或者說是語言的運用即意義。語言運用之外的語言現象不是語料庫語言學的研究內容。語料庫語言學研究者認為,語言運用是一種社會現象,語言意義蘊含于語言運用之中。從弗斯到韓禮德和辛克萊,這種立場表述基本一致。弗斯曾對索緒爾的語言/言語二分法進行過猛烈抨擊。他認為,在語言運用之外,不可能存在一個獨立于言語的系統,也就是言語之外沒有語言[5]。弗斯實際上是從根本上拋棄了在語言運用之外尋求語言解釋的做法。根據他的觀點,語言的意義就是語言成分在其使用系統內部的相互解釋,語料庫語言學研究中,文本是唯一的數據源,也是研究對象的唯一載體。所以,語料庫語言學與傳統語言學的真正區別在于,在研究意義時,它既不去尋求語言運用之外的“理想語言”“心智語言”以及“與生俱來的語言”,也不去尋求超越現實的“思想語言”或“心理語言”,更不會通過一套形式化算法和邏輯公式,進而建立一套描述語言本身的概念本體。

較之索緒爾,雖然弗斯的語言觀更有說服力,在實際研究中也具有較強的可操作性,但我們并不完全認可和接受弗斯對索緒爾的批評。這是因為,由于時代局限及后人闡釋等原因,索緒爾的語言二分法盡管存在問題,時至今日也沒有證據讓我們充分相信語言的二分實體確實存在,但弗斯所倡導的語言一元論也未必能夠完全站得住腳。一部分語料庫研究者認為,一切語言事實和證據,包括知識、意義和解釋都在文本和話語中。這種認識本身并無問題,但把語言的意義、使用、文本解釋等概念都等同于語言,即語言運用之外不存在任何獨立的系統,也不存在解釋語言的可能,這種觀點就走向了語言本體認識的另一個極端。所以,有些研究者提出,語言和言語之間的關系并非涇渭分明,而是一個連續的統一[6],但統一不等于一元。在能夠找到充分證據讓我們相信一元論或二元論之前,語言研究的對象理應包括語言和言語兩個方面。我們認為,弗斯及其后來的追隨者(后人稱之為新弗斯學者[7])所堅持的語言觀只是采用一種新的方法、從一個新的視角去研究和描述語言,而不是對以往傳統語言觀的革命性顛覆。直到今天,堅持語言二元劃分觀點的學者不占少數,這從語言研究的其他學科如認知語言學、心理語言學以及傳統的語言哲學等對語言的解釋中可見一斑。我們暫且不去評判誰是誰非,基于目前對語言的認識,也無法給出令人信服的判斷。我們只想表明,語料庫語言學與傳統的語言二元論之間并沒有根本的矛盾,二者并非水火不容。語料庫語言學從一個新的視角來解釋語言現象,它所能解釋的是言語抽樣中出現的現象,但直到今天也沒有科學證明,這就是語言的全部。語言盡管不像索緒爾闡述的那樣存在二分實體,但同樣也不一定是弗斯主張的一元語言體系。語言運用之外還應該存在某些獨立或非獨立的因素,它既不同于語言運用,也不同于索緒爾聲稱的語言。它是除語言運用之外構成整個人類語言系統不可或缺的特定要素或子系統。對于語料庫語言學來說,因為文本是語言運用即言語的抽樣,既然抽樣就不可能是總體或全部;而且語言總體除了語言運用之外,還應包括其他要素。換句話說,語言總體不但包括說過的,而且也應該包括可能說、有能力說但沒有說出的語言。所以,作為語料庫研究者,我們不能夸下???,把研究視域之外的所有語言要素都等同于語言運用。當然,我們也不能期望語料庫語言學解決所有語言問題,對語料庫中語料的研究與對語言整體的研究也不應該完全等同。

四、語料庫語言學的研究視角

語料庫語言學研究的基本著眼點是“意義單位”(Unit of Meaning),從意義單位出發來考察文本的意義是其獨特的研究視角。語料庫驅動研究的代表人物辛克萊最先提出并使用意義單位的概念,但對這一概念給出明確定義的是其繼任者Teubert。他認為,意義單位是具有特定結構模式的詞語項,該詞語項在具體使用中可大可小。它可以是單個詞、詞組、短語、習語以及多詞單位等[8]。意義單位具有意義的單一性和無歧義性等特征,它是文本中最小的、可用于解釋的實際詞匯及語法意義載體,也是人類進行文本意義研究的基本切入點。在Teubert看來,語料庫語言學的研究任務就是通過檢索和分析這些意義單位,從而達到研究語言及分析意義的目的。關于語料庫語言學的研究視角,我們基本認同和接受Teubert以上有關意義單位的闡述。

但在文本的劃分上,我們對Teubert的做法持保留意見。在研究意義時,Teubert進一步區分了口語和筆語兩種語言表現形式的不同,認為書面語文本與交際中的話語在意義解讀上存在很大差異。對書面語進行解讀時,作者處于離場狀態,所以作者的意圖與文本的解讀之間不存在必然聯系。而在口語交際中,交際的直接目的就是說話人意圖的有效實現,口語話語的解讀很大程度上依賴于說話人的意圖,同時交際現場、話題參與人的角色及其相互關系都會對話語的解讀產生很大影響[9]。我們認為,Teubert對二者的區分有些不妥。在語料庫語言學研究框架內,作為研究對象的語料不管是書面語文本還是轉寫后的口語文本,其表現方式都是文字,所以對文本進行解讀時二者不存在本質上的差別。我們已經把口語話語通過轉寫,進而轉化為“書面的”的口語文本。這種做法是語料庫語言學研究的一大優勢。因為轉寫語料后,我們可以借助強大的檢索工具對口語語言進行分析,從宏觀層面總結和概括人類語言的口語特征。但這種做法也存在一定缺陷。缺陷在于轉寫后的文本只保留了必要的語言信息,失去了話語產生的場景及對說話人關系的詳細描述,而這些信息恰恰在口語語言的意義傳遞和解讀中起著非常重要的作用。

[1]McEnery,A.,R. Xiao & Y. Tono.Corpus-based Language Studies:An Advanced Resource Book[M].London and New York:Routledge,2006:7-8.

[2]Knowles,G. Corpora,Databases and the Organization of Linguistic Data[M]//In J. Thomas & M. Short.Using Corpora for Language Research:Studies in Honour of Geoffrey Leech.London:Longman,1996:36-53.

[3]李文中.語料庫語言學的研究視野[J].解放軍外國語學院學報,2010(2).

[4]衛乃興.語料庫語言學的方法論及相關理念[J].中國外語,2009(5).

[5]Firth,J. R. Papers in Linguistics,1934-1951[M].London:Oxford University Press,1957:198.

[6]梁茂成.理性主義、經驗主義與語料庫語言學[J].中國外語,2010(4).

[7]衛乃興.詞語學要義[M].上海:上海外語教育出版社,2011:6.

[8]Teubert,W.My Version of Corpus Linguistics[J].International Journal of Corpus Linguistics,2005(1).

[9]Teubert,W. Writing,Hermeneutics and Corpus Linguistics[M]//W. Teubert & R. Krishnamurthy.Corpus Linguistics:Critical Concepts in Linguistics.London:Routledge,2007:145.

[責任編輯許昌]

H0-09

A

1000-2359(2012)02-0240-04

劉國兵(1978-),河南滑縣人,北京外國語大學中國外語教育研究中心博士生,河南師范大學外國語學院講師,主要從事語料庫語言學及應用語言學研究。

教育部人文社科項目(12YJC740062),中央高?;究蒲袠I務費專項資金項目(2010XX007)

2011-10-18

猜你喜歡
語料語言學語料庫
《語料庫翻譯文體學》評介
基于語料調查的“連……都(也)……”出現的語義背景分析
認知語言學與對外漢語教學
華語電影作為真實語料在翻譯教學中的應用
基于JAVAEE的維吾爾中介語語料庫開發與實現
《苗防備覽》中的湘西語料
國內外語用學實證研究比較:語料類型與收集方法
社會語言學名詞
語料庫語言學未來發展趨勢
基于認知語言學的“認知修辭學”——從認知語言學與修辭學的兼容、互補看認知修辭學的可行性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合