?

中文閱讀中詞語加工與眼動控制整合模型簡介 *

2024-01-31 00:01陳汝淇包亞倩黃林潔瓊李興珊

心理與行為研究 2023年6期

關鍵詞：注視點詞頻眼動

陳汝淇包亞倩黃林潔瓊李興珊

(1 中國科學院行為科學重點實驗室(中國科學院心理研究所)，北京 100101) (2 中國科學院大學心理學系，北京 100049)

1 引言

無論英文還是中文，詞都是非常重要的語言單位?；旧纤械幕谟⑽牡难蹌涌刂颇Ｐ?，都假定了詞間空格在英語閱讀中的重要作用，即先依據空格完成詞的切分，再進行加工(Reichle et al.,1998)。然而，中文閱讀中沒有詞間空格，因此這些經典的拼音文字閱讀模型無法推廣到中文閱讀中。具體來說，無詞間空格使中文眼動控制模型必須回答兩個問題：第一，詞間無空格，中文讀者如何識別詞語？第二，沒有詞間空格來幫助引導眼睛移動的位置，讀者如何選擇眼跳目標(即掃視后眼睛落在哪個位置)？這些與詞切分有關的認知加工機制是近年中文閱讀領域的焦點。

詞切分問題對構建中文閱讀模型來說是一大挑戰。在閱讀中，在每個注視點能感知的內容非常有限。讀者注視一個位置時可以有效加工的信息量叫知覺廣度(McConkie ＆ Rayner,1976)。中文閱讀中知覺廣度的范圍是當前注視點的漢字(字n)，加上注視點左側一個漢字(字n-1)和右側三個漢字(字n+1、n+2 和n+3)(Inhoff ＆ Liu,1998)。因此，中文讀者必須逐漸移動眼睛，才能夠閱讀整個句子或者整個篇章。此外，知覺廣度中包含的詞語個數是不確定的，可能是兩個詞、三個詞，也可能只包括一個詞的一部分。對于這種復雜的情況，模型能幫助讀者更好地理解閱讀加工過程。

最近，Li 和Pollatsek(2020)提出了中文閱讀中詞語加工與眼動控制的整合模型(Chinese Reading Model,CRM)。該模型充分考慮中文書寫系統的特點，基于以往大量實驗研究，采用計算建模技術，建構了模擬中文閱讀認知加工過程以及眼動控制機制的計算模型。該模型著重解釋了中文讀者在閱讀過程中如何解決詞切分和眼跳目標的選擇等重要問題。為了方便讀者更好地理解該模型，本文對該模型進行詳細介紹，并通過舉例更進一步地分析該模型的特點。

本文首先介紹了詞切分、眼跳目標選擇的以往文獻，隨后是模型的重要假設、結構以及實現，最后介紹了模型對一些重要的中文閱讀眼動研究的模擬結果。在討論中總結了該模型為了解決詞切分問題提出的重要假設。

2 中文閱讀研究發現

2.1 中文閱讀詞切分的研究

即使沒有明顯的詞邊界信息，中文讀者在閱讀中文時也沒有表現出任何困難。一些研究表明，流利的中文讀者通常在一分鐘內閱讀400 個漢字(或260 個詞)，英文讀者和中文讀者閱讀相同內容的文本時所花費的時間是相似的(Liversedge et al.,2016; Sun et al.,1985)。這表明中文讀者在閱讀過程中有一套非常高效的詞切分機制。

已有許多研究揭示了中文詞切分的認知機制(Inhoff ＆ Wu,2005; Li et al.,2009; Yen et al.,2012)。本文主要介紹其中的一個研究。Ma 等人(2014)研究了中文讀者在句子閱讀過程中如何切分重疊歧義字符串(overlapping ambiguous strings,OAS)。OAS 是一種詞邊界歧義的三字字符串(用ABC 分別表示從左至右的三個字)，中間漢字可以分別與左側和右側漢字組成一個詞(即AB 和BC)，比如“學生活”中“學生”和“生活”都是詞。在閱讀過程中，讀者需要決定中間位置的漢字到底屬于哪個詞。這可能導致兩種切分類型：AB-C 或ABC。Ma 等人正交地操縱了句子語境和詞頻：根據OAS 之后的句子語境，OAS 應被切分為ABC 或A-BC；在OAS 內，第一個詞AB 的詞頻高于或低于第二個詞BC，分別產生高-低或低-高的詞頻條件。因此，基于詞頻的切分與后文語境可能一致或不一致，Ma 等人發現，在一致條件下，讀者對OAS 區域的回視比不一致條件的更少。這表明，最初讀者將高詞頻的詞切分出來，隨后再利用語境進行整合。

根據他們的實驗結果，Ma 等人(2014)認為讀者使用兩階段策略來加工此類句子。第一階段(詞語競爭階段)：知覺廣度范圍內所有漢字可能組成的詞語都會被激活，所有激活的詞語競爭唯一的勝出者。當某個詞勝出后，詞語被識別的同時，位置在中間的漢字會被切分到勝出詞。他們認為詞頻等因素作用于這個階段。第二階段(信息整合階段)：讀者會利用語境等信息檢查最初的詞切分是否正確，如果最初的詞切分與后文句子語境不匹配，讀者需要回視到歧義區重新切分。CRM 模型主要能模擬詞切分的第一階段，并且采納了這個階段中存在詞語競爭的假設。

2.2 閱讀中的眼跳落點選擇

許多研究表明，拼音文字閱讀中讀者在一個詞上的首次注視位置通常會落在詞中心偏左的位置，稱為偏好注視位置(preferred viewing location,PVL; Rayner,1979)。這在英文閱讀中是可行的，因為英文讀者可以用副中央凹視覺獲取詞邊界位置，從而將眼睛移動至PVL。但是在沒有詞間空格的情況下，中文讀者如何選擇眼跳落點位置？一些研究表明，中文閱讀的PVL 曲線呈扁平狀，PVL 曲線表示首次注視落在各漢字上的頻率(Tsai ＆McConkie,2003)；后來的研究發現PVL 曲線峰值出現在詞首位置(Li et al.,2011; Yan et al.,2010)，沒有研究表明中文閱讀中PVL 曲線峰值會出現在詞中央，這表明中文讀者不像英文讀者更偏好將眼跳落到詞中央。

為了解釋中文閱讀中眼跳目標的選擇，Li 等人(2011)提出了基于加工的策略(processing-based strategy)。根據這一策略，讀者首先試著在給定注視點上加工盡可能多的信息，然后將眼睛移動到未加工的字的位置。一些研究檢驗了這個策略的重要推論。例如，Wei 等人(2013)發現，離開高頻詞的眼跳長度要比離開低頻詞時更長?；诩庸さ牟呗酝茰y，一個注視點上能加工的右側字個數越多，眼跳長度就會越長，讀者對高頻詞的加工效率往往較高。Wei 等人的實驗驗證了這一策略，當中央凹為高頻詞時，相對于中央凹為低頻詞，讀者將有更多的認知資源用于加工右側的信息，因此眼跳長度更長。

此外，根據基于加工的策略，既然眼跳長度取決于右側文本被加工的程度，那么當讀者不能加工右側的字時，中央凹的詞頻對眼跳長度的影響將消失。Liu 等人(2015)的研究驗證了這一點。他們讓中文讀者閱讀嵌入了高頻或低頻目標詞的句子。其中，在有效預視條件下，讀者自然閱讀句子；而在無效預視條件下，注視點右側的每個漢字都被掩蔽符號“※”替代，直到眼睛跨過隱形邊界后才顯示正常漢字，因此在無效預視條件下讀者看不到目標詞右側的漢字。研究結果表明，當限制副中央凹的加工時，詞頻對眼跳長度的影響減小。

總之，這兩項研究結果表明，在注視點右側加工的漢字越多(從注視點的字開始計算)，眼跳長度就會越長，因此簡單的詞會被快速加工并有更長的眼跳長度。但如果副中央凹視覺加工被阻礙，高頻詞和低頻詞之間的眼跳長度不會有顯著差異。

3 CRM：假設、結構和實現

3.1 模型的假設

CRM 模型的一個重要假設為詞語加工和眼動控制兩個系統互相影響。因此該模型有兩個模塊：詞語加工模塊和眼動控制模塊。兩個模塊功能相對獨立，但通過實時通信互相影響。將詞語加工和眼動控制整合在一個模型中，可以幫助理解詞語加工和眼動控制之間復雜的交互作用。

CRM 的另一個重要假設是采納了交互激活模型(Interactive Activation Model,IAM; McClelland ＆Rumelhart,1981)模擬詞語加工過程。IAM 在認知心理學研究中極具影響力，已被廣泛用于解釋視覺文字加工(McClelland ＆ Rumelhart,1981)、出聲閱讀(Coltheart et al.,2001)、眼動控制(Reilly ＆Radach,2006; Snell et al.,2018) 和語音知覺(McClelland ＆ Elman,1986)等認知活動。針對中文閱讀的特性，CRM 模型提出了一些新的假設，以確保IAM 可以解釋中文句子閱讀中的詞語加工過程。

首先，中文詞之間沒有空格，無法通過低級視覺信息獲取詞邊界信息，因此模型需要進行詞切分。模型的輸入是漢字序列，其中包含的詞語個數和詞語長度在識別之前是未知的。為了解決這些問題，CRM 模型假設詞語加工和詞切分是一個統一的過程。模型平行加工知覺廣度范圍內的所有漢字，并激活由這些漢字組成的所有可能的詞。相互重疊的詞會互相競爭。一旦一個詞在競爭中勝出，它就被識別出來，并確定其首尾位置，從而將其從漢字串中切分出來。

其次，中文有超過5000 個常用漢字，且這些漢字相對于英文字符來說結構更復雜。IAM 模型中，英文的字母由每個位置上的特征探測器識別，而在CRM 模型中，對漢字的識別通過與漢字模版進行匹配來實現，即將輸入的漢字圖像與漢字模版進行相似性比較，并將漢字圖像識別為與它最匹配的模版。

第三部分的假設與眼動控制有關。之前的研究表明眼睛何時移動和向何處移動的決定往往是獨立進行的(Rayner ＆ McConkie,1976; Rayner ＆Pollatsek,1981)，CRM 模型也做出相同的假設。模型假設兩種眼動控制機制共同決定了眼睛何時移動。首先，當前注視詞的加工情況影響了眼睛移動的時間。對注視詞已經加工的程度越深，啟動眼動所需的時間就越短。其次，眼動機制中還存在自主控制成分，即使在一個注視點上沒有加工任何信息，一段時間后眼睛也會移動。

至于向何處移動眼睛，該模型采用基于加工的策略(Li et al.,2011; Wei et al.,2013)來模擬眼跳目標的選擇。根據這個策略，中文讀者會先估算在一個注視點上能夠加工多少漢字，然后把眼睛移動到這些漢字之后。

3.2 模型的結構

模型主要包括兩個模塊：詞語加工模塊和眼動控制模塊(見圖1)。詞語加工模塊識別和切分知覺廣度范圍內的詞，眼動控制模塊決定眼睛移動的時間和位置。兩個模塊實時互動，而非獨立運作。詞語加工模塊向眼動控制模塊提供詞語加工和漢字加工情況的實時信息，使它可以決定眼睛的移動時間和位置。眼動控制模塊向詞語加工模塊提供眼動信號，詞語加工模塊一旦收到眼動指令，知覺廣度范圍便移動到由眼動控制模塊指定的新位置上。

圖1 模型結構示意圖(Li ＆ Pollatsek,2020)

3.2.1 詞語加工模塊

詞語加工模塊采納了交互激活模型的結構。該模塊包含三個加工層級，分別為視覺層、漢字層、詞語層。每個層級設置有許多單元(unit)。不同層級的單元代表不同意義，如，詞語層的每個單元代表一個詞，漢字層的每個單元代表一個漢字。每個單元都有激活值，對應于該單元出現在特定位置的可能性。不同層級單元之間、各個層級內部都設有鏈接(link)。鏈接分為前饋、反饋鏈接，同時又分為興奮性或抑制性鏈接。興奮性鏈接是指一個單元的激活會增加另一個單元的激活值；抑制性鏈接是指一個單元的激活會降低另一個單元的激活值。在三個層級中，編碼方式具有位置特異性：在詞語加工模塊中有很多插槽(slot)，每個插槽對應文本中一個漢字的位置。在每個插槽中都有一個視覺單元、一組漢字單元和一組詞語單元。插槽中的視覺單元和漢字單元只接收來自同一位置的輸入。

模型假定詞語加工模塊在每個注視點上的視覺輸入為五個漢字，即注視點附近的知覺廣度范圍內。盡管每個注視點的視覺輸入包含五個漢字，但詞語加工模塊中正在加工的字數是動態變化的。隨著眼睛移動，新的眼跳落點位置所對應的知覺廣度范圍內的漢字會進入詞語加工模塊。當一個詞語被識別了，它的所有漢字就會從詞語加工模塊中被移除。同時，如果在之前的注視點上對n-1 到n+3 范圍內的一些漢字已經進行了加工，那么在新注視點上將不再對其進行加工。因此，很多注視點上詞語加工是從位置n開始的，而不是n-1 位置，因為這個位置上的詞已經在上一個注視點上完成了加工。

(1)網絡更新

模型中各單元的激活是不斷更新的，不同層級內的單元以相似的方式更新，與原始交互激活模型所使用的方式相似。在一個給定的時間點，一個單元收集與之相連的其他單元的所有輸入，然后計算所有輸入的加權總和，以低級到高級的順序更新激活值。

在計算單元的更新時，模型用公式1 計算單元的輸入。其中ni(t)是網絡在給定時間t的輸入，wij是和另一個單元j(單元激活為aj(t)) 的鏈接權重，當鏈接為興奮性鏈接時wij為正值，當鏈接為抑制性鏈接時wij為負值。不同的鏈接的權重是不同的，將在后文介紹。free1 用于為詞語單元和眼跳單元添加額外的輸入(后文介紹)，而對于其他單元(如漢字層的單元)，free1 的值被設置為0。

公式2 將一個單元的輸入(公式1 計算得到的值)“壓縮”為一個值，以使單元激活值落在0 到1 的范圍內。

在公式2 中，ai(t)表示一個單元在時間t的激活值。利用公式3 更新單元在時間t+Δt時的激活ai(t+Δt)，表示使用公式2 進行壓縮后的單元凈激活輸入。

使用公式4 將單元的激活保持在0 到1 之間。

(2)漢字層

每個插槽中有一組完整的漢字單元。每個漢字單元只從相同插槽的視覺單元獲取前饋輸入。從視覺單元到漢字單元(插槽i的第j個單元)的輸入見公式5。

在公式5 中，similarityij代表輸入圖像與該漢字單元代表的漢字模版之間的相似性，是一個自由參數，調節視覺單元到相同位置的漢字單元j之間的鏈接權重(全部自由參數見表1)。相似度等于輸入圖像和模版之間具有相同灰度的像素個數與圖像中所有像素個數的比值。模型的詞典中一共有5692 個漢字，然而，為了簡潔，模型設置只有相似分數高于一定水平(0.5)的漢字才會被激活。

此外，模型還考慮了視覺離心率對詞語加工的影響。離注視點越近感知的效率會越高，離注視點越遠感知的效率相應降低。實現方法如下：從視覺層到漢字單元的輸入受到視覺離心率的影響。模型使用了一個以注視點為中心的高斯函數，模擬了視敏度的影響如何隨距離變化；eccentricityi代表眼睛注視第fix個漢字時第i個插槽處視敏度的影響，由公式6 確定。

圖2 注視詞為低頻詞和高頻詞時eccentricity 與漢字位置的關系

在給定的插槽上，同一個插槽中的漢字單元之間是抑制性鏈接，其權重為inh_character_character(模型中權重信息如何被納入計算詳見公式1)。這使得同一個位置上的漢字單元之間相互競爭，最后只有一個漢字單元可以贏得競爭。不同插槽位置上的漢字單元之間不存在鏈接。

(3)詞語層

由于中文閱讀中沒有詞間空格，因此在詞語識別之前，既不知道詞長信息也不知道詞邊界信息。為了解決這一問題，該模型假設每個插槽上有一組詞語單元，每個詞的第一個漢字都在這個插槽上。因此，詞語單元也是位置特異性的。一個詞語單元可以占用多個插槽(假如它代表一個多字詞)，且占用插槽數與其字數相等。詞語加工模塊中，很多詞語單元在空間上重疊(即，如果兩個詞語單元占據同一個插槽，那么它們在空間上重疊)?？臻g上重疊的詞語互相競爭唯一勝出者。當詞語單元的激活超過閾限值詞就被識別出來了，也就同時被成功切分出來。

下面采用一個例子說明詞切分的具體過程(見圖3)。如果詞語單元和漢字單元在空間上重疊(不管是否在同一個插槽)，那么詞語單元將接收漢字單元的前饋鏈接。這些詞可以從不同的位置開始，長度也可以不同。比如說，如果“大”字出現在插槽n，它就會激活所有的在插槽n上有“大”字的詞語單元(“博大”、“大兵”和“大學”等)。

圖3 詞語加工模塊交互激活示例

模型中的鏈接使得字與詞的加工相交互。從字到詞層級可以是抑制性或興奮性鏈接。假如一個詞包含這個字且位置正確，那么漢字到詞語單元為興奮性鏈接(權重為，即漢字單元的激活增加詞語單元的激活值，且漢字激活越高，它對詞語單元的輸入越大。否則，前饋鏈接為抑制性(權重為即漢字的激活降低詞語單元的激活值，且它的激活值越高，對詞語單元的抑制就越大。除了前饋鏈接，還有從詞語到漢字單元的反饋鏈接。如果一個詞語在適當的位置包含該漢字，那么從詞語到漢字單元為興奮性鏈接(權重是character)，例如，“博大”對“大”有興奮性的反饋鏈接，促進它的加工。這個從詞語層到漢字層的鏈接可以用來解釋以往研究發現的詞優效應，即當一個字出現在詞語中時，被試識別該字比它單獨出現時更快(申薇,李興珊,2012)。

在詞語層中，空間上重疊的兩個詞單元之間就會有抑制性鏈接(權重為如，由于位置重疊“大學”和“大兵”之間有著抑制性的鏈接，而“大學”和“生活”沒有位置重疊，就不會競爭而是被平行地識別加工。這些鏈接使空間重疊的詞語相互競爭，最后只有一個詞勝出。比如，由于“大兵”和“博大”只受到了漢字層“大”的支持，而“大學”受到“大”“學”兩個字的支持，因此這兩個詞在早期被激活，而到后期就會被“大學”所抑制。最后只有“大學”取得勝利，由于已知詞的開始位置以及詞長，這個詞同時完成了詞切分。所以詞切分和詞激活是一個統一的、不可分的過程。

(4)詞頻的影響

CRM 模型通過設置詞語單元激活公式的常數項來模擬詞頻效應。對于詞語單元，模型將公式1中的free1 變量設置為公式8 所示的頻率縮放變量(frequency scaling variable,CFSi)。公式8 中，frequencyi表示詞語單元i的詞頻，4.0251 是當前模型使用的詞里最大對數頻率，frequency_gain是調節詞頻對詞語加工影響程度的自由參數。CFSi越大則一個單元激活的速度越快。通過這個設置保證了高頻詞語加工的時間更快。

(5)預測性影響

模型通過增加相應詞語單元的激活來實現詞語預測性效應。詞語單元的激活增加了公式9 所描述的值，其中predictabilityi是詞語i在語境約束下的預測性，是一個自由參數。為簡單起見，模型假設，只有收到漢字層輸入的詞語才被激活。因此，只有語境預測但沒有漢字層支持的詞語不被激活。此外，因為讀者一般會用他們讀過的所有詞來預測下一個詞，模型假設，只有在插槽n的激活值(激活程度最高的詞語單元的值)超過閾限時(模擬中為0.3)，預測性才影響詞n+1 的激活。通過這一公式，模型實現了高預測性的詞激活程度也越高，從而可以被更快地識別。

3.2.2 眼動控制模塊

眼動控制模塊主要控制眼睛移動的時間和位置。包含眼跳單元、注視詞單元、漢字激活地圖、眼跳目標選擇以及眼跳執行單元。

(1)眼睛移動時間控制

在眼動控制模塊中，注視詞單元(fixated-word unit)和眼跳單元(saccade unit)決定了何時眼動。在當前的模型中，注視詞的激活強度是眼睛何時移動的決定性因素。模型采用注視詞單元表示當前注視詞的加工進度。這個單元的激活強度等于當前插槽上激活值最高的詞語單元的激活強度。模型假設眼跳單元控制了眼睛何時移動。眼跳單元接受注視詞單元的激活型鏈接(權重為在注視的時候，眼跳單元的激活持續累積，達到閾限值就會觸發眼跳。而在眼睛移動時，眼跳單元的激活恢復為0。

眼跳單元的激活公式中除了來自注視詞單元的輸入，還包括一個大于零的常量(free1 變量設置為自由參數因此，即使注視詞單元的激活為零，眼跳單元的激活仍然會增加。在公式1 中加入這個參數，就為眼動控制模塊引入了一個自動控制成分，即使沒有感知到任何信息，眼睛也會在一段時間后移動。

需要注意的是，雖然注視詞單元的激活會影響眼睛何時移動，但眼睛實際移動的時間并不一定與注視詞語的識別時間完全相同。眼跳單元的激活決定了眼睛何時移動(達到閾限值時立即觸發眼動)，而注視詞單元的激活只能通過影響眼跳單元的激活來間接影響眼睛的移動時間。因此，眼睛的移動并不能完全與詞語的識別時間保持一致，眼睛可能在注視詞被識別之前或之后移動，這取決于眼跳單元的激活情況。

(2)眼跳目標的選擇

在眼動控制模塊中，漢字激活地圖(character activation map)和眼跳目標單元(saccade target unit)決定了向何處眼動。關于眼跳位置的選擇，模型采用了基于加工的假設。前文提到過，根據這個策略，讀者估計他們在一個注視點上能夠加工的漢字數量，然后選擇這些漢字之后的字作為眼跳目標。這是通過漢字激活地圖實現的。在地圖中，句子中所有漢字的位置都有一個對應的單元。這些單元的激活初始值為0，當一個漢字被識別時，激活值為1。當詞語加工模塊中的漢字被加工，它們的激活值會實時同步更新到漢字激活地圖中，地圖中的漢字激活單元(character-activation unit)的激活值等于對應插槽位置上激活程度最高的漢字單元。為了實現這個基于加工的假設，在一個眼跳被觸發后，眼動控制模塊會從左到右依次搜索漢字激活地圖，找到第一個激活小于某一閾值的漢字單元，這個漢字則被選擇為眼跳的落點。

3.3 模型實現和參數搜索

3.3.1 模型實現

CRM 是一個計算模型，所有關于詞語加工和眼動控制的假設通過計算機程序來實現。模型的輸入由一系列組成句子的漢字圖像構成。該模型模擬了每一個注視點上詞語加工的動態過程，并模擬了整個句子完全加工前的眼動過程。模型的輸出是一系列被識別的詞語，以及句子加工過程中每個注視點的位置、起始時間和結束時間。

3.3.2 模型的初始化

模型啟動時隨機選擇句子的第一個或第二個漢字作為注視點，然后啟動詞語加工模塊注視該漢字，并從注視點左側一個漢字右側三個漢字的范圍內獲取新信息。所有單元的激活初始值為0。

3.3.3 眼動指標度量

為了模擬眼動指標，模型需要一個時間系統來記錄眼睛移動的時間。CRM 模型參照交互激活模型的實現方式，以離散的時間單位的方式運行。程序每循環一次稱為一個迭代。在每次迭代中，網絡中的所有單元的激活都會更新一次。模型使用一次迭代的持續時間作為模型計時系統的單位。為了將模擬數據與眼動實驗數據進行比較，CRM 模型將迭代次數乘以一定的比例以轉換為注視時間，使得模型預測的平均注視時間與觀察數據的平均注視時間一致。為了計算基于詞的眼動測量，CRM 模型使用與眼動研究相同的方法，計算首次注視時間、凝視時間和再注視概率來表示眼睛移動的時間，計算跳讀率和眼跳長度來表示位置信息。在一些模擬中，模型還計算了詞內眼跳落點位置。注意，由于模型沒有實現高級認知加工，而高級認知語言加工又被認為是回視的主要因素(Rayner,1998)，因此模型只計算了首遍閱讀(first-pass reading)眼動指標，而沒有考慮回視。

3.3.4 用于尋找最佳參數的數據集

通過擬合Wei 等人(2013)的數據來尋找最佳參數。這項研究記錄了21 名被試閱讀72 個句子時的眼動數據，其中36 個句子包含高頻兩字詞(每百萬出現50 次以上)，36 個句子包含低頻雙字詞(每百萬出現不到5 次)。這些目標詞的預測性接近于0。該研究發現了詞頻效應：在低頻詞條件下，首次注視時間和凝視時間顯著長于高頻詞條件。另外，離開高頻詞的眼跳長度顯著長于離開低頻詞條件，低頻詞的注視概率和再注視概率顯著高于高頻詞條件。

3.3.5 模型擬合方法

CRM 模型尋找最佳模型參數的方法如下。模型加工了Wei 等人(2013)實驗中的句子材料。采用目標詞的首次注視時間、凝視時間、注視概率和再注視概率，離開目標詞的眼跳長度和漢字識別準確率作為擬合偏差的計算指標。模型使用歸一化均方根偏差(nRMSD)來計算擬合偏差(公式 10)。

在公式10 中，yipredicted是模型預測數據，yiobserved是觀測數據，stdiobserved是觀測數據的標準差，n是模型擬合的數據點數。nRMSD值越小，模型擬合越好。在整個參數空間中搜索最佳參數，使nRMSD最小。

因為參數空間非常大，采用并行遺傳算法(parallel genetical algorithm)尋找最佳擬合參數。找到最佳參數后，將這些最佳參數用于其他所有模擬中。正如接下來的模擬結果所示，使用相同的參數能較好地模擬不同的實驗結果，表明CRM 模型的通用性很好。模型采用的參數如表1 所示。

4 模型模擬表現

首先CRM 模型模擬了眼動控制模型的經典效應(詞頻效應、預測性效應和詞長效應)，大多數拼音文字書寫系統的眼動控制模型都模擬了這些效應(Engbert et al.,2005; Reichle et al.,1998)。學界普遍認為眼動控制模型都應該能模擬這些效應(Engbert et al.,2005)。除此之外，CRM 模型還模擬了由于詞間空格的缺失中文讀者面臨的兩個獨特的問題，而中文眼動閱讀模型都需要解釋這兩個問題：中文讀者在沒有詞間空格的幫助下如何進行眼跳目標的選擇；讀者如何處理詞邊界歧義的兩種情況(重疊歧義字符串和組合歧義詞)。

4.1 眼動控制模型的傳統基準數據

CRM 模型成功地模擬了中文句子閱讀中眼動研究的重要發現，如詞頻效應、預測性效應和詞長效應等。

4.2 眼跳目標選擇

模型也能擬合以往關于眼跳目標選擇的研究：被注視詞的詞頻越高，離開注視詞的眼跳長度就越長(Wei et al.,2013)；而且被注視詞的詞頻是通過影響副中央凹的加工程度來影響眼跳長度：在副中央凹信息正常呈現時，詞頻影響眼跳長度，而在副中央凹信息被掩蔽時，這種詞頻效應減弱(Liu et al.,2015)。

之所以能成功模擬這些效應，是因為模型采用了基于加工的策略。模型通過公式7，令副中央凹的位置上的視覺層對漢字層的輸入強度受中央凹詞頻的影響，從而實現副中央凹加工的視覺效率受到注視詞詞頻的影響。當副中央凹信息可見時，高頻詞導致右側漢字更多加工，從而使離開高頻詞的眼跳比離開低頻詞更長；當副中央凹信息不可見時，副中央凹的加工受掩蔽符號影響，降低了目標詞詞頻對眼跳的影響。

4.3 副中央凹預視效應

模型還能模擬副中央凹預視效應，即副中央凹的詞語在注視中央凹時會被加工。在Gu 和Li(2015)的實驗2 中，中文讀者閱讀了嵌入兩字目標詞的句子。在目標詞之前的隱形邊界之前，顯示了預視詞，當眼睛跨過邊界時，預視詞變為目標詞。有效預視條件下，目標詞與預視詞一致；無效預視條件下，目標詞與預視詞不一致，且預視詞為隨機的兩個漢字，不能組成詞語。模型的結果與實驗一致，即無效預視條件的首次注視時間和凝視時間長于有效預視條件。模型能夠模擬預視效應是因為它假設知覺廣度范圍內的漢字是平行加工的。因此副中央凹的信息在有效預視條件下可以被加工到一定程度，因此在隨后被注視時花費的時間相對于無效預視條件更少。

4.4 詞切分

4.4.1 重疊歧義字符串

首先，它能夠擬合左側優勢和詞頻對詞切分的影響。前人研究發現了左側詞在詞切分中的優勢(Huang ＆ Li,2020; Li et al.,2009; Ma et al.,2014)：在其他條件相同的情況下，左側的單詞更有可能被切分成一個單詞。此外，如前文所述，Ma 等人的研究表明，詞頻高的詞更容易被切分出來，且詞切分的過程可能分為兩個階段(詞語競爭階段和隨后的信息整合階段)。

當前的模型能模擬詞切分的第一階段，詞語競爭階段。模型的模擬采用了Huang 等人(2021)的實驗材料。該研究將重疊歧義字符串嵌入了句子中，操縱條件之一是左右側詞的相對頻率，具體而言操縱OAS 左側詞的詞頻高于右側詞(高-低頻條件)，或左側詞的詞頻要低于右側詞(低-高頻條件)。模型模擬結果表明，高-低頻條件下，98.3% 的試次中將中間位置的漢字切分到了左側詞；低-高頻條件下，51.7%的試次中將中間位置的漢字切分到左側，48.3%的試次中將中間位置的漢字切分到了右側。這一模擬結果與實驗中左側優勢和詞頻對詞切分的影響一致。

4.4.2 組合歧義詞

中文中詞邊界模糊的情況，除了重疊歧義字符串以外還有組合歧義詞(incremental words)，即一種內部的漢字本身也構成詞的詞語。比如漢字“不斷”，可以切分為“不”“斷”“不斷”。以前的研究發現，在加工這種詞時存在整詞優勢，即讀者更傾向于將它們識別為更長的詞。例如，Yang 等人(2012)的研究發現，雙字組合歧義詞的第一個字在句子語境中的合理性對閱讀時間沒有影響。這表明中文讀者更傾向于將組合歧義詞作為一個整體加工，而不是逐字加工。

模型采用了Wei 等人(2013)研究中實驗2 的材料，在該實驗中，中文讀者閱讀包含高頻目標詞和低頻目標詞的句子。其中，72 個目標詞中有70 個詞的漢字本身可以成詞。對于這些目標詞，模擬結果顯示，目標詞是高頻詞時，整詞切分在99.4%的試次中勝出，目標詞是低頻詞時整詞切分在99.2%的試次中勝出。在這次模擬中整詞切分具有絕對的競爭優勢，詞頻的影響非常微弱。這些結果與Yang 等人(2012)的結果一致，表明中文閱讀中組合歧義詞通常作為一個整體進行加工。

模型中，組合歧義詞的加工機制如下。在詞語層，“不”、“斷”和“不斷”都會被激活，這些詞相互競爭唯一的勝出者。在競爭中誰能勝出取決于以下兩點：第一，競爭會受到詞頻的影響，高頻詞更有可能勝出；第二，整詞在競爭中有優勢，因為它可以收到更多漢字單元的前饋激活，當單字詞和整詞的詞頻相似時，整詞勝出的可能性更大。

5 討論

Li 和Pollatsek(2020)構建了中文閱讀過程中詞語加工和眼動控制的整合模型，著重解釋了中文讀者在閱讀過程中如何解決詞切分和眼跳目標的選擇等重要問題?；谇叭搜芯?，CRM 模型提出了幾個重要假設，使研究者能解決這些關鍵的問題。

5.1 詞切分機制

詞語加工模塊中最重要的假設是，詞切分和詞語識別是一個統一的過程，它們同時發生。首先，知覺廣度范圍內的所有漢字都(在視敏度的約束下)被平行激活。這些漢字構成的所有詞語都被激活。在空間上有重疊的詞語會相互競爭，在每一輪競爭中，只有一個詞可以獲得勝利。中文閱讀中詞切分的機制與英文閱讀詞切分的機制有很大不同。英文閱讀中，先依賴詞間空格將詞切分出來，再進行詞的識別。而中文閱讀中，詞切分和詞識別是一個統一的、不可分的過程，沒有先后。

5.2 眼動控制

對于何時移動眼睛，CRM 模型假設，注視詞的激活會影響眼睛移動的時間，但是眼睛移動的時間和完成詞語識別的時間并不完全一致。而對于向何處移動眼睛，CRM 模型實現了基于加工的眼跳目標選擇策略，在一個注視點上讀者盡可能多地加工注視點右側的字，將下一個眼跳落點選擇為未加工信息位置。CRM 模型假設，漢字的激活是決定眼睛移動的位置的主要因素。具體來說，模型主要用漢字激活地圖來確定眼跳落點的位置，先評估在給定注視點上能加工的字數，然后執行眼跳?？梢钥闯?，模型中詞語單元的激活并不直接影響眼睛移動的位置，因此中文讀者不會將眼跳指向詞語內部的特定位置。然而值得注意的是，由于詞語加工和字的加工本身是交互的，詞單元會通過反饋鏈接影響相應的漢字單元的激活。因此詞語加工也會間接影響眼跳目標的選擇。

5.3 模型的局限

盡管模型成功地模擬了中文句子閱讀中的詞語加工和眼動控制，但仍然具有局限性。第一，出于簡化的目的，模型只考慮了詞語加工，而沒有考慮句法加工、語義加工和篇章加工等高級認知加工過程。這些加工過程也會影響眼動行為。第二，模型沒有語音加工模塊和語義加工模塊，因此無法模擬與語音預視效應和語義預視效應相關的研究發現。同時，由于模型缺乏語義加工模塊，因此無法模擬在加工重疊歧義字段時的回視眼動行為。當模型在加工的初始階段出現錯誤時，無法像人類讀者一樣進行檢測和糾正。未來的工作可以考慮這些影響并進一步發展模型。第三，當前的模型假設漢字受到插槽的限制，即一個漢字只能鏈接到一個插槽。然而，一些研究表明漢字位置的編碼可能沒有那么嚴格，即使改變了位置，讀者仍然能夠識別詞語。對于這一發現，需要進一步研究并修改模型以做出解釋。

6 結論

CRM 模型實現了一個模擬中文閱讀中詞語加工和眼動控制之間關系的計算模型。模型解釋了中文閱讀中有關讀者如何進行詞切分，如何進行眼跳目標的選擇等重要問題。模型成功地模擬了中文閱讀中一些重要的眼動研究發現。

猜你喜歡

注視點詞頻眼動

眼動儀技術在里院建筑特色分析中的應用

智能建筑與智慧城市(2022年9期)2022-09-28

基于眼動的駕駛員危險認知

汽車實用技術(2022年7期)2022-04-20

基于詞頻分析法的社區公園歸屬感營建要素研究

園林科技(2021年3期)2022-01-19

基于ssVEP與眼動追蹤的混合型并行腦機接口研究

載人航天(2021年5期)2021-11-20

基于超復數小波和圖像空域的卷積網絡融合注視點預測算法

蘭州理工大學學報(2021年5期)2021-11-02

射擊運動員的反向眼跳研究

體育時空(2017年6期)2017-07-14

基于中央凹圖像顯著性和掃視傾向的注視點轉移預測模型

復旦學報（自然科學版）(2016年4期)2016-09-21

國外翻譯過程實證研究中的眼動跟蹤方法述評

外語學刊(2016年4期)2016-01-23

詞頻，一部隱秘的歷史

讀者·校園版(2015年7期)2015-05-14

云存儲中支持詞頻和用戶喜好的密文模糊檢索

深圳大學學報（理工版）(2015年5期)2015-02-28

心理與行為研究2023年6期

心理與行為研究的其它文章: 反芻思維量表在不同性別和抑郁癥狀醫學院校新生中的測量等值性 *; 父母教養方式類型與青少年網絡成癮的關系：認知情緒調節策略的中介作用 *; 詞素位置概率信息在中文雙字詞識別中的作用：詞匯語境多樣性的調節 *; 漢語“N 的V”結構加工的韻律制約 *; 準確性提示降低錯誤信息的分享意愿 *; 項目區分度指標在屬性多水平和混合計分項目下的組卷研究 *

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合