?

評價對象抽取及其傾向性分析

2010-06-05 08:35劉鴻宇趙妍妍
中文信息學報 2010年1期
關鍵詞:褒義傾向性極性

劉鴻宇,趙妍妍,秦 兵,劉 挺

(哈爾濱工業大學 計算機學院 信息檢索研究室,黑龍江 哈爾濱 150001)

1 引言

情感分析主要是針對主觀性文本單元自動獲取有價值的意見信息,是一個新穎且非常有應用價值的研究課題。情感分析技術可被廣泛應用于多種自然語言處理問題中,如:問答系統[8],信息抽取系統[9]等。同時,情感分析也產生了許多有挑戰性的相關子方向。例如:文本主客觀分析,旨在識別文本單元的主客觀性;情感分類,旨在識別主觀文本單元是褒義、中性還是貶義。

本文致力于研究情感句中的評價對象抽取及其情感傾向性判斷任務。該任務可分為兩個主要階段:(1)自動識別情感句中的評價對象; (2)判別情感句中評價對象的情感傾向性。例如:對于某一評論“這款相機的電池壽命很長,但價格太高?!?,系統首先識別出評論中的評價對象(如:“電池壽命”和“價格”),然后結合修飾評價對象的評價詞語(如:長,高)給出兩個評價對象的相應情感傾向性,即“電池壽命—長”→“電池壽命,褒義”,“價格—高”→“價格,貶義”。

關于評價對象的獲取,已有的方法主要可以歸為兩類:人工構建[3]和關聯規則挖掘[4-5],人工構建的缺點在于需要大量人力,且可移植性較差;關聯規則挖掘的缺點在于沒有充分考慮短語評價對象的結構特征以及評價對象的領域相關性,會產生很多噪聲。

關于評價對象的傾向性判斷,已有的工作包含有指導和無指導兩類方法。關于有指導方法,Kim和Hovy使用詞、位置以及情感詞三類特征來對情感句進行分類[6];趙軍等人使用CRF和冗余標簽對句子序列進行情感傾向性標注[7],有指導方法的缺陷在于需要人工標注大量語料,不利于領域切換。無指導方法目前主要是基于句法規則的方法[3,5],此類方法的優點在于能夠準確的描述情感詞和評價對象之間的修飾關系,缺點在于各種修飾關系需要人工統計,導致召回率不高。Minqing Hu和Bing Liu基于句子的情感詞以及上下文信息來判定傾向性[8],但他們的方法主要處理英文,系統中的部分技術無法直接向中文移植,同時有以下兩類問題沒有很好的解決,一是句子中褒、貶情感詞數目相同,二是含有上下文相關情感詞的句子。

鑒于以上方法的不足,本文使用無指導方法進行評價對象抽取和傾向性分析。評價對象抽取上,使用基于句法分析技術的評價對象抽取方法,同時加入三種過濾技術。在傾向性分析階段,將情感句分為四類,采用分治策略對各類別情感句制定相應的判定規則,從而完成評價對象的傾向性判定。該方法在第一屆中文傾向性分析評測中取得了較好的成績。圖1給出了系統框架圖。

圖1 系統框架圖

2 基于句法路徑的評價對象抽取

本文使用基于句法分析的評價對象抽取技術。對于給定語料,首先對其進行分詞、詞性標注以及句法分析等處理,然后提取其中的名詞(NN)和名詞短語(NP)得到候選評價對象;繼而對候選評價對象使用頻率過濾、PMI算法和名詞剪枝等算法進行篩選得到最終的評價對象表。

2.1 候選評價對象抽取

評價對象可以是名詞或名詞短語。關聯規則挖掘方法提供了一種抽取語料中頻繁項的方法,可以有效的抽取語料中的評價對象。但其存在一定問題,就是在判定兩個詞能否形成短語時僅考慮了兩個單詞的共現次數,并沒有考慮到短語的句法結構,為此,我們引入了句法分析技術來抽取評價對象??疾烨楦芯洹斑@款電腦的續航能力很強,但價格太高?!逼渚浞ńY構如圖2所示。使用關聯規則挖掘方法,若“能力”和“價格”的共現次數足夠多,則“能力價格”會被識別成評價對象。按照我們的句法限制,此句的評價對象為“續航能力”、“續航”、“能力”、“價格”,可以看出,通過使用句法信息,我們能夠避免抽取出“能力價格”這種錯誤評價對象,但同時也會產生一定的噪聲(續航、能力),為此,我們引入了三種過濾技術,下面對其進行詳細介紹。

圖2 句法分析示例

2.2 評價對象篩選

由句法分析得到的候選評價對象集存在一定的噪聲,為此,我們加入了相應的過濾技術。評價對象篩選流程如下:首先,使用詞頻信息進行過濾;其次,使用基于網絡挖掘的PMI算法進行過濾;最后,使用名詞剪枝技術解決單個詞的冗余現象。下面分別對這三項技術進行介紹:

1) 詞頻過濾:

詞頻過濾即將語料中出現次數比較少的NN或NP過濾掉。詞頻信息過濾的加入主要基于兩點考慮:1.評價對象更傾向于在評論中多次出現,一些不相關的NN或NP應該在商品中很少出現,如“有限公司”、“多圖”等。2.詞頻信息過濾可能會過濾掉一些評價對象,但這對系統的結果影響不會很大,因為那些出現次數較少的評價對象并不被大多數人所關心,屬于次要屬性。

2) PMI過濾(Pointwise Mutual Information):

PMI值能夠量化詞與詞之間的關系,在一定的文本集合中,詞a和b的PMI值定義如下:

PMIa-b=Nab/(Na×Nb)

其中,Nab表示既包含a又包含b的文本數,Na表示含有a的文本數,Nb表示含有b的文本數。從公式中可以看出,PMI值的計算使用了統計的思想,同時基于這樣一個假設:兩個單詞共現的次數越多,則它們之間的聯系也就越大。PMI值計算的難點在于大規模文本集合的獲取,理論上講,文本數越多,則統計效果越明顯,PMI值的計算也應該越準確。

本文使用PMI值來進一步挖掘評價對象的領域相關性。為了得到足夠大的語料,本文選取百度的搜索結果作為語料庫。方法如下:針對每一領域,選取最具代表性的詞語wa,計算候選評價對象w與相關領域wa的PMI值,值越大,則說明w的相關性越強,更可能成為一個評價對象。最后通過設定閾值的方法進行過濾,實驗表明這種方法取得了比較好的效果。

3) 名詞剪枝:

此技術主要應用于冗余名詞的過濾。為了說明什么是冗余,本文首先定義s-support:對于名詞t,設包含t的句子數為s,在s個句子中,t單獨作為評價對象出現的句子數為k(這k個句子中不含有包含t的短語),則s-support=k/s。對于s-support值小于0.5的名詞評價對象,本文認為它是冗余的,作過濾處理。

3 評價對象傾向性判斷

針對該任務,本文首先分析情感句的結構,將其分為四類;繼而針對各類制定相應的傾向性判斷規則,最終基于無指導的方法完成評價對象的傾向性判斷。下面對其進行詳細介紹。

3.1 情感句型分類

通過觀察語料,本文將句子分為四類,具體定義如下:

類別一:句子帶有明顯的傾向性,即句子中帶有一種傾向性(褒義或貶義)的上下文無關情感詞明顯多于另一種。例如:“這款數碼相機的質量不錯外形也很漂亮”,這句話的情感詞為“不錯”和“漂亮”,均為褒義,則此句明顯含有褒義的傾向性。

類別二:句子不帶有明顯的傾向性,但句子中含有情感詞,且褒義和貶義情感詞的個數相同。例如:“這款相機的質量不好但外形很漂亮”,這句話中含有“不好”和“漂亮”兩個情感詞,極性分別為貶義和褒義,但不能說此句的傾向性是褒義還是貶義。

類別三:句子不帶有明顯的傾向性,且句子中沒有情感詞,但其上下文的句子帶有明顯傾向性。例如:“這款相機的質量非常好,照出的照片也一樣”,“照出的照片也一樣”這句話本身不含有情感詞,但此句的前一個句子“這款相機的質量非常好”帶有明顯的傾向性。

類別四:句子不帶有明顯的傾向性,句子中沒有情感詞,且其上下文的句子也不帶有明顯傾向性。例如:“我購買相機主要看中質量?!?、“銳志和皇冠有很多類似的地方,如外型、內飾等”。

3.2 傾向性判定規則

針對前三類句子,本文分別定義規則對其進行處理,這三個規則也是本文傾向性判斷的基礎;對于第四類句子來說,無法找到一個通用的規則,為此本文引入了上下文相關極性詞的概念,下面對具體規則進行詳細介紹:

規則一:對于第一類句子,句子中評價對象的極性與句子的極性相同,如“這款相機的質量不錯外形也漂亮”,這個句子的傾向性為褒義,則其中的評價對象“質量”和“外形”均為褒義。

規則二:對于第二類句子,找出句子中的評價對象,針對每個評價對象,選取評價對象8個字(實驗表明這個窗口大小比較合適)的范圍內與其最近的情感詞作為直接修飾它的情感詞,評價對象的極性即與修飾它的情感詞的極性相同。

規則三:對于第三類句子,使用上下文信息進行判斷,當前句子優先與前一個句子的極性相同,如其前一個句子也不存在明顯的傾向性,則認為當前句子與其后一個句子的傾向性相同。句子的傾向性判定之后,則句子中所有評價對象的極性與此句子的極性相同。

規則四:最后一類句子中包含了剩余的所有句子,為了進一步挖掘此類句子中的情感句,本文引入了上下文相關情感詞的概念??紤]“這款相機的電池壽命很長?!边@個句子,“長”這個詞本身并不含有極性,但在修飾“壽命”的時候,就含有了一定的極性,我們將這種詞稱為上下文相關情感詞。針對這種情況,相應的評價對象傾向性判定方法如下:首先找出句子中的評價對象,然后查找距離其最近的上下文相關情感詞,如果二元對〈情感詞,評價對象〉含有極性,則抽取結果,否則過濾掉。上下文相關情感詞表較小,并搭配評價對象而產生傾向性,該詞表由人工構建。

這四類句子的處理優先級與上面介紹的順序相同,即對一個句子,依次判斷它是否屬于某一類,屬于則按照相關規則處理,給出傾向性結果,若無傾向性,則直接過濾掉。

4 實驗結果及分析

本文通過第一屆中文傾向性分析的評測結果來說明本文方法的有效性,對系統所使用技術的評價包括三個方面:1.系統的總體性能,即評價對象抽取以及傾向性分析的結果;2.三種候選評價對象過濾方法對系統指標的影響;3.情感句分類精度。下面對這三個方面進行詳細介紹。

4.1 系統總體性能

本系統參加了第一屆中文傾向性分析評測,在評測中取得了較好的成績。此次評測的語料主要涉及汽車、手機、數碼相機以及筆記本四個領域,共有473篇文檔(3 000個句子,10 000個具有傾向性評價的評價對象)。評測方法有精確評價和覆蓋評價兩種,精確評價是指抽取的實體與答案完全匹配,覆蓋評價是指抽取的實體與答案有重疊就看作正確匹配,其中重疊部分大小可以調整,用多個參數進行評價。表1給出了系統在這兩種情況下評價對象抽取的性能指標。

表1 評價對象提取的評測結果對比

由結果可以看出,本文的評價對象提取部分在Strict評價和Lenient評價中均遠遠高于平均水平,且在Lenient評價中取得了最好的成績,這也進一步證明了本文方法的有效性。但盡管如此,我們發現該系統還是存在一定的問題。通過觀察可以看出,Lenient下的屬性抽取結果明顯要優于Strict下的屬性抽取結果,這說明了系統對評價對象的定位準確,但邊界識別存在一定的問題,造成邊界識別錯誤的原因主要有以下兩點:1.評價對象本身為復雜短語,如“空調系統面板的布局”、“P.A.T.S.發動機電子控制防盜模塊”等;2.預處理模塊(分詞、句法分析)帶來的噪音。因此,如何解決復雜短語以及預處理模塊的糾錯是我們今后研究的主要方向。

表2 評價對象傾向性判斷的評測結果對比

表2給出了評價對象傾向性判斷的評測結果。評價對象的傾向性分析是基于評價對象抽取結果的,存在錯誤累加效果。通過對比表1和表2,我們發現傾向性分析的F值(0.336 7、0.473)并沒有較評價對象抽取的F值(0.397 6、0.516 9)下降很多,這說明對于絕大部分被正確抽取出的評價對象,我們的傾向性分析結果都是正確的,這充分說明了我們的傾向性分析規則的合理性。

4.2 評價對象過濾技術性能

選取筆記本領域的語料對評價對象過濾技術的有效性進行驗證,筆記本領域共有語料56篇,1 036個具有傾向性評價的評價對象,選取的評價方式為精確評價。表3給出了在筆記本領域三種過濾技術對系統指標的影響。表的第一行為未對候選評價對象集進行過濾所得到的結果,接下來的三行依次為加入每種過濾方法得到的結果。

由表3可以看出,隨著加入各種過濾技術,系統指標不斷上升,在加入PMI值過濾技術后,系統指標明顯上升,這也與本文的設想一致,即通過PMI值挖掘領域信息,能夠有效的過濾候選評價對象集中的噪聲。

表3 過濾技術對系統指標的影響

4.3 情感句型識別精度

本文將情感句分成四類,對于每種句型,均有相應的處理方法來判定其中評價對象的情感傾向性,因此,情感句型分類的精度將直接影響評價對象傾向性判定的精度。本文選取第一屆中文傾向性分析的語料對情感句型識別進行評價,分別從這四個領域各隨機抽取50個句子,人工對這200個句子進行標注,表4給出了這兩部分語料的情感句分類精度。

表4 情感句分類精度

可以看出,情感句類別精度在各個類別大體相當,均為80%左右。情感句型識別是以情感詞表為基礎,而情感詞表本身會存在噪聲和不完全兩類問題,即情感詞表中的詞可能是錯誤的,且部分情感詞

可能并未在情感詞表中,就會造成情感句分類不準的情況,如“按鍵設計凹凸有質?!边@個句子,本應屬于第一類情感句,但由于情感詞“凹凸有質”并不在情感詞表中,導致此句子會被錯誤分為第三類情感句。因此,建立更加準確、完整的情感詞表也是我們下一步的主要工作之一。

5 結論與未來工作

本文實現了一個評價對象抽取及其傾向性判斷系統,可分為評價對象抽取和傾向性判斷兩個部分,系統在COAE2008的評測中取得了較好的成績。由評測的總體結果可以看出,情感分析技術目前還處于初級階段,因此還有很廣闊的研究空間。如何更準確的確定評價對象邊界,如何挖掘出更多的情感句等等,都將成為我們下一步的工作。

[1] Hong Yu,Vasileios Hatzivassiloglou. Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences[C]//Proceedings of EMNLP-2003,2003: 129-136.

[2] Ellen Riloff,Janyce Wiebe,William Phillips. Exploiting subjectivity classification to improve information extraction[C]//Proceedings of AAAI-2005,2005: 1106-1111.

[3] 姚天昉,等. 一個用于漢語汽車評論的意見挖掘系統[C]//中文信息處理前沿進展—中國中文信息學會二十五周年學術會議論文集. 北京:清華大學出版社,2006:260-280.

[4] Minqing Hu,Bing Liu. Mining opinion features in customer reviews[C]//Proceedings of AAAI-2004,2004: 755-760.

[5] 倪茂樹,林鴻飛. 基于關聯規則和極性分析的商品評論挖掘[C]//第三屆全國信息檢索與內容安全學術會議,2007:635-642.

[6] Soo-Min Kim,Eduard Hovy. Automatic detection of opinion bearing words and sentences[C]//Proceedings of IJCNLP-2005,2005:61-66.

[7] Jun Zhao,Kang Liu,GenWang. Adding redundant features for crfs-based sentence sentiment classification[C]//Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing,2008:117-126.

[8] Minqing Hu,Bing Liu. Mining and summarizing customer reviews[C]//Proceedings of KDD-2004,2004: 168-177.

猜你喜歡
褒義傾向性極性
基于模糊數學法的阿舍勒銅礦深部巖體巖爆傾向性預測
超重/肥胖對兒童腸套疊空氣灌腸復位的預后影響:傾向性評分匹配分析
跟蹤導練(四)
英語委婉語定義的局限與演變
紅蔥不同極性提取物抑菌活性研究
香椿子不同極性部位對糖尿病周圍神經病變的保護作用
“沒準兒”“不一定”“不見得”和“說不定”的語義傾向性和主觀性差異
“點”的覺醒
一種面向博客群的主題傾向性分析模型
說句好話挺難
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合