?

基于產生式規則的藏語存在句的識別研究

2022-02-24 00:08尕藏卓瑪安見才讓
計算機時代 2022年2期
關鍵詞:人工智能

尕藏卓瑪 安見才讓

摘? 要: 通過對藏語存在句的分析和研究,實現藏語存在句的識別。借助產生式的正向推理作為藏語存在句識別的知識表示方式,并用產生式規則搜索和匹配。從人工角度構建的一種基于產生式規則的藏語存在句的識別系統,以利藏語存在句的識別。該研究為實現藏語存在句的識別提供了基礎。

關鍵詞: 人工智能; 藏語存在句的識別; 產生式規則; 正向推理

中圖分類號:TP391.1? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2022)02-15-03

Research on recognition of Tibetan existential sentence based on production rule

Gazang Zhuoma, Anjian Cairang

(School of Computer, Qinghai Minzu University, Xining, Qinghai 810007, China)

Abstract: A recognition system of Tibetan existential sentences based on production rule is constructed from the artificial point of view to facilitate the recognition of Tibetan existential sentences. It uses the positive inference of production as the knowledge representation and inference algorithm of Tibetan existential sentence to search and match rules. The experiment has achieved the recognition of Tibetan existential sentence.

Key words: artificial intelligence; recognition of Tibetan existential sentence; production rule; forward reasoning

0 引言

識別藏語存在句,簡單的說就是以藏語句子的系統知識和理論為基礎,準確,有效,簡便,適當地從中識別藏語存在句。從信息角度看,識別藏語存在句實質上是一個在讀者和句子之間的信息運動過程。在這個過程中主要包括兩類信息,一是藏語理論知識及學習經驗等藏語知識信息,二是句子的基本結構,包括句子的信息和應用信息情況等。因此,在識別藏語存在句的信息化過程中如何準確的表示并實現這兩類信息之間的理解就成為了關鍵。

產生式系統是人工學科中的一個重要概念,它是構造知識型系統和建立認知模型時常用的知識表示的形式系統。它不僅用來對人類的問題求解方法建模[7],而且已經在多個領域得到了廣泛的應用,本文將產生式規則與藏語存在句的結構結合,提出基于產生式規則的識別藏語存在句的研究方法。

1 識別藏語存在句

即便藏語句子的數量是上千萬,但其中蘊含的最基本的規則是相對穩定的,所以可以把上千萬的句子用有限的句型去表示。對基于規則的藏語句法分析方法做了研究之后,按照句子的結構模式,把藏語句子歸納到了六種句型,有及物句、不及物句、存在句、特征句、一體句和神態句,這六種句型在藏語中是最常見的,也是十分重要的句型[1]。本文根據藏語句子的結構及藏語句型,對存在句進行了推理研究。

1.1 存在句的定義及結構

藏語句型存在句是表示某物依存于某地的表示方式,它的句型一般由依體(????????), 拉格助詞(????????????????? ???????????????一般用CP表示),被依體(?????????)和謂語(????????????????)組成,被依體是可選項。這些成分,分別由下列詞性擔任[1]:

1.2 存在句的推理

存在句中的依體是用一個名詞或方位詞等組成的。依體和拉格助詞(????????????????? ???????????????一般用CP表示)形成名詞性短語np 。被依體是可選項,如(?????????????? ?????????????????????)第一個句子中沒有被依體,第二個句子中有被依體,但這都不會影響整體去理解的句子的內容,我們還是能知道這是個存在句。還有(???????????????? ?????????????)存在句中的謂詞也扮演著重要的角色,因為后面謂詞的存在,能盡快的判斷該句子是一個存在句,一般常見的謂詞有“???? ????”等。被依體和謂詞形成存在性短語。在該實驗中存在句中的詞性以常見的詞性為研究對象。根據存在句常見的詞性結構,知識庫中只包含以下23條規則:

r1:IF 句型中有詞性nj? ? AND? cp? THEN? np

r2:IF 句型中有詞性nds? AND? cp? THEN? np

r3:IF 句型中有詞性f? ? AND? cp? ?THEN? np

r4:IF 句型中有詞性nd? AND? cp? ? THEN? np

r5:IF 句型中有詞性nj? ?AND? aq? ?THEN? vp

r6:IF 句型中有詞性nj? ?AND? dd? ?THEN? vp

r7:IF 句型中有詞性nj? ?AND? vae? THEN? vp

r8:IF 句型中有詞性nd? ?AND? aq? ?THEN? vp

r9:IF 句型中有詞性nd? ?AND? dd? ?THEN? vp

r10:IF 句型中有詞性nd? AND? vae? ?THEN? vp

r11:IF 句型中有詞性nj? ?AND? ?cpANDaq? THEN? S

r12:IF 句型中有詞性nj? ?AND? ?cpANDdd? THEN? S

r13:IF 句型中有詞性nj? ?AND? ?cpANDvae THEN? S

r14:IF 句型中有詞性nds? AND? cpANDaq? ?THEN? S

r15:IF 句型中有詞性nds? AND? cpANDdd? ?THEN? S

r16:IF 句型中有詞性nds? AND? cpANDvae? THEN? S

r17:IF 句型中有詞性f? ? AND? ?cpANDaq? ?THEN? S

r18:IF 句型中有詞性f? ? AND? ?cpANDdd? ?THEN? S

r19:IF 句型中有詞性f? ? AND? ?cpANDvae? THEN? S

r20:IF 句型中有詞性nd? AND? ?cpANDaq? ?THEN? S

r21:IF 句型中有詞性nd? AND? ?cpANDdd? ?THEN? S

r22:IF 句型中有詞性nd? AND? ?cpANDvae? THEN? S

r23:IF 句型中有詞性np? AND? ?vp? ? ? ? ? THEN? S

名詞中有nj(隨立名),nds(地名),f(方位詞),nd(隨欲名)。用cp表示拉格助詞。謂語中有aq(形容詞),dd(否定詞),vae(助動詞)詞性。np表示名詞短語。vp表示存在性短語。S表示存在句,如圖1所示。

2 產生式規則系統

2.1 組成

一個產生式系統包括以下三部分(圖2):綜合數據庫,知識庫(規則庫)和控制系統。綜合數據庫(database)用來存放與求解問題有關的各種當前信息的數據結構。知識庫及規則庫用來存放與求解問題有關的所有規則的集合,它包含了將問題從初始狀態轉換成目標狀態所需的所有變換規則??刂葡到y(control system)也稱推理機,是由一組程序組成,用來控制整個產生式系統的運行,決定問題求解過程的推理線路,實現對問題的求解[2]。

2.2 產生式推理方法

控制系統對產生式規則的使用主要有兩種方法:正向推理和反向推理。指的是從現有事實出發,搜索知識庫中的規則并檢查事實是否與規則的前提條件相符,不斷進行直到預期目標實現。反向推理,即從目標出發,尋找以此目標為結論的規則,并對該規則的前提進行判斷,反復直至能夠對某規則的前提進行判斷。若是既為正向推理又為反向推理方式,則稱為雙向推理,它綜合了正向推理和逆向推理的長處,并克服了兩者的短處。

3 基于產生式規則的識別藏語存在句

3.1 識別藏語存在句的產生式規則表示

知識庫是產生式系統的核心,識別藏語存在句的系統中,知識就是存在句的使用方式,存在句的組成包含相應的詞性信息,詞性是識別藏語存在句的重要知識來源。而在識別藏語存在句中,存在句的基本結構和詞性是主要知識來源。

在詞性識別中,其原理是根據輸入的詞性同輸入的詞性組在結構組成上是否具有規則,如有則形成存在句。主要從句子的組成部分及內部結構的詞性來判斷輸入的句子是否是存在句,當輸入的詞性有(????????/nj??/cp??????/nj???/vae)時判斷是存在句類的,輸入的詞性有(????????/nj??/cp???/vae)時也會判斷是存在句類。

3.2 識別藏語存在句的系統的推理機制

⑴ 把用戶提供的初始證據放入綜合數據庫。

⑵ 檢查綜合數據庫中是否包含了問題的解,若已包含,則求解結束,并成功退出;否則執行下一步。

⑶ 檢查知識庫中是否有可用知識,若有,形成當前可用知識集,執行下一步;否則轉⑸。

⑷ 按照某種沖突消解策略,從當前可用知識集中選出一條知識進行推理,并將推出的新事實加入綜合數據庫中,然后轉⑵。

⑸ 詢問用戶是否可以進一步補充新的事實,若可補充,則將補充的新事實加入綜合數據庫中,然后轉⑶;否則表示無解,失敗退出。

3.3 實驗結果

在該實驗中主要以常見的存在句為研究對象的,并從抽取了90個存在句。這些句子分成三部分,第一部分是(nj/nds/f/nd+cp+nj/nd+aq/vae/dd)詞性結構組成的,第二部分是(nj/nds/f/nd+cp+aq/vae/dd)詞性結構組成的。表1是產生式規則的藏語存在句識別的結果。

實驗結果表明,語料中的句子的形成結構的不同,對實驗的準確率各不相同,這主要原因是藏語句子結構的復雜度。另外,存在句的規則庫的不完整和詞性結構不齊全因素,所以還需要進一步完善規則庫和豐富詞性結構。

4 結束語

從人工的角度實現了識別藏語存在句推理,基本達到了設計目的,但由于藏語句型對識別藏語存在句知識的確定性和準確性要求較高,因此該研究未能實現推理知識的更全面的知識內容,同時由于藏語句子結構的復雜性,識別藏語存在句的知識表達也有待進一步完善。

參考文獻(References):

[1] 安見才讓.藏文信息處理原理與技術實現[M].青海民族出版社,2017.12

[2] 王萬森.人工原理及其應用(第三版)[M].北京:電子工業出版社,2012.9

[3] 李雷,高鐵曼.產生式規則專家系統的原理與實現[J].微計算機應用,2006,27(5)

[4] 格桑居冕.實用藏文文法教程[M].四川民族出版社,2004.11

[5] 袁國忠.python基礎胡教程(第3版)[M],北京:人民郵電出版社,2018.2

[6] 劉穎.計算語言學[M].清華大學出版社,2014

[7] Luger GF. Artificial intelligence: Structures and strategiesfor complex problem solving(6th edition)[M].Boston: Addison-Wesley,2008

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
當人工智能遇見再制造
2019:人工智能
AI人工智能解疑答問
人工智能與就業
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
人工智能來了
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合