?

基于智能家居語音識別多樣化結果的意圖分類方法

2023-11-29 11:26余波張立為

數字技術與應用 2023年11期

關鍵詞：韻母詞典命令

余波張立為

1.上海市物聯網行業協會；2.上海城建職業學院

隨著人工智能浪潮的興起，智能家居逐漸走入千家萬戶，這其中語音識別發揮了極大作用。在實際應用中，語音識別的結果有著眾多不確定性，如外界環境、發音方式、方言習慣、語音質量等都對語音識別的準確率提出了挑戰。其中語音識別的結果對語義理解的影響較大，不準確的語音識別結果將影響話語的意圖分類。因此，本文需要設計一種基于智能家居語音識別多樣化結果的意圖分類方法。該方法結合家居命令詞的特點、語音識別結果與實際命令詞的差異情況，能更準確地實現智能家居話語的意圖分類。

1 語音識別結果分析與規則詞典構建

在智能家居項目中，系統需要能夠識別語音命令詞并且控制設備執行相應的動作，如命令詞“低檔風”，意為設備開啟最小風。在實際使用中，命令詞語音識別結果與實際命令詞具有差異，我們結合命令詞的特點、語音識別結果文本與實際命令詞的差異情況，可以構建相應的詞典，用來輔助意圖分類。

1.1 命令詞與語音識別結果文本的特點

基于智能家居項目業務，我們收集了智能家居命令詞共232 條，其中包含設備、模式、功能的開關和調整等指令，我們將這些命令詞按語音特性拆分為2210 個聲母韻母。通過分析命令詞語音特性可以看到，命令詞中的開口呼韻母占較大比重為22%，其次是齊齒呼韻母、合口呼韻母、舌尖后音、舌尖中音，比重分別為17%、11%、10%、10%，這些類別存在誤讀和誤識別的可能性[1]。由于漢語發音時發音部位和發音方法的不同，發音時氣流受阻的位置、發音部位控制氣流的方式也會不同，這為語音識別帶來了較多難題。

在項目中，我們收集了命令詞的語音識別結果文本，整理了正誤詞對照表并分析了其語音特性，通過篩選語音識別正誤差異讀音得到4584 個聲母韻母。我們將其中出現頻數較大的易混淆對進行了統計，結果表明不送氣音與送氣音混淆對的占比較大，其次是前鼻音與后鼻音、單韻母與復韻母、舌尖前音與舌尖后音。這些易混淆對影響語音識別結果的準確度，需要特別關注。

通過分析命令詞與語音識別結果文本的特點可以發現，語音識別的準確率受多種因素影響。如果語音識別的不準確結果經過意圖識別模塊時被錯誤分類，將對語義理解整體流程產生災難性影響。因此，需要根據命令詞與語音識別結果文本的特點，結合現代漢語語音規律，構建規則詞典并設計一種意圖分類方法，提高意圖分類準確率[2]。

1.2 規則詞典構建

通過命令詞與語音識別結果文本特點分析，我們可以構建規則詞典，用以輔助意圖分類方法的實現。規則詞典包含以下類別：（1）智能家居命令詞詞典。該詞典包含項目所需的232 條命令詞。（2）語音識別結果正誤對照詞典。根據實際項目的測試結果，收集命令詞語音識別結果文本，整理后得到正確與錯誤識別命令詞的對照詞表。（3）現代漢語易混淆聲母韻母詞典。根據現代漢語語音的方音辨證方法，結合語音識別結果正誤對照詞典，構建易混淆的聲母或韻母對共84 對。其中包含舌尖音與舌面音、不送氣音與送氣音、前鼻音與后鼻音等多種易混淆對。以上詞典可以輔助意圖分類方法的實現。智能家居命令詞詞典幫助意圖識別明確需要界定的分類，將屬于智能家居意圖類別的話語限定于較小范圍內。語音識別結果正誤對照詞典、現代漢語易混淆聲母韻母詞典幫助我們擴大搜索范圍，讓用戶誤讀或語音識別錯誤的結果能夠被意圖識別模塊捕獲并正確分類。

2 意圖分類方法設計與實現

在實際應用中，語音識別的結果受外界環境、發音方式、方言習慣、語音質量等多方面因素影響，其中的不準確結果經過意圖識別模塊時如果被錯誤分類，將會對語義理解產生較大影響。因此，根據命令詞與語音識別結果文本的特點，結合現代漢語語音規律，構建規則詞典并設計一種意圖分類方法，可以提高基于語音識別結果文本的意圖分類準確率。

2.1 意圖分類方法設計

本文的意圖分類方法根據構建的智能家居命令詞詞典、語音識別結果正誤對照詞典、現代漢語易混淆聲母韻母詞典，生成命令詞及其易混淆音節總詞典。通過構建2-GRAM 模型，計算總詞典中的單詞出現概率、雙詞共現概率，評估詞典中句子的出現概率。在此基礎上，取詞典中句子出現概率的最小值作為基線，進行意圖分類。句子進入意圖識別模塊后，先進行概率計算，凡是高于最小概率的句子進入智能家居分類，凡是低于最小概率的句子排除出該分類。意圖分類方法整體設計如圖1 所示。

圖1 意圖分類方法整體設計Fig.1 Overall design of intent classification method

本文所述的意圖分類方法涉及以下幾個方面：（1）命令詞及易混淆音節總詞典生成。將智能家居命令詞詞典中的命令詞按語音特性拆分為音節及聲母韻母組合，然后根據命令詞在易混淆聲母韻母詞典中的常見混淆情況，結合語音識別結果正誤對照詞典，找出命令詞的易混淆讀音。智能家居命令詞詞典中每條命令詞及其易混淆讀音組合，構成了命令詞及易混淆音節總詞典。（2）利用貝葉斯公式計算句子出現概率[3]。根據命令詞及易混淆音節總詞典，獲取命令詞及其易混淆讀音組合，統計詞典中各項的頻數。然后根據拉普拉斯平滑公式，構建2-GRAM 模型，計算單詞出現率、雙詞共現率。最后基于模型計算句子的出現概率，計算模型的句子出現概率的最小值。（3）根據句子出現概率進行意圖分類。本文的意圖分類方法將模型的句子出現概率最小值作為模型句子出現最小概率，以此輔助意圖類別的判斷。在意圖分類過程中，根據2-GRAM 模型，我們為每個進入意圖識別分類模塊的句子計算出現概率，并將其概率值與最小概率值作比較。凡是高于最小概率的句子進入智能家居分類，凡是低于最小概率的句子排除出該分類。這樣就實現了二分法的意圖識別分類。

2.2 意圖分類方法實現

根據項目業務需要，本意圖分類方法已使用Python、Java 語言實現。其中主要涉及的功能模塊包含詞典生成模塊、概率模型構建模塊、概率計算模塊、意圖分類模塊。通過圖1 可以看到本文所述的意圖分類方法的實現涉及以下方面：（1）詞典生成模塊主要根據智能家居命令詞詞典，對命令詞文本進行音節、聲母韻母拆分，然后根據語音識別結果正誤對照詞典、現代漢語易混淆聲母韻母詞典，為每條命令詞找到易混淆聲母韻母組合，最終完成命令詞及易混淆音節總詞典的構建。（2）概率模型構建模塊主要基于命令詞及易混淆音節總詞典，統計單詞、雙詞詞頻，完成2-GRAM 模型的構建，用以計算單詞出現率、雙詞共現率，預測句子的出現概率[4]。（3）概率計算模塊主要基于2-GRAM 模型，計算句子出現概率，并且計算詞典中句子出現概率的最小值作為最小概率值，然后以最小概率作為意圖分類的判斷依據。根據計算結果，我們選定模型的句子出現最小概率值為1.1768093503040191e-24。（4）意圖分類模塊主要基于用戶話語文本輸入，進行音節、聲母韻母拆分，隨后基于2-GRAM 模型計算句子的出現概率，最后依據最小概率進行意圖分類判斷，判斷此話語是否應該進入智能家居意圖分類。意圖分類方法的實現，最關鍵的是意圖分類模塊的實現。

意圖分類模塊接收用戶話語文本作為輸入數據，將最終完成類別判斷的意圖分類結果作為輸出，其實現流程包含以下幾個方面：（1）處理用戶話語文本。意圖分類模塊在接收到用戶話語文本即語音識別結果文本后，按語音特性對文本進行處理，將文本轉換為音節及聲母韻母組合。（2）計算句子出現概率。在獲得聲母韻母列表后，通過調用2-GRAM 模型，計算單詞出現概率、雙詞共現概率并做概率統計，然后基于詞單位的統計結果，對句子出現概率進行計算。（3）進行意圖分類[5]。結合句子出現概率、模型最小概率，將句子出現概率與最小概率進行比較。當句子出現概率高于最小概率時，將句子分入智能家居意圖類別；當句子出現概率低于最小概率時，將句子分入非智能家居意圖類別。意圖分類模塊最終給出意圖分類結果，支持其他語義處理模塊的功能實現。

3 測試分析

意圖分類在語義處理流程中居于首要地位，意圖分類的結果直接影響語義理解功能，因此好的意圖分類方法能夠幫助提升語義理解準確度。根據項目業務需要，以測試意圖分類方法的意圖分類效果為目標，我們準備測試集、確定測試指標并進行測試，通過分析測試結果，評估該意圖分類方法的應用效果。

3.1 測試集與測試指標

我們選擇了純智能家居測試數據集、智能家居與其他意圖分類混合數據集、純非智能家居分類測試數據集等類型的數據集。其中各測試數據集詳情包括如下幾個方面：（1）純智能家居測試數據集。選擇由項目客戶測試產生的命令詞測試數據，以及系統原有智能家居分類測試數據共計605 條，作為測試意圖分類應分入智能家居分類的測試數據。（2）智能家居與其他意圖分類混合數據集。選擇項目需求命令詞、閑聊數據、原有智能家居分類測試數據進行混合，數據共計4191 條，用于測試意圖分類能否準確對家居和非家居的意圖進行分類。（3）純非智能家居分類測試數據集。系統本有智能家居、音樂、閑聊等功能分類，因此將非智能家居分類的測試句用于測試意圖分類能否準確排除非智能家居分類的句子。純非智能家居分類測試數據共計16698 條。

對于意圖分類方法的測試，我們將意圖準入率、誤入率作為測試指標。準入率主要用于衡量本應屬于智能家居意圖分類的句子，有多少準確進入智能家居分類；誤入率主要用于衡量不屬于智能家居分類的句子，有多少被錯誤分入智能家居分類。

3.2 測試結果分析

我們采用測試集對基于方法實現的意圖分類功能進行測試。結果發現，在準入率方面，純智能家居測試數據集的準入率為0.97%，智能家居與其他意圖分類混合數據集的準入率為0.78%；在誤入率方面，純非智能家居分類測試數據集的誤入率為0.1%，智能家居與其他意圖分類混合數據集的誤入率為0.08%。

通過以上數據可以看到，意圖分類功能經測試，其效果較好，測試數據集的平均準入率達到0.87%，平均誤入率為0.09%，基本符合預期。

4 結語

本文基于智能家居項目的語音識別應用情況，設計一種意圖識別分類方法，該方法主要為適應語音識別的多樣化結果。語音識別的實際結果文本與預期有所差異，結合命令詞的特點、現代漢語語音特性，我們能夠構建規則詞典、設計意圖分類方法，使其滿足智能家居話語的意圖分類需要。測試結果表明，這種意圖分類方法能夠提高意圖分類準確率，適應了項目業務的需要。

猜你喜歡

韻母詞典命令

今日農業(2022年16期)2022-11-09

只聽主人的命令

娃娃樂園·綜合智能(2022年3期)2022-04-19

米沃什詞典

文苑(2019年24期)2020-01-06

單韻母扛聲調

作文周刊·小學一年級版(2019年28期)2019-09-07

移防命令下達后

軍營文化天地(2018年2期)2018-04-20

《湘水韻》及其編撰原理要點

魅力中國(2018年31期)2018-03-26

評《現代漢語詞典》(第6版)

瘋狂英語(雙語世界)(2017年3期)2018-01-19

詞典例證翻譯標準探索

瘋狂英語(雙語世界)(2017年1期)2017-07-01

這是人民的命令

中國老區建設(2016年9期)2016-02-28

《胡言詞典》(合集版)刊行

當代修辭學(2013年4期)2013-01-23

數字技術與應用2023年11期

數字技術與應用的其它文章: 基于DeformMobileViT 的城市地下管道異常樣本判別*; 自動化技術在農業機械設計制造中的運用; 基于改進粒子群算法辨識永磁同步電機伺服系統負載轉矩及轉動慣量*; 基于Relief-WGS 優化算法的圖像分類方法*; 云計算技術在計算機網絡安全存儲中的實施策略; 烈度計臺網數據質量分析與異常檢測

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合