?

馳聲:語言學習的“智慧大腦”

2018-12-25 09:09董莉
IT經理世界 2018年24期
關鍵詞:遠東發音題型

董莉

林遠東從沒想過當年在劍橋大學上學時,當中文老師的經歷會在后來的創業道路上成為一束激發頭腦風暴的光。

“當時,外國學生學習中文時有一個音一直掌握不好,就是ü,經常會發錯音。通過一位教學專家傳授經驗,我告訴學生把發E的音,嘴形變成U,就可以發ü?!绷诌h東回憶道,“那么,有沒有辦法讓我知道這個孩子實際上錯成什么了。有了這個辦法就可以通過嘴形和各種各樣的結構圖,指導孩子進行正確的發音練習。但目前市面上的常有的方式能做到的是評分,但是我要告訴學習者,怎樣去正確發音?!?/p>

而這個靈感激發讓林遠東在之后的創業中有了不一樣的思考角度。

馳聲創始人及CEO林遠東,他的團隊以源于劍橋大學的智能語音技術為起點,幫助客戶實現人機互動的智能學習

2007年,馳聲在英國劍橋初步建立團隊的時候,人工智能還不像現在這么火熱。彼時林遠東他們的想法很簡單——口語練習在技術出現之前很難形成閉環,大量的口語練習在課堂教學里面很不現實,“結合自身的經歷,我們用智能語音技術很好的解決了這個問題,我在這個行業也堅守10多年了,從未離開?!瘪Y聲創始人及CEO林遠東介紹,團隊以源于劍橋大學的智能語音技術為起點,自主研發了基于大數據、深度學習的智能語音系列技術,幫助客戶實現人機互動的智能學習產品。

多年來,圍繞語言教育,馳聲的技術已經發展為三方面能力的評估:第一個為發音能力評估,主要解決單詞、句子、段落和篇章朗讀的發音評分,單詞可以實現音素級發音檢測、重讀檢測等一系列和語言教育相關的維度;第二個是語用能力評估,比如說限定場景的選擇題,主要考察學生在某個環境下的語用能力;第三個是開放題型評估,如口語作文、話題復述等等,考察的是學生運用已經掌握的英語知識,完整表達意思的能力。

語言學習者重復犯錯怎么辦?

林遠東認為,人工智能在智能語音、口語評測的發展路徑分為三步,第一步是建立標準,第二步是個性診斷,第三步是反饋指導。他認為智能技術在教育領域要向前深入一個階段,作為技術人員來講,就要強迫自己深入到教育行業?!爱斈阋钊脒@個行業本身,你要去汲取這個行業里面的內容,這是很難的,更難的是放棄自己原來的立場,深入融合教育的知識和理論?!?/p>

馳聲從2007年開始專注語音評測技術,2008年推出了業內第一評估中文聲調、評價中文發音能力的SDK;2009年推出了業內第一個基于網頁的無插件英文發音評估SDK;2015年推出業界第一個支持微信語音的發音評估SDK等。

這背后是核心團隊對于痛點細致入微的拆分了解。林遠東曾調取了線上數據,下載了五百多條語音,自己一條一條去聽。他吃驚地發現:很多用戶發音的時候總是在重復犯錯,短時間內練同一個內容,第1次錯和第10次的錯誤是一樣的。馳聲語音評測實驗室也做了相關研究,通過調取大量的錄音數據發現,85%的語言學習者,總是在重復犯錯。

“這是對我很大的打擊。85%的人在浪費他們的時間,雖然他們在不斷地讀,但是仍不斷犯同樣的錯誤?!绷诌h東說,“雖然我們完成了自動評分,告訴他讀得不好,但只是重復犯錯,沒有什么意義?!?blockquote>

每一項技術的發展,都是發揮技術之所長,去對老師所不擅長的工作進行填補,而不是取代

馳聲提出了一條新的研發路徑——“評分-診斷-反饋指導”。目前市場上大多數語音評測公司都處在“建立標準”的階段,為一份口語作業打分或者評價優良中差。馳聲率先實現“個性診斷”,今年推出了新技術“診斷糾錯內核”。針對單詞發音評分,通過構建一個擴展網絡的形式,可以支持任意單詞的音素級插入、刪除和替換錯誤。以match這個單詞為例,如果[m?t?]讀成[m?t?],就會有相應的錯誤發音提示,以及正確的發音指導。直觀呈現學習者實際發音的音素序列并進行錯誤標注,意義就在于告訴學生:你錯了,錯在這里,怎么錯的。再結合最后一步“反饋指導”,用文字、圖片、視頻的方式告訴學生如何去提升,最終達到“拒絕重復犯錯”,快速提高語言學習效率的目的。

林遠東表示,2014年,馳聲語音平臺一天的錄音數據超過千萬,現在每天的錄音峰值達到大幾千萬的次數,目前用戶使用量還在持續猛增?!半m然使用量上升內心會感受到無比幸福,但也許有一天使用量開始回落的時候,你會感覺到另外一種幸福,那是行業的福分。當個性化診斷和反饋指導得到實踐,一個孩子不需要練習100次而在第10次就能得到提升,為什么還要讓他練習100次,消耗用戶時間、消耗計算機資源、消耗客戶金錢呢?”

AI+K12語言教育怎么玩?

目前,馳聲的語音技術授權業務,主要面向英語培訓機構、出版社、教育軟件、在線教育、教育硬件和考試服務機構等提供口語測評技術支持,服務的用戶遍及132個國家和地區。于是,馳聲語音評測實驗室提出了一個新課題——AI+K12語言教育,除了口語評測還能做什么?

馳聲一直在思考智能語音技術如何能更好地服務K12的教學場景,為此定義了三個場景:一、正式考試環境下根據人工定標數據的標準進行自動評分,馳聲提供了一個AMS,已經服務了多個地區的英語聽說考試;二、考輔分為備考和??嫉沫h境,馳聲提供CESE平臺,輔助校園聽說日常測評和階段性考試;三、在課外,馳聲也可以為學生自學提供一些口語的發音能力評估。

在遵循“評分-診斷-反饋指導”的技術創新路徑上,除了診斷糾錯內核,馳聲今年還發布了另一項創新技術——開放題型多維度評估。

據了解,開放題型多維度評估,該技術與近年來各省市在中高考中增加英語口語考試的機緣密不可分。作為中國真正有中高考英語聽說人機對話考試實施經驗的兩家語音廠商之一,馳聲與多省、市教育主管部門保持密切協作,共同推動語音測評技術在正式考試、考輔、教輔等各個教學階段的應用。

開放題型多維度評估結合了詞嵌入技術、句法解析、GOP算法等技術,可支持口語作文、看圖說話、翻譯題等開放題型,評分結果除總分以外,還加入了內容得分、發音得分、語法得分和流利度得分等四個維度。

經測試,開放題型多維度評估的評分性能遠遠高于以前的基于特征直接擬合總分的情況。該內核更出色的性能特點還在于:自適應評分標準,不同的地區對這四個維度有不同的側重點,馳聲可以根據定標數據學習到該地區在每個維度上的特征和權重,擬合出一個最為適合該地區的評分標準。

新技術還為后期打下了一個伏筆——未來,馳聲將在這四個維度上繼續往下做,對應著診斷和反饋,比如學習者的語法錯在什么位置,應該糾正成什么樣。

當被問到馳聲不斷推出新技術,是否會取代現有老師的功能,林遠東表示,其實每一項技術的發展,都是發揮技術之所長,去對老師所不擅長的工作進行填補,而不是取代。如今,教育行業正處于技術和教育融合的階段。這個階段里面,智能技術會使得教師角色得到重新定義。未來教師將被豐富為兩個角色,第一個是講課、專業的授課者;第二個是維持課堂秩序,與學生進行近距離的實時互動。教育者在教育過程中承擔更多的功能性,包括數據分析的能力,這也是未來教育行業的發展趨勢。

馳聲也公布了關于下一步的研發計劃,內容包括通用聲學模型升級、語音自動分類、虛擬教室和基于知識圖譜的自適應學習等。

猜你喜歡
遠東發音題型
I’m a Little Teapot
離散型隨機變量??碱}型及解法
遠東正大檢驗集團有限公司
巧妙構造函數 破解三類題型
2020遠東無損檢測新技術論壇順利召開
一次函數中的常見題型
隨機抽樣題型“曬一曬”
Playing with h
遠東戰役中的和平天使
Playing with /eI/
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合