?

手寫識別專利技術綜述

2018-10-25 01:21王佩文
現代計算機 2018年27期
關鍵詞:申請量手寫本發明

王佩文

(國家知識產權局專利局專利審查協作四川中心,成都 610213)

0 引言

計算機領域的手寫識別技術,最早源于上個世紀的中期。隨著計算機技術的發展,手寫識別技術也隨著手寫板硬件技術的不斷革新、計算機技術的不斷自動化、智能化發展以及計算機的識別模式、識別領域理論和方法的不斷深入和完善,這項技術也出現了飛躍。本文選擇手寫識別技術作為主要研究內容,結合手寫識別技術的演進路線與專利申請情況,對手寫識別技術的重點技術分支、重要專利申請人以及重要技術方案進行分析,并結合專利審查實踐探討針對具體專利審查工作的思路與方法。

1 手寫識別技術概覽

手寫識別,簡單地說就是用計算機對符號進行自動識別,將其對應成字母、數字、漢字或其他語言中字符的過程。

根據識別對象不同,手寫識別可以分為英文識別、漢字識別和數字識別等。根據采用的輸入設備不同,手寫識別還可以分為在線識別和離線識別。另外,根據對手寫輸入者的要求來分,手寫識別又可分為限制性和非限制性(自由手寫體)的手寫體文字識別。

本文主要研究按照識別對象劃分的技術分支,如圖1所示。

圖1 手寫識別技術分支

(1)漢字識別:漢字識別的方法基本上分為統計識別[1]、結構識別[2]以及神經網絡識別方法等幾大類。大量的聯機手寫識別系統采用的都是結構識別方法。

漢字識別的典型結構框圖如圖2所示。

圖2 漢字手寫識別的典型結構框圖

(2)英文識別:如果從識別的內容來看,手寫識別技術可以分為兩種類型:單字識別與字符串識別[3]。在英文手寫識別當中,單字指的就是一個獨立的字母,而字符串指是一個單詞甚至是一整句話。

(3)數字識別:手寫數字識別是光學字符識別技術的一個分支,它研究的對象是:如何利用電子計算機自動辨認人手寫在紙上的阿拉伯數字。

2 手寫識別技術發展分析

2.1 專利技術發展演進

手寫識別,作為計算機模擬人類智能的一種形式,其發展歷史可以分為五個階段:

(1)早期發展從上世紀50年代至1980年;

(2)發展中期從1980年至1992年;

(3)高速發展階段始于1992年;

(4)平穩發展階段始于1998年,從這時開始,手寫識別進入了逐漸成熟并廣泛應用的階段,有很多完善性的創新,也有某些重大突破,例如多點觸控技術的出現;

(5)第二次高速發展階段始于2010年,隨著觸控技術的高速發展以及中國對漢字識別的大力研究,手寫識別進入了第二次高速發展期,這一階段對漢字識別有很多創新性研究,例如多字符連續輸入以及非完整性識別技術等。

多年來,手寫識別技術經過不斷的發展,各技術分支都有了長足的發展和進步。通過對各技術分支下的專利文獻進行統計、分析及梳理,可以得到如下圖3所示的技術發展演進路線圖。

圖3 手寫識別技術演進路線

2.2 手寫識別技術功效分析

手寫識別技術各功效的專利申請量如圖4所示。

圖4 手寫識別技術各功效的專利申請量

3 手寫識別技術專利分析

3.1 全球專利申請趨勢分析

圖5是手寫識別技術全球專利申請量隨年份變化的趨勢圖,從圖中可以看出,手寫識別技術的專利申請量,在1992年之前較少,處于起步階段;在1992年開始進入了高速發展期,一直持續到1997年,這主要是因為在此期間,日本在手寫識別方面取得了突破性進展,美國也產生了很多核心專利;之后專利申請量有所下降,但繼續保持了平穩發展;而2010年之后,手寫識別技術迎來了第二次高速發展期,這其中有觸摸技術高速發展的原因,更重要的是中國在漢字識別方面所取得的進展。

圖5手寫識別技術全球專利申請量隨年份變化趨勢

3.2 技術原創國分析

圖6 是手寫識別技術原創國申請量對比,從圖中可以看出主要的技術原創國依次為日本、中國、美國、韓國、臺灣、歐洲等,其中日本、中國、美國是申請量最大的幾個國家,分別超過了900件、700件、500件。

圖6手寫識別技術原創國申請量對比

3.3 主要技術原創國專利申請趨勢分析

圖7 是手寫識別主要技術原創國申請趨勢圖,從圖中可以看出從1992-1997年,日本在手寫識別技術領域有著飛速發展,而從1992年開始,美國在手寫識別技術領域也進入了穩步發展期。相比之下,我國手寫識別技術發展較晚,主要從2010年開始進入了高速發展期。

圖7手寫識別主要技術原創國申請趨勢

3.4 技術目標國分析

圖8 是手寫識別技術目標國申請量對比,從圖中可以看出手寫識別技術主要布局在日本、中國、美國、歐洲、韓國、德國、臺灣等國家和地區,這也與這些國家的經濟發展狀況以及科研能力相符,其中日本、中國、美國是作為目標國申請量最大的幾個國家,分別達到了 1000、900、800 件。

圖8手寫識別技術目標國申請量對比

3.5 全球重要申請人分布

圖9 展示了手寫識別技術全球重要申請人及申請量,從圖中可以看出,日本的多家大型企業占據了大量的申請份額,這于日本在手寫識別技術領域處于世界一流水平相符。同時,美國的微軟公司和IBM公司申請量均居全球前三,這也與其在業界的龍頭地位相符合。此外,手寫識別技術領域的重要申請人均為大型企業,這體現了這些企業雄厚的研發實力。而在全球前十的申請人中并未出現中國的企業,這也與中國在手寫識別技術領域起步相對較晚、缺乏龍頭企業、技術分布較為松散不夠集中有關。

圖9手寫識別技術全球重要申請人及申請量

3.6 國內重要申請人分布

圖10 展示了手寫識別技術國內重要申請人及申請量,從圖中可以看出,上海華精、宇龍科技、漢王科技是國內手寫識別技術領域的領軍企業,并且與全球主要申請人的差距在逐步縮小,這與近幾年來我國在漢字手寫識別方面高速發展相符。排在之后的還有華南理工大學、蘇州大學,并且申請量也較為可觀,這說明了我國的手寫識別技術在產學研并重發展路線的指導下,已經逐步走出了實驗室研究階段,開始進入產業鏈下游的企業研發階段,為本領域下一步的技術成果轉化打下了堅實的基礎。

圖10 手寫識別技術國內重要申請人及申請量

4 典型技術方案分析

4.1 漢字手寫識別典型技術方案

CN102314616是國內重要申請人漢王科技股份有限公司的一篇專利申請,公開于2012年1月11日。目前的手寫識別方法按照先對字符進行過切分,然后根據幾何、識別和語義的信息進行合并,查找最優的合并路徑進行識別,這樣用于分析判斷的幾何模型相對固化,體現不出用戶的書寫習慣,降低了識別效果。

本發明是為了解決這一問題所提出的。技術方案提供了一種自適應脫機手寫識別方法,包括如下步驟:

步驟1:識別并過切分文本中的樣本文字,得到過切分塊,計算過切分塊中的最優合并路徑,并得到各文本行中最優合并路徑上字塊的字塊評價。字塊評價包括:字塊對應的幾何評價、語義評價和識別評價。從整篇文檔中選取一行或者多行文字作為樣本文字進行識別,對樣本文字進行過切分,對得到的過切分塊中前k條最優合并路徑,并且記錄各路徑上每個字塊對應的幾何評價、語義評價和識別評價。字塊的幾何評價表示某個字塊符合幾何模型的程度,通過對字塊的各種幾何特征加權得到。幾何模型表示將字塊判斷為字符在幾何上應該具備的特點,由一組脫機手寫文字的幾何特征組成,通常包括過切分塊中字塊的寬、字塊的寬高比、字塊的內間距、字塊的外間距,等等,每組幾何特征包含一個閾值Thr和幾何特征對應的權重W。

步驟2:根據樣本文字中各文本行中字塊的字塊評價分別評估文本行對應的幾何-識別語義背離度和幾何模型的離散程度,進而對文本行對應的幾何模型進行調整,根據調整后的幾何模型對步驟1識別出的字符進行調整。

本發明自適應脫機手寫識別方法和裝置的優點在于:根據樣本文字的字塊評價,逐步調整文字對應幾何模型,使對應的幾何特征得到不斷地改善,達到充分表達書寫人的書寫習慣,經過調整后的幾何模型降低了幾何特征的影響,保證了幾何模型能夠實時的調整,符合圖像中字符的書寫特點,從而達到提高識別效果的目的。

4.2 英文手寫識別典型技術方案

US005600735是摩托羅拉公司的專利申請,公開于1997年2月4日,是一篇核心專利。

技術方案提供了一種識別手寫輸入的方法,圖11是本發明的優選實施例的顯示器的示例圖,圖12是本發明的優選實施例的操作流程圖。

圖11 本發明的優選實施例的顯示器的示例圖

4.3 數字識別典型技術方案

CN106502390是國內重要申請人華南理工大學的一篇專利申請,公開于2017年3月15日。隨著社會的不斷發展和電子設備的不斷普及,人機之間的交互變得越來越頻繁。人們也一直在不斷努力創造一種更加自然、人性化的交互系統。在對機器的輸入方面,傳統的交互設備如:鼠標、鍵盤、手柄等,又或者是比較新型的交互設備如:數據手套、全身運動捕捉系統等穿戴設備,都會給人的行為附加上一些物理條件的限制,一定程度上束縛了人的自由,增加人的負擔,而且這些交互方式均不是人們日?;顒又幸哉Z言、動作為主的交互方式。在機器對人的反饋方面,比較傳統的方式如:在軟件交互界面彈出一些圖片、對話框,播放一段音樂或人聲,也就僅能通過視覺、聽覺與人進行交互,類人型機器人和智能語音助理,它們與人的交互也只是通過識別一些比較僵硬的靜態肢體動作或簡單的語言來進行,由此可見,目前智能體的外形及交互方式比較呆板單一,還沒有達到能像人與人交互同時具有動作和語音的程度。

圖12 本發明的優選實施例的操作流程圖

本發明的目的是針對上述現有技術的不足,提供了一種基于動態3D手寫數字識別的虛擬人交互系統,包括手勢與數字識別模塊、中央服務器模塊與虛擬人控制模塊,所述手勢與數字識別模塊用于提取手部區間,識別手勢及手寫軌跡;所述中央服務器模塊用于連接手勢與數字識別模塊和虛擬人控制模塊,實現數據的采集,傳輸和命令發送;所述虛擬人控制模塊為在實際中與人進行互動的載體,展示出虛擬人,根據從中央服務器模塊接受來的命令,對虛擬人進行動作、語言、表情等操控,實現與人的交互。

圖13為本發明的整體系統框圖,圖14為本發明的交互示意圖,本發明與現有技術相比,具有如下優點和有益效果:

(1)現有技術大多數只將Kinect運用于人體靜態單一姿勢和動作的捕捉與識別中,本發明運用Kinect捕捉人體手部連續的手寫動作,可識別動態3D手寫的數字及手勢,達到生動靈活有趣的人機交互效果;

(2)本發明提取手部區域圖像,采用的是人在空中書寫時手為身體與Kinect距離值最小部分的原理,相比于普遍的基于簡單膚色及分辨輪廓大小的提取方法,精度更高,魯棒性更好;

(3)本發明采用手部外輪廓線距離手心峰值點數目原理,可實現實時的手部手勢檢測,達到迅速開始及結束手寫的效果;

(4)本發明對手寫軌跡的處理,采用基于軌跡點集區域面積調整筆畫粗細的方法,實現手寫軌跡大小歸一化,提高手寫軌跡的識別率;

(5)本發明采用DWKNN算法進行手寫軌跡的識別,相比傳統的KNN,識別準確率有所提高;

(6)本發明基于RPC-Thrift架構,搭建了中央服務器模塊,實現了不同程序模塊間的通信;

(7)本發明以虛擬人智能體作為與人的交互媒介,通過對虛擬人的動作、語言、表情等操控,實現堪比人與人交互的人機交互過程。

圖13 本發明的整體系統框圖

圖14 本發明的交互示意圖

5 結語

本文通過對手寫識別領域的技術原理、技術演進、專利申請情況以及典型技術方案進行了介紹及分析,經過幾十年的發展,手寫識別的技術已經日趨成熟,日本、美國作為本領域起步較早的專利大國,擁有著大量關鍵的專利技術,并已成功進行商用,而在經濟飛速發展的背景下,我國在手寫識別領域也逐漸開始加大技術研發及專利布局技術,從數量上看,我國在手寫識別領域的專利保有量已躍居世界第二,也產生了一定的經濟效益,但距離手寫識別的技術強國還有一段路要走。

猜你喜歡
申請量手寫本發明
一種自動化皮革繃板裝置
我國農業植物新品種權申請量超5萬年
我手寫我心
一種超高強鋁鋰合金及其制備方法
專利名稱:一種銅或銅合金材料的制備方法及精煉用精煉劑
專利名稱:一種高強度的有色金屬復合材料
我手寫我意
138.2萬件,發明專利量質齊升企業占大頭
2016年英國外觀設計申請量增加55%
6萬字的情書
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合