?

智能音箱的風口幻覺

2017-09-18 06:07葛甲
商界評論 2017年9期
關鍵詞:圖像識別音箱風口

葛甲

誰都沒想到,智能音箱會在今年成為熱點。

在2014年11月,亞馬遜就低調發布智能音箱 Echo。當時它給整個業界帶來的印象,只是一款創新的硬件產品,可通過語音交互播放音樂,播報天氣,鬧鐘提醒等,做一些簡單的服務輸出。在一向緊盯美國科技界創新發展的中國,鮮有追隨者。但到了2016年11月,Echo在美國的銷量已經達到了3 510萬臺。

到2016年,根據市場調研機構Strategy Analytics 的數據,2016年智能音箱全球出貨量為590萬臺,并將在2022年增長10倍,市場規模將達到55億美元。

風口似乎出現了。

2017年,微軟的Invoke和蘋果的Home pod發布之后,數得上的巨頭已悉數入局,這在中國引發了一場跟風潮。天貓、聯想、喜馬拉雅等公司分別發布了自己的智能音箱產品,更多的智能音箱還在路上。這時距離亞馬遜Echo的發布,已經過去差不多3年時間。

各大公司紛紛入手智能音箱的背后,實則反映出產業界對人工智能時代的焦慮。

智能音箱非音箱

時下所流行的智能音箱,實則與音響沒太大關系,多為語音交互設備,而語音交互則被普遍認為是未來人工智能時代的主要交互方式。于是,一大批被冠以智能音箱名號的語音交互硬件出現了,其目的是搶占未來的語音交互入口,并不是要做什么音箱?;ヂ摼W廠商的邏輯是,目前的智能音箱能控制音樂播放,天氣播報,未來就能控制冰箱和洗衣機的運行,進而控制物聯網的一切。

與實現這一控制需要大投入的后臺算法和自動化技術研發相比,目前業已成熟的語音交互,實則是加入到人工智能大潮中一條低成本的捷徑了。

“不想被技術熱潮甩下”“見到風口都想參與一下”“在不進行高成本投入的情況下也成為人工智能產業的一員”“吃不上肉至少喝口湯,反正不管自己出力多少,也不想這桌酒席上沒有自己”……這些想法成為近期發布智能音箱企業的普遍心態。真正在人工智能領域進行持續投入的大公司如百度,或者在語音交互方面擁有極強技術實力的企業如三星,反倒對智能音箱這個風口沒表現出那么熱衷。這些企業的態度,映射出了該領域的意見分歧。

入口和內核的博弈

業界認為,智能音箱有可能會是未來物聯網和智能家居的入口,因為似乎沒有比自然語音更好的人機交互方式了。雖然肯加入進來的智能家居廠商很罕見,但智能音箱只要不斷迭代產品,將其語音交互功能不斷升級換代至消費者可自如使用的地步,智能家居廠商的加入,只是早晚的問題。屆時,目前這批智能音箱廠商就會與之分享利益,并通過拔高自身語音交互入口價值而獲得更多利益,成為出力最少但獲收益最多的所謂入口把控者。這是一種傳統互聯網的固有商業邏輯,但在未來能否奏效還真不好說。

一套用人工智能控制的家居產品,技術難度主要在自動化控制上面,機器在接收并理解了語音指令之后,還需要對這些指令加以執行,如開機、關機、升溫、降溫、大火煮、小火煮、燜煮等。傳統按鍵控制的情況下,這類動作的執行是很簡單的,但在語音控制的狀態下,其實現難度就要大得多了,這是互聯網企業做不了的事情。百度這樣的人工智能巨頭,也只能是在算法方面不斷突破,但涉及到具體的自動化控制時,還是具體的生產制造企業更為擅長。

鍵盤與主機之爭

智能音箱與物聯網和智能家居之間,存在這一種類似于電腦與鍵盤的關系,沒有鍵盤當然是無法輸入文字,但沒有電腦的話,鍵盤會更加處于無用之地。

首先,家電業是否心甘情愿地只去生產電腦,把鍵盤的事情交給別人去做?智能家居企業為了能夠不受制于人,始終不肯開放接口,雖然成立過一些開放標準平臺,最后都無果而終。因此,如今不管是Echo也好,Rokid也好,都不具備對智能家居的控制功能。在消費端,用一個終端對所有電器進行控制當然是最好的體驗,但實際上做不到,由于各個企業之間紛繁復雜的利益關系存在,沒有誰能在這方面一統天下。另一方面,各企業在標準協議方面不能達成一致的情況下,又不能讓消費者家里只用長虹,或者只用海爾。物聯網的最大組成部分是智能家居,但家電企業對自身利益的保護,是超越外界想象的。能自己做的都會自己做,更別提放棄鍵盤只做主機了。

其次,物聯網能不能繞開智能音箱,用別的方式實現語音交互?肯定有。

百度發布的DuerOs就是這樣一套系統,可以讓企業通過SDK嵌入的方式,將語音交互甚至圖像識別集成到智能家電中去。當然,這是進入智能家電的另一個入口,也走不出被第三方控制的怪圈。但這種生態輸出能力的方式平滑更容易讓企業接受。三星目前正在著力發展軟件形式的Bixby語音助手,這種搭載在三星智能手機和其他硬件上的軟件語音助手,未來很可能也會走DuerOs這種生態型路子,順滑過渡到智能電器上去。如果這兩大勢力中任何一個能成,智能音箱也就沒有任何意義了。

再次,人機交互有沒有語音之外的其他方式?只能說一切皆有可能。人工智能的兩大入口分別是語音和圖像識別,目前前者的技術比后者成熟,圖像識別還存在著較大的技術難關有待突破。如果圖像識別能夠對人體細微的動作進行精確理解,其實手勢交互或許會是比語音更好的交互方式。設想一下,用戶坐在沙發上手指向上一劃,空調升溫,向下一劃,空調降溫,這也是很不錯的體驗。語音交互的最大障礙是口音和語音環境,而機器對手勢和身體語言的識別,則不受這些條件影響。

風口難蹭

近期智能音箱的密集出現,是風口論的又一次集中體現。企業把智能音箱的價格定得很低,試圖用補貼硬件的方式搶占市場,但其實這一目的很難實現。未來的人工智能產業中,或許根本沒有蹭風口勢力的些微容身之地,可以肯定的是絕大多數智能音箱將從市場上消失。當前智能音箱的繁榮和風口,只不過映射出互聯網企業對人工智能時代的焦慮而已,它們給市場提供的,只不過是同質化的產品和服務,從長遠來看根本不是個可以持續做下去的事情。

事實上,即便語音交互是未來較為強力的人工智能入口,也很有可能不會是智能音箱這種形式,語音交互的泛終端化或無終端化才是方向,即聲音傳感器無處不在,根本不需要一個有形終端擺在那里起作用。不過,一些市場份額較高的音響,如Echo們,或許并不會在這個項目上一敗涂地,Echo至少還能控制一些無形的互聯網服務,甚至對某些家用照明裝置進行控制。

至于那些從現在起才開始跟風的企業,前景實難描述。只能說,前景有天花板,而慘烈不設底線。endprint

猜你喜歡
圖像識別音箱風口
“地產+露營”新“風口”來臨?
KEF推出新一代LS50 Wireless Ⅱ音箱
Polk(普樂之聲)推出高端Reserve系列音箱
基于Resnet-50的貓狗圖像識別
小音箱,大精彩 B&W 805 D3尊貴版書架音箱
高速公路圖像識別技術應用探討
多一對音箱,多一份驚喜Marantz AV8805
圖像識別在物聯網上的應用
圖像識別在水質檢測中的應用
活力美妝可能是下一個風口
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合