?

阿里GPT測評:“AI 摩爾定律”時代真的來了?

2023-04-24 07:39張毅
電腦報 2023年15期
關鍵詞:天貓阿里作文

張毅

半導體領域的摩爾定律正在失效,AI世界的“摩爾定律”才剛開始。不久前,OpenAI CEO 、“ChatGPT之父”Sam Altman 發文指出,全球AI 運算量每隔18 個月就會提升一倍。從科技公司對GPT 你追我趕的態勢看,“AI 摩爾定律”,也許正在成為全球大模型競爭的節拍器。

繼OpenAI、微軟、谷歌之后,中國公司也正加速公布各自的大模型研發進展。上周,阿里云官宣其大模型“通義千問”啟動企業邀測,達摩院多年磨一劍的AI 研發工作初現真身?!峨娔X報》參與了“通義千問”的定向邀測,短短幾天內,感受到了中國大模型“以日為進”的成長速度。

阿里云大模型“通義千問”亮相

從OpenAI 的ChatGPT 到百度的文心一言,同AI 對話成功挑起人類的好奇心,而就在人們為“哪家AI 更聰明”爭論不休時,阿里云突然宣布“通義千問”開始企業邀測。

“通義千問,一個專門響應人類指令的大模型。我是效率助手,也是點子生成機,我服務于人類,致力于讓生活更美好?!薄@是“通義千問”官方主頁上對自己的介紹(如圖1),單從字面上理解,“通義千問”更像是一個問答平臺或對話工具,但登錄進入其交互界面后,“通義千問”對自己的“工作范疇”其實是有引導性解釋的。

在“通義千問”頁面最下方的“百寶袋”通道,展示了9 種應用,這些應用被分為3 類:效率類、生活類和娛樂類(如圖2)。

在娛樂類應用中,有“彩虹屁專家”“寫情書”“為你寫詩”3個功能,比如“彩虹屁專家”,當你想夸別人,卻不知道怎么夸的時候,就能讓通義千問幫吹一些彩虹屁。

顯然,從這9 種應用定位可以看出,“通義千問”并非單純用于對話娛樂,更有生產力工具屬性,而在我們輸入“通義千問自身定位是?”提問時,它是這么回答的(如圖3)。

以“日”為單位成長的AI

“最初第一批拿到測試資格時蠻興奮的,第一時間就嘗試同‘通義千問進行對話,但對話結果卻有些失望,除‘牛頭不對馬嘴外,更給出了不少錯誤答案??僧斘覀儙е那樵诘诙燧斎胪瑯訂栴}時,‘通義千問竟給出了近乎完美的正確答案,這種‘低開高走的測試真的很刺激,‘通義千問真是以肉眼可見的速度在成長!”

2023年4月8日,《電腦報》記者根據熱點新聞事件向“通義千問”提出“能否制作一段有關石墨烯的視頻腳本?”要求時,它寫出來的視頻腳本非常生澀,甚至像說明文多過視頻腳本(如圖4)。

然而,僅僅過了一天時間,當記者在4月9日向“通義千問”再次提出“能否制作一段有關石墨烯的視頻腳本?”時,“通義千問”非常準確地理解了記者需求,且創作出可行性較高的視頻腳本,從旁白對話到畫面設計,都給予了詳細的內容和建議(如圖5)。

每天都在變強的“通義千問”成功吊起我們好奇心,同當下主流免費的ChatGPT(GPT3.5)和文心一言相比,“通義千問”能力究竟如何呢?

一場“誰更聰明”的對局

2023年4月9日, 我們分別從邏輯思維及語言組織能力(教育心理分析)、語言文字創作能力(小學生作文)及非線性思維能力(數學組合題目)三個方面進行了橫向測試。當下各家AI 更新太快,本次結論僅做測試當日參考。

邏輯思維及語言組織能力:如何處理同叛逆期初中生的親子關系?

ChatGPT(GPT3.5) 在該測試場景下的表現堪稱完美,整體邏輯非常有條理,將同孩子關系的處理方式方法進行了羅列,具有較強的說服性(如圖6)。

文心一言回答顯然簡單了許多,這樣的回答想要說服一個叛逆期的初中生,顯然不太具有可執行性(如圖7)。

通義千問的邏輯性已經和ChatGPT 不相上下,其給出的解決辦法具有比較明顯的條理性(如圖8)。

點評:無論是ChatGPT 還是通義千問,都已具備初步邏輯思維能力,完全可以應對日常交互,并針對用戶需求給出符合邏輯的解決方案。

語言文字創作能力:幫我寫一篇贊美秋天的作文

天的作文在文字描述細節上,ChatGPT(GPT3.5)抓住了秋天的特點,但在文章結構和具體事物的表述上顯得有些僵硬,對于這樣一個相對簡單的入門級作文,ChatGPT(GPT3.5) 的表現讓人有些失望(如圖9)。

文心一言將果實作為贊美秋天的核心來展開,很好地領悟了中文作文“主次分明”的技巧。只是在對秋天整體的把控上稍欠火候(如圖10)。

通義千問的作文能力多少讓人有些驚喜,總分總的結構拿捏得十分到位,開篇明義的同時,通過樹木、樹葉、果園三個事物在秋天的表現,完成了秋天具象化描寫,很好地表達了對秋天景色的贊美和喜愛之情(如圖11)。

點評:從作品看,三款AI 在語言文字創作能力上均有不錯的表現,尤其是通義千問對作文的打造顯得非?!袄暇殹?, 稍加修改就能成為一篇傳閱的優秀范文,整體作文的邏輯性上穩壓ChatGPT 一籌!

非線性思維能力:老師打算將10張相同的積分卡分給甲、乙和菲菲,甲想得到至少 4張,菲菲想得到至少3張,乙則表示無所謂,給不給他都行,若老師打算滿足每個人的要求,共有多少種分法呢?

答案錯誤, 顯然,ChatGPT(GPT3.5)這一次在一本正經的胡說八道(如圖12)。

答案錯誤,雖然文心一言簡短的回答看上去挺有自信,可答案依舊錯了(如圖13)。

通義千問這一次很老實,開小差而沒有給出答案(如圖14)。

點評:相對于編程、雞兔同籠、流水行船、牛吃草等線性思維的數學學科題目,排列組合這類非線性思維模式題目能考驗AI 自主思考能力。顯然,從這道題目的測試情況看,三家AI 均敗下陣來,不過非線性學科問題本身就是AI 測試的難點,很期待未來AI 在該領域的表現。

阿里系應用全面接入通義千問

“所有軟件都值得接入大模型升級改造”,阿里云智能CTO周靖人在北京云峰會現場宣布:“我們將開放通義千問的能力,幫助每家企業打造自己的專屬大模型!”據電腦報記者在現場傳回的消息,阿里所有產品未來將接入通義千問進行全面改造,釘釘、天貓精靈率先接入測試,將在評估認證后正式發布新功能(如圖15)。

根據釘釘當天預告的Demo演示,接入通義千問之后的釘釘可實現近10項新AI 功能, 全面激發創意和辦公生產力。通過類似微軟Copilot“副駕駛”的設定,用戶可隨時隨地喚起AI,開啟全新工作方式。在釘釘文檔中,通義千問可以創作詩歌小說、撰寫郵件、生成營銷策劃方案等,全面輔助辦公。在釘釘會議中,通義千問可以隨時生成會議記錄并自動總結會議紀要、生成待辦事項。通義千問還可以幫助自動總結未讀群聊信息中的要點。最驚艷的是,釘釘展示了拍照生成小程序場景,上傳一張功能草圖,不用寫一行代碼,可立刻生成訂餐輕應用。

而接入通義千問后,新天貓精靈變得更擬人更聰明,知識、情感、個性、記憶能力大幅躍升。它支持自由對話,可以隨時打斷、切換話題,能根據用戶需求和場景隨時生成內容。比如,用戶可以在跑步時要求天貓精靈“合成1 小時歌單,50% 穿插搖滾風格的歌曲”,也可以和天貓精靈聊文化談人生。新天貓精靈不僅能回答小朋友的各種刁鉆問題,還可以一起創作“宇宙大爆炸”的新故事(如圖16)。

科技巨頭的大模型之戰

通義千問并非憑空出現,而是阿里厚積薄發的結果。

阿里達摩院深耕 NLP領域,在大模型技術路徑上具備多年前瞻技術積累,阿里達摩院于2019年啟動大模型研發,在超大模型、語言及多模態能力、低碳訓練、平臺化服務、落地應用等多個方面,為中文大模型的發展做出一系列探索工作(如圖17)。

動輒超千億參數的大模型研發,不是單一的算法問題,也不是簡單的堆算力的過程,這是包括了底層算力、網絡、存儲、數據清洗與治理、AI 框架、AI 算法、人類調優等多個方面的系統性工程問題。

目前頭部科技企業均采取“模型+工具平臺+ 生態”三層共建模式,有助于業務的良性循環,也更容易借助長期積累形成競爭壁壘,而國內大模型廠商主要為百度、阿里兩家。

根據周靖人介紹,未來每一個企業在阿里云上既可以調用通義千問的全部能力,也可以結合企業自己的行業知識和應用場景,訓練自己的企業大模型。比如,每個企業都可以有自己的智能客服、智能導購、智能語音助手、文案助手、AI設計師、自動駕駛模型等。

以統一底座為基礎,達摩院構建了層次化的模型體系,其中,通用模型層覆蓋自然語言處理、多模態、計算機視覺,專業模型層深入電商、醫療、法律、金融、娛樂等行業(如圖18)。

而如此龐大的構想底氣源自阿里系龐大的算力。根據行業權威研究機構Gartner2021年全球云計算IaaS市場份額數據顯示,阿里云排名全球第三,市場份額為9.55%,連續六年實現份額增長;同時,阿里云排名亞太市場第一,市場份額為25.53%。

在AI算力方面,2022年阿里云宣布正式推出全棧智能計算解決方案“飛天智算平臺”,為科研、公共服務和企業機構提供強大的智能計算服務,通過先進的技術架構,飛天智算平臺實現了90% 的千卡并行計算效率,可將算力資源利用率提高3 倍以上,AI訓練效率提升11倍,推理效率提升6 倍。

阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇表示,讓計算成為公共服務是阿里云始終不變的追求,未來核心要做好兩件事情:第一,讓算力更普惠,推動自研技術和規?;洜I的正循環,持續釋放技術紅利;第二,讓AI 更普及,讓每家企業的產品都能接入大模型升級改造,并有能力打造自己的專屬大模型(如圖19)。

而除了開放自研的通義千問大模型外,阿里云也在積極建設開源的AI 社區生態。去年11 月,阿里云正式提出“Model as aService”理念,并推出國內首個AI 模型社區“魔搭”,開發者可以在“魔搭”上下載各類開源AI 模型,并直接調用阿里云的算力和一站式的AI 大模型訓練及推理平臺。發布不到半年,“魔搭”社區總用戶量已超100萬,模型總下載量超1600萬次,成為國內規模最大的AI模型社區。

依托于堅實的云計算底座,AI正像水一樣浸潤到千行百業,幫助更多企業從數字化走向智能化,更多應用涌現出更智能的新功能和新體驗。

對于這樣的變革, 你期待嗎?

通義千問將全面接入阿里系應用

通義千問接入天貓精靈

猜你喜歡
天貓阿里作文
云上阿里
辰辰帶你游阿里
從天貓的“新零售”變革中看商業的“新四化”
雀氏聯姻天貓母嬰共贏奧斯卡
天貓“北伐”
阿里戰略
阿里是個好榜樣
神威大藥房天貓旗艦店正式上線
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合