?

阿里GPT測評：“AI 摩爾定律”時代真的來了？

2023-04-24 07:39張毅

電腦報 2023年15期

關鍵詞：天貓阿里作文

張毅

半導體領域的摩爾定律正在失效，AI世界的“摩爾定律”才剛開始。不久前，OpenAI CEO 、“ChatGPT之父”Sam Altman 發文指出，全球AI 運算量每隔18 個月就會提升一倍。從科技公司對GPT 你追我趕的態勢看，“AI 摩爾定律”，也許正在成為全球大模型競爭的節拍器。

繼OpenAI、微軟、谷歌之后，中國公司也正加速公布各自的大模型研發進展。上周，阿里云官宣其大模型“通義千問”啟動企業邀測，達摩院多年磨一劍的AI 研發工作初現真身?！峨娔X報》參與了“通義千問”的定向邀測，短短幾天內，感受到了中國大模型“以日為進”的成長速度。

阿里云大模型“通義千問”亮相

從OpenAI 的ChatGPT 到百度的文心一言，同AI 對話成功挑起人類的好奇心，而就在人們為“哪家AI 更聰明”爭論不休時，阿里云突然宣布“通義千問”開始企業邀測。

“通義千問，一個專門響應人類指令的大模型。我是效率助手，也是點子生成機，我服務于人類，致力于讓生活更美好?！薄@是“通義千問”官方主頁上對自己的介紹（如圖1），單從字面上理解，“通義千問”更像是一個問答平臺或對話工具，但登錄進入其交互界面后，“通義千問”對自己的“工作范疇”其實是有引導性解釋的。

在“通義千問”頁面最下方的“百寶袋”通道，展示了9 種應用，這些應用被分為3 類：效率類、生活類和娛樂類（如圖2）。

在娛樂類應用中，有“彩虹屁專家”“寫情書”“為你寫詩”3個功能，比如“彩虹屁專家”，當你想夸別人，卻不知道怎么夸的時候，就能讓通義千問幫吹一些彩虹屁。

顯然，從這9 種應用定位可以看出，“通義千問”并非單純用于對話娛樂，更有生產力工具屬性，而在我們輸入“通義千問自身定位是？”提問時，它是這么回答的（如圖3）。

以“日”為單位成長的AI

“最初第一批拿到測試資格時蠻興奮的，第一時間就嘗試同‘通義千問進行對話，但對話結果卻有些失望，除‘牛頭不對馬嘴外，更給出了不少錯誤答案?？僧斘覀儙е那樵诘诙燧斎胪瑯訂栴}時，‘通義千問竟給出了近乎完美的正確答案，這種‘低開高走的測試真的很刺激，‘通義千問真是以肉眼可見的速度在成長！”

2023年4月8日，《電腦報》記者根據熱點新聞事件向“通義千問”提出“能否制作一段有關石墨烯的視頻腳本？”要求時，它寫出來的視頻腳本非常生澀，甚至像說明文多過視頻腳本（如圖4）。

然而，僅僅過了一天時間，當記者在4月9日向“通義千問”再次提出“能否制作一段有關石墨烯的視頻腳本？”時，“通義千問”非常準確地理解了記者需求，且創作出可行性較高的視頻腳本，從旁白對話到畫面設計，都給予了詳細的內容和建議（如圖5）。

每天都在變強的“通義千問”成功吊起我們好奇心，同當下主流免費的ChatGPT（GPT3.5）和文心一言相比，“通義千問”能力究竟如何呢？

一場“誰更聰明”的對局

2023年4月9日，我們分別從邏輯思維及語言組織能力（教育心理分析）、語言文字創作能力（小學生作文）及非線性思維能力（數學組合題目）三個方面進行了橫向測試。當下各家AI 更新太快，本次結論僅做測試當日參考。

邏輯思維及語言組織能力：如何處理同叛逆期初中生的親子關系？

ChatGPT（GPT3.5）在該測試場景下的表現堪稱完美，整體邏輯非常有條理，將同孩子關系的處理方式方法進行了羅列，具有較強的說服性（如圖6）。

文心一言回答顯然簡單了許多，這樣的回答想要說服一個叛逆期的初中生，顯然不太具有可執行性（如圖7）。

通義千問的邏輯性已經和ChatGPT 不相上下，其給出的解決辦法具有比較明顯的條理性（如圖8）。

點評：無論是ChatGPT 還是通義千問，都已具備初步邏輯思維能力，完全可以應對日常交互，并針對用戶需求給出符合邏輯的解決方案。

語言文字創作能力：幫我寫一篇贊美秋天的作文

天的作文在文字描述細節上，ChatGPT（GPT3.5）抓住了秋天的特點，但在文章結構和具體事物的表述上顯得有些僵硬，對于這樣一個相對簡單的入門級作文，ChatGPT（GPT3.5）的表現讓人有些失望（如圖9）。

文心一言將果實作為贊美秋天的核心來展開，很好地領悟了中文作文“主次分明”的技巧。只是在對秋天整體的把控上稍欠火候（如圖10）。

通義千問的作文能力多少讓人有些驚喜，總分總的結構拿捏得十分到位，開篇明義的同時，通過樹木、樹葉、果園三個事物在秋天的表現，完成了秋天具象化描寫，很好地表達了對秋天景色的贊美和喜愛之情（如圖11）。

點評：從作品看，三款AI 在語言文字創作能力上均有不錯的表現，尤其是通義千問對作文的打造顯得非?！袄暇殹?，稍加修改就能成為一篇傳閱的優秀范文，整體作文的邏輯性上穩壓ChatGPT 一籌！

非線性思維能力：老師打算將10張相同的積分卡分給甲、乙和菲菲，甲想得到至少 4張，菲菲想得到至少3張，乙則表示無所謂，給不給他都行，若老師打算滿足每個人的要求，共有多少種分法呢？

答案錯誤，顯然，ChatGPT（GPT3.5）這一次在一本正經的胡說八道（如圖12）。

答案錯誤，雖然文心一言簡短的回答看上去挺有自信，可答案依舊錯了（如圖13）。

通義千問這一次很老實，開小差而沒有給出答案（如圖14）。

點評：相對于編程、雞兔同籠、流水行船、牛吃草等線性思維的數學學科題目，排列組合這類非線性思維模式題目能考驗AI 自主思考能力。顯然，從這道題目的測試情況看，三家AI 均敗下陣來，不過非線性學科問題本身就是AI 測試的難點，很期待未來AI 在該領域的表現。

阿里系應用全面接入通義千問

“所有軟件都值得接入大模型升級改造”，阿里云智能CTO周靖人在北京云峰會現場宣布：“我們將開放通義千問的能力，幫助每家企業打造自己的專屬大模型！”據電腦報記者在現場傳回的消息，阿里所有產品未來將接入通義千問進行全面改造，釘釘、天貓精靈率先接入測試，將在評估認證后正式發布新功能（如圖15）。

根據釘釘當天預告的Demo演示，接入通義千問之后的釘釘可實現近10項新AI 功能，全面激發創意和辦公生產力。通過類似微軟Copilot“副駕駛”的設定，用戶可隨時隨地喚起AI，開啟全新工作方式。在釘釘文檔中，通義千問可以創作詩歌小說、撰寫郵件、生成營銷策劃方案等，全面輔助辦公。在釘釘會議中，通義千問可以隨時生成會議記錄并自動總結會議紀要、生成待辦事項。通義千問還可以幫助自動總結未讀群聊信息中的要點。最驚艷的是，釘釘展示了拍照生成小程序場景，上傳一張功能草圖，不用寫一行代碼，可立刻生成訂餐輕應用。

而接入通義千問后，新天貓精靈變得更擬人更聰明，知識、情感、個性、記憶能力大幅躍升。它支持自由對話，可以隨時打斷、切換話題，能根據用戶需求和場景隨時生成內容。比如，用戶可以在跑步時要求天貓精靈“合成1 小時歌單，50% 穿插搖滾風格的歌曲”，也可以和天貓精靈聊文化談人生。新天貓精靈不僅能回答小朋友的各種刁鉆問題，還可以一起創作“宇宙大爆炸”的新故事（如圖16）。

科技巨頭的大模型之戰

通義千問并非憑空出現，而是阿里厚積薄發的結果。

阿里達摩院深耕 NLP領域，在大模型技術路徑上具備多年前瞻技術積累，阿里達摩院于2019年啟動大模型研發，在超大模型、語言及多模態能力、低碳訓練、平臺化服務、落地應用等多個方面，為中文大模型的發展做出一系列探索工作（如圖17）。

動輒超千億參數的大模型研發，不是單一的算法問題，也不是簡單的堆算力的過程，這是包括了底層算力、網絡、存儲、數據清洗與治理、AI 框架、AI 算法、人類調優等多個方面的系統性工程問題。

目前頭部科技企業均采取“模型+工具平臺+ 生態”三層共建模式，有助于業務的良性循環，也更容易借助長期積累形成競爭壁壘，而國內大模型廠商主要為百度、阿里兩家。

根據周靖人介紹，未來每一個企業在阿里云上既可以調用通義千問的全部能力，也可以結合企業自己的行業知識和應用場景，訓練自己的企業大模型。比如，每個企業都可以有自己的智能客服、智能導購、智能語音助手、文案助手、AI設計師、自動駕駛模型等。

以統一底座為基礎，達摩院構建了層次化的模型體系，其中，通用模型層覆蓋自然語言處理、多模態、計算機視覺，專業模型層深入電商、醫療、法律、金融、娛樂等行業（如圖18）。

而如此龐大的構想底氣源自阿里系龐大的算力。根據行業權威研究機構Gartner2021年全球云計算IaaS市場份額數據顯示，阿里云排名全球第三，市場份額為9.55%，連續六年實現份額增長；同時，阿里云排名亞太市場第一，市場份額為25.53%。

在AI算力方面，2022年阿里云宣布正式推出全棧智能計算解決方案“飛天智算平臺”，為科研、公共服務和企業機構提供強大的智能計算服務，通過先進的技術架構，飛天智算平臺實現了90% 的千卡并行計算效率，可將算力資源利用率提高3 倍以上，AI訓練效率提升11倍，推理效率提升6 倍。

阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇表示，讓計算成為公共服務是阿里云始終不變的追求，未來核心要做好兩件事情：第一，讓算力更普惠，推動自研技術和規?；洜I的正循環，持續釋放技術紅利；第二，讓AI 更普及，讓每家企業的產品都能接入大模型升級改造，并有能力打造自己的專屬大模型（如圖19）。

而除了開放自研的通義千問大模型外，阿里云也在積極建設開源的AI 社區生態。去年11 月，阿里云正式提出“Model as aService”理念，并推出國內首個AI 模型社區“魔搭”，開發者可以在“魔搭”上下載各類開源AI 模型，并直接調用阿里云的算力和一站式的AI 大模型訓練及推理平臺。發布不到半年，“魔搭”社區總用戶量已超100萬，模型總下載量超1600萬次，成為國內規模最大的AI模型社區。

依托于堅實的云計算底座，AI正像水一樣浸潤到千行百業，幫助更多企業從數字化走向智能化，更多應用涌現出更智能的新功能和新體驗。

對于這樣的變革，你期待嗎？

通義千問將全面接入阿里系應用

通義千問接入天貓精靈

猜你喜歡

天貓阿里作文

炎黃地理(2021年1期)2021-06-08

辰辰帶你游阿里

小學生學習指導(低年級)(2019年11期)2019-11-25

從天貓的“新零售”變革中看商業的“新四化”

中國眼鏡科技雜志(2017年13期)2017-08-16

雀氏聯姻天貓母嬰共贏奧斯卡

生活用紙(2016年6期)2017-01-19

天貓“北伐”

中國品牌(2015年11期)2015-12-01

中國科技信息(2015年21期)2015-11-07

阿里是個好榜樣

創業家(2015年4期)2015-02-27

神威大藥房天貓旗艦店正式上線

中國衛生(2014年2期)2014-11-12

電腦報2023年15期

電腦報的其它文章: 游中學，學中思; 大廠交期超50周，IGBT國產迎來換擋加速; 漫畫專欄; 2.8K 120Hz好屏高能輕薄本; 2K/100幀暢玩高畫質光追大作; 2K高幀游戲甜品+AI生產利器

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合