?

Sora問世,一石激起千層浪

2024-04-16 05:52楊易臻張宣蔡姝雯
風流一代·經典文摘 2024年4期
關鍵詞:人工智能模型

楊易臻 張宣 蔡姝雯

穿著時尚的女性漫步在霓虹燈閃爍的東京街頭”“兩艘海盜船在一杯咖啡內作戰”……春節假期,這幾段畫面精美的視頻在朋友圈“霸屏”,這些視頻是美國人工智能團隊OpenAI新發布的視頻大模型Sora創作的。

Sora,這個詞來源于日語中的“天空”,意指無限的創造潛力。2022年底因發布ChatGPT一炮走紅的OpenAI,又因Sora在全球內容創作領域掀起新的風暴。

博采眾長,

Sora“一騎絕塵”

只需要一段20至30個詞匯的文本指令或一張靜態圖像,就可以生成一段視頻,不論是寫實還是動畫風格、寬屏還是豎屏,皆可任意選擇。雖然Sora并非首個可以通過文本生成視頻的大模型,但在時長、分辨率等視頻生成模型的關鍵指標上,相比先前的Runway、Pika等文生視頻產品,Sora可謂“一騎絕塵”?!癝ora的誕生,意味著AGI(人工通用智能)的實現可能從10年縮短至一兩年?!?60創始人周鴻祎在微博上宣布。

記者親身體驗了此前某款視頻大模型的生成產品,在生成的10秒視頻中,人物表情僵硬、動作不協調,視頻也無法準確呈現文字描述,與Sora的演示視頻相比,確實差距巨大。

“Sora的技術亮點是,讓AI內容編輯和生成實現了從文本、圖像到視頻的本質跨越?!敝袊嬎銠C學會理事、南京理工大學計算機科學與工程學院副院長肖亮認為,Sora的底層技術并不算新,但優勢在于“博采眾長”,是多項技術積累、共同作用的結果。Sora在技術上的“顛覆性”主要體現在三方面:一是突破當前視覺大模型“60s超長視頻”生成瓶頸,以往的視頻模型大多只能生成時長不超過10秒的視頻,而Sora在保證視頻時長的同時,還能保持人物和場景的連貫;二是呈現多角度一鏡到底,逼真表現光影幾何、物理關系;三是較為真實地遵循物理世界規律,比如畫筆會在畫布上留下水墨、人吃漢堡會留下咬痕等。

OpenAI對Sora的定位頗具野心,號稱其并非僅僅是“文生視頻”的工具,而是一個通用的“物理世界模擬器”——復現真實世界的重力、摩擦力等物理現象。這一定位使得Sora未來有望成為跨越各行各業的“超級工具”,可用于模擬天氣變化、自動駕駛、生物行為甚至軍事場景等。

對此,南京大學計算機科學與技術系長聘副教授過潔表示,實際上,早有多條技術路徑瞄準“模擬物理世界”這一目標,只不過實現方式不同。Sora的技術路徑可以理解為“數據驅動”——通過學習視頻來理解現實世界的動態變化,并用計算機視覺技術模擬這些變化?!暗珡腟ora的一些‘翻車視頻可以看出,它在理解物理世界時會遇到困難?!边^潔以游戲舉例,在一款射擊游戲中,玩家想要走出屋子射擊“敵人”,Sora很可能會讓玩家“穿墻而去”?!癝ora是否知道墻是一道物理障礙?在它塑造的世界規則中,是否有這么一條規矩,規定墻是不能穿過的?這些都是未知?!?/p>

“目前Sora接受的所有訓練都是人類‘喂給它的,其實還是沒有跳脫現階段人類的認知范圍。目前還有許多物理規律連人類都還沒有掌握,人類尚未踏足的知識領域,Sora也無法理解?!边^潔說。

創意工作,

AI仍難以替代人類

“過往的人工智能產品,多半可以分為‘以文生文‘以文生圖等類型。它們大多是根據網上已有的語料來進行內容產出,對于我們的工作生活并沒有帶來特別大的改變?!蹦暇┐髮W人工智能學院院長周志華分析,大家之所以對“文生視頻”的反應“有點大”,是因為通過文字輸入來生成視頻這種方式,更容易讓大家感同身受。

影視娛樂行業的內容創作者,成為最早擁抱AI創作工具的探路人之一。國內一家頭部影視公司的AI項目負責人王鈺媛告訴記者,自2022年5月“文生圖”工具Midjourney推出測試版本,她便開始探索AI為內容創作帶來的可能性?!癆I目前在影視全流程都有所應用,涵蓋前期開發、中期制作、后期宣發整個鏈條。在影視項目的前期開發中,AI可以協助頭腦風暴,激發‘腦洞,還可以輔助背景調研、制作策劃書、潤色大綱、評估IP等。比如,在動畫電影的角色設計過程中,需要完成角色的配色、服裝、整體的線稿等,傳統情況下,美術設計師要用三四天時間才能完成,如果導演不滿意,還需要好幾輪溝通和修改,而利用AI,能迅速生成很多案例給導演和制片方選擇,減少了大量溝通成本?!?/p>

3月6日,一部自稱“完全由AI制作的開創性長篇電影”在洛杉磯首映。這部《終結者2》的翻拍作品,由50位藝術家組成的團隊完成。該團隊使用Midjourney、Runway、Pika等多個AI工具進行創作。結合過往的使用經驗,王鈺媛認為,就整體質量而言,目前AI生成的內容離商業質量要求還很遠。比如,控制影片特定畫面的風格、色調,保持角色的一致性,制作連貫的長鏡頭,都是AI目前難以完成的。AI工具更偏向于輔助、提供靈感和參考,沒有辦法完全取代某一個環節。

“不過,大模型確實有可能顛覆傳統電影的商業模式。傳統的影視制作,需要編劇、導演、制作團隊、演員等共同協作,工種細分程度很高?!蓖踱曟抡f,近幾年興起的短視頻中,遵循“黃金三秒定律”的短視頻,無需在制作上多么精良,但對視頻創意的要求很高,需要立刻抓住觀眾眼球。對于這些短視頻創作者,AI就可以成為很好的輔助。

在未來的“眼球爭奪戰”中,拼創意將成為趨勢?!霸浺粋€專業團隊才能制作出的影片,現在有可能一個人就能完成。不需要商業融資、不需要花大價錢請演員、攝影師,人人都可以成為創作者?!蓖踱曟峦茰y,AI將給觀眾帶來更多可選擇的娛樂產品,除了電影、電視劇,短視頻、游戲等更多節奏緊湊、領域細分的內容和產品將呈現爆發式增長?!拔艺J為AI工具沖擊的不是某個具體的工種,而是傳統行業或者帶有固定思維的人群?!?/p>

新浪潮來襲,

教育何為?

“盡管國內大模型產品如雨后春筍大量涌現,但實際發展還是與美國存在差距?!睒I內人士表示,究其原因,在于算力、數據和人才三個方面。

當下,人工智能已成為產業創新的關鍵抓手之一。省政府工作報告也指出,要更大力度發展數字經濟,以人工智能全方位賦能新型工業化,積極構建特色化行業大模型,打造人工智能創新應用先導區。

“江蘇發展人工智能大模型的一大優勢是高校資源非常充分,但江蘇各個高校培養的頂尖人才外溢現象比較明顯?!边^潔說。

2月27日,南京大學宣布,將于今年9月面向全體本科新生開設“人工智能通識核心課程體系”。課程體系將涵蓋一門必修的人工智能通識核心課,搭配人工智能素養課,以及各學科與人工智能深度融合的前沿拓展課,從知識、能力、價值觀與倫理三個維度開展教育教學。

“近幾年國內許多高校都建立了人工智能學院,從本科開始專門培養人工智能專業人才,這是一個好開端?!敝苤救A表示。南京大學2018年成立我國C9高校中第一個人工智能學院培養本科生,并率先發布我國第一個人工智能本科專業教育培養體系。

“從人工智能領域的發展來看,重要的是打通‘基礎研究—人才培養—創新技術—產業發展的通道?!敝苤救A說,“基礎研究水平提高了,國內大批研究生能夠接觸和從事與國際接軌的研究課題。其中一些學生自然會走到前沿促進基礎研究和技術創新,他們將成為我國人工智能產業蓬勃發展的生力軍?!?/p>

(摘自2024年3月12日《新華日報》)

猜你喜歡
人工智能模型
適用于BDS-3 PPP的隨機模型
我校新增“人工智能”本科專業
p150Glued在帕金森病模型中的表達及分布
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
2019:人工智能
人工智能與就業
數讀人工智能
3D打印中的模型分割與打包
下一幕,人工智能!
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合