Sora問世，一石激起千層浪

2024-04-16 05:52楊易臻張宣蔡姝雯

風流一代·經典文摘 2024年4期

關鍵詞：人工智能模型

楊易臻張宣蔡姝雯

穿著時尚的女性漫步在霓虹燈閃爍的東京街頭”“兩艘海盜船在一杯咖啡內作戰”……春節假期，這幾段畫面精美的視頻在朋友圈“霸屏”，這些視頻是美國人工智能團隊OpenAI新發布的視頻大模型Sora創作的。

Sora，這個詞來源于日語中的“天空”，意指無限的創造潛力。2022年底因發布ChatGPT一炮走紅的OpenAI，又因Sora在全球內容創作領域掀起新的風暴。

博采眾長，

Sora“一騎絕塵”

只需要一段20至30個詞匯的文本指令或一張靜態圖像，就可以生成一段視頻，不論是寫實還是動畫風格、寬屏還是豎屏，皆可任意選擇。雖然Sora并非首個可以通過文本生成視頻的大模型，但在時長、分辨率等視頻生成模型的關鍵指標上，相比先前的Runway、Pika等文生視頻產品，Sora可謂“一騎絕塵”?！癝ora的誕生，意味著AGI（人工通用智能）的實現可能從10年縮短至一兩年?！?60創始人周鴻祎在微博上宣布。

記者親身體驗了此前某款視頻大模型的生成產品，在生成的10秒視頻中，人物表情僵硬、動作不協調，視頻也無法準確呈現文字描述，與Sora的演示視頻相比，確實差距巨大。

“Sora的技術亮點是，讓AI內容編輯和生成實現了從文本、圖像到視頻的本質跨越?！敝袊嬎銠C學會理事、南京理工大學計算機科學與工程學院副院長肖亮認為，Sora的底層技術并不算新，但優勢在于“博采眾長”，是多項技術積累、共同作用的結果。Sora在技術上的“顛覆性”主要體現在三方面：一是突破當前視覺大模型“60s超長視頻”生成瓶頸，以往的視頻模型大多只能生成時長不超過10秒的視頻，而Sora在保證視頻時長的同時，還能保持人物和場景的連貫；二是呈現多角度一鏡到底，逼真表現光影幾何、物理關系；三是較為真實地遵循物理世界規律，比如畫筆會在畫布上留下水墨、人吃漢堡會留下咬痕等。

OpenAI對Sora的定位頗具野心，號稱其并非僅僅是“文生視頻”的工具，而是一個通用的“物理世界模擬器”——復現真實世界的重力、摩擦力等物理現象。這一定位使得Sora未來有望成為跨越各行各業的“超級工具”，可用于模擬天氣變化、自動駕駛、生物行為甚至軍事場景等。

對此，南京大學計算機科學與技術系長聘副教授過潔表示，實際上，早有多條技術路徑瞄準“模擬物理世界”這一目標，只不過實現方式不同。Sora的技術路徑可以理解為“數據驅動”——通過學習視頻來理解現實世界的動態變化，并用計算機視覺技術模擬這些變化?！暗珡腟ora的一些‘翻車視頻可以看出，它在理解物理世界時會遇到困難?！边^潔以游戲舉例，在一款射擊游戲中，玩家想要走出屋子射擊“敵人”，Sora很可能會讓玩家“穿墻而去”?！癝ora是否知道墻是一道物理障礙？在它塑造的世界規則中，是否有這么一條規矩，規定墻是不能穿過的？這些都是未知?！?/p>

“目前Sora接受的所有訓練都是人類‘喂給它的，其實還是沒有跳脫現階段人類的認知范圍。目前還有許多物理規律連人類都還沒有掌握，人類尚未踏足的知識領域，Sora也無法理解?！边^潔說。

創意工作，

AI仍難以替代人類

“過往的人工智能產品，多半可以分為‘以文生文‘以文生圖等類型。它們大多是根據網上已有的語料來進行內容產出，對于我們的工作生活并沒有帶來特別大的改變?！蹦暇┐髮W人工智能學院院長周志華分析，大家之所以對“文生視頻”的反應“有點大”，是因為通過文字輸入來生成視頻這種方式，更容易讓大家感同身受。

影視娛樂行業的內容創作者，成為最早擁抱AI創作工具的探路人之一。國內一家頭部影視公司的AI項目負責人王鈺媛告訴記者，自2022年5月“文生圖”工具Midjourney推出測試版本，她便開始探索AI為內容創作帶來的可能性?！癆I目前在影視全流程都有所應用，涵蓋前期開發、中期制作、后期宣發整個鏈條。在影視項目的前期開發中，AI可以協助頭腦風暴，激發‘腦洞，還可以輔助背景調研、制作策劃書、潤色大綱、評估IP等。比如，在動畫電影的角色設計過程中，需要完成角色的配色、服裝、整體的線稿等，傳統情況下，美術設計師要用三四天時間才能完成，如果導演不滿意，還需要好幾輪溝通和修改，而利用AI，能迅速生成很多案例給導演和制片方選擇，減少了大量溝通成本?！?/p>

3月6日，一部自稱“完全由AI制作的開創性長篇電影”在洛杉磯首映。這部《終結者2》的翻拍作品，由50位藝術家組成的團隊完成。該團隊使用Midjourney、Runway、Pika等多個AI工具進行創作。結合過往的使用經驗，王鈺媛認為，就整體質量而言，目前AI生成的內容離商業質量要求還很遠。比如，控制影片特定畫面的風格、色調，保持角色的一致性，制作連貫的長鏡頭，都是AI目前難以完成的。AI工具更偏向于輔助、提供靈感和參考，沒有辦法完全取代某一個環節。

“不過，大模型確實有可能顛覆傳統電影的商業模式。傳統的影視制作，需要編劇、導演、制作團隊、演員等共同協作，工種細分程度很高?！蓖踱曟抡f，近幾年興起的短視頻中，遵循“黃金三秒定律”的短視頻，無需在制作上多么精良，但對視頻創意的要求很高，需要立刻抓住觀眾眼球。對于這些短視頻創作者，AI就可以成為很好的輔助。

在未來的“眼球爭奪戰”中，拼創意將成為趨勢?！霸浺粋€專業團隊才能制作出的影片，現在有可能一個人就能完成。不需要商業融資、不需要花大價錢請演員、攝影師，人人都可以成為創作者?！蓖踱曟峦茰y，AI將給觀眾帶來更多可選擇的娛樂產品，除了電影、電視劇，短視頻、游戲等更多節奏緊湊、領域細分的內容和產品將呈現爆發式增長?！拔艺J為AI工具沖擊的不是某個具體的工種，而是傳統行業或者帶有固定思維的人群?！?/p>

新浪潮來襲，

教育何為？

“盡管國內大模型產品如雨后春筍大量涌現，但實際發展還是與美國存在差距?！睒I內人士表示，究其原因，在于算力、數據和人才三個方面。

當下，人工智能已成為產業創新的關鍵抓手之一。省政府工作報告也指出，要更大力度發展數字經濟，以人工智能全方位賦能新型工業化，積極構建特色化行業大模型，打造人工智能創新應用先導區。

“江蘇發展人工智能大模型的一大優勢是高校資源非常充分，但江蘇各個高校培養的頂尖人才外溢現象比較明顯?！边^潔說。

2月27日，南京大學宣布，將于今年9月面向全體本科新生開設“人工智能通識核心課程體系”。課程體系將涵蓋一門必修的人工智能通識核心課，搭配人工智能素養課，以及各學科與人工智能深度融合的前沿拓展課，從知識、能力、價值觀與倫理三個維度開展教育教學。

“近幾年國內許多高校都建立了人工智能學院，從本科開始專門培養人工智能專業人才，這是一個好開端?！敝苤救A表示。南京大學2018年成立我國C9高校中第一個人工智能學院培養本科生，并率先發布我國第一個人工智能本科專業教育培養體系。

“從人工智能領域的發展來看，重要的是打通‘基礎研究—人才培養—創新技術—產業發展的通道?！敝苤救A說，“基礎研究水平提高了，國內大批研究生能夠接觸和從事與國際接軌的研究課題。其中一些學生自然會走到前沿促進基礎研究和技術創新，他們將成為我國人工智能產業蓬勃發展的生力軍?！?/p>

（摘自2024年3月12日《新華日報》）

Sora問世，一石激起千層浪

Sora問世，一石激起千層浪