向治霖
9月的開始,美國芯片大廠英偉達,卷入了大麻煩。
據外媒9月1日報道,美國官員命令英偉達,停止對中國出口兩款頂級計算芯片,A100和H100。另外,英偉達的競爭對手AMD,也被要求停止對中國出口MI250芯片。
英偉達和AMD兩大巨頭,牢牢占據著全球獨立GPU的市場。這也意味著,美國對中國的前沿、高端領域,再一次升級“追殺令”。
長遠影響暫且不提,然而英偉達,率先繃不住了。
受到上述消息影響,一夜之間,英偉達的股價一度暴跌11%,股票市值蒸發了約400億美元。另有數據顯示,美國半導體公司的股價集體下挫,損失超過1000億美元。
美國推行的技術封鎖,由于逆全球化的趨勢而行,“損人不利己”并不奇怪。但是這一次,市場的波動為何如此之大?
原因至少有兩個方面:
一方面是,限制高端GPU(圖形處理器)對中國出口,直接影響到了英偉達等公司的業績。中國一直是英偉達、AMD等眾多芯片企業的排名前三大市場。英偉達透露,新的限制政策,讓公司可能在本季度損失4億美元的銷售額。
限制消息放出的當天,英偉達創始人黃仁勛“緊急公關”,第一時間發信稱“:將立即與中國客戶合作,以我們最好的替代品滿足客戶需求,或是以申請許可證方式協助?!?/p>
不過,黃仁勛也承認,替代品比起A100,表現會有明顯的差距。
另一方面,市場的震蕩也因為,美國的技術限制“超出了以往的打擊范圍,從消費電子開始,現在擴散到最前沿的領域”。這就造成不確定性的加強,市場信心被打擊。
或許是因為英偉達“跌得太慘”,9月2日,美國政府打了個“補丁”。
據英偉達9月2日公告稱,公司已經得到批準,可以繼續為中國出口A100芯片(明年3月前),也可以繼續履行A100和H100的訂單(明年9月1日前)。不過,時間受到了限制。
政策改過去、改回來,信心就能恢復嗎?
或者,我們更應該關注的是,朝令夕改的表象間,有什么東西永遠地變了?
“我們也是(新聞發出的)這一天才知道的,其實也挺意外?!?月1日晚,董超告訴南風窗。
董超是AI領域的學者,曾就職于商湯科技。2021年,他被斯坦福大學評選為世界前2%頂尖科學家?,F在的他,是中國科學院深圳先進技術研究院數字所副研究員、博士生導師,同時,他也在上海人工智能實驗室擔任職務。
董超告訴南風窗,A100的“斷供”沒有先聲,發生得突然,“我們前一段時間,才剛到貨了一批,已經預計了還有多少要到。我們的規劃,是規劃到了2025年的,然后一下子停了”。
“這個(政策生效的話)影響將會很大?!倍寡?。
以他從事的AI領域為例,目前國際競爭主要在通用大模型上,這也是 AI領域中最頂級的一塊。董超說,一旦頂級的顯卡被限制了,我們再做大模型的競爭,可能就很困難,“相當于未來的通用人工智能的趨勢,可能就都掌握在他們手里了”。
被限制的3款GPU,無疑就是目前最新、最先進的3款。
3款GPU中,目前最多用到的是A100。董超介紹,A100的價格在一款8萬元左右,只有非常大型的公司和研究院用得起,他所服務的上海人工智能實驗室中,主流芯片基本換成了A100,這已經是最高級別的GPU了。
對GPU的評價指標是多樣的,僅以顯存為例,董超介紹,A100的顯存最高可達80個G,而上一代產品中,能達到40G的就非常高了,普通產品的顯存一般在20到40G之間。
A100這樣頂級的芯片,對尖端研發來說,屬于不可或缺的硬件。
頂級的性能只是一個方面,另外需要注意的是,高端GPU的迭代速度也很快。
仍然以AI中大模型的訓練為例,“這些模型的特點,就是它的規模非常大,是有億級以上的參數”,董超說。
十億級甚至百億級的數據量,對于顯存要求非常高,“即便是A100這樣的顯卡,可能都需要32塊同時進行計算”,董超說,如果說沒有這種頂級顯卡,那么我們可能要付出相當大的代價。
頂級的性能只是一個方面,另外需要注意的是,高端GPU的迭代速度也很快。
“大概半年多、一年間,GPU就會有一次升級。每出一款新的,相應的人工智能算法,也就會提升一大步。迭代方面,算法與顯卡是相關聯的?!倍榻B。
這意味著,在高端GPU徹底斷供后,只需要半年一年的時間,尖端領域的差距就會體現出來。
而這一次,美國官方所針對的,自然就是AI、超算等“主戰場”。
中國是美國在AI領域的主要競爭對手。早在2019年,聯合國下屬的世界知識產權組織(WIPO)公布了一份研究報告,認為在全球人工智能領域的競爭中,中國和美國處于領先地位。
到了2021年,斯坦福大學發布的《人工智能指數報告》顯示,中國在專利申請、會議出版物、期刊發表和期刊引用等四項指標上已經領先于美國,躋身世界第一。
對待激烈的競爭,美國給出了行政干預手段。董超告訴南風窗,禁掉高端的GPU,對消費級市場影響不大,普通人很難有感知,但是“對于AI的國際競爭,這相當于釜底抽薪”。
對此,外交部發言人汪文斌9月1日表示,美方的做法是典型的科技霸權主義,美方一再泛化國家安全概念,濫用國家力量,企圖利用自身科技優勢,遏制打壓新興市場和發展中國家發展,此舉違反市場經濟規則,破壞國際經貿秩序,中方對此堅決反對。
美國官方的動作頻頻,今年7月,美國政府擴大了芯片制造設備的限制范圍,14nm以下的設備出口中國受到限制。8月,“芯片法案”出臺、限制高端EDA。再到這次限制高端GPU,動作一氣呵成,環環相扣。
受到影響的,自然不只有AI。
“(先進GPU)主要用在高性能計算領域,比如高端的AI訓練、數據中心、超級計算、智能計算?!毙局\研究分析師商君曼對南風窗表示。
在應用層面,受此影響的主要是科研、醫療、自動駕駛、AI等等。
GPU為何擁有如此之多的用途?我們不妨簡單了解一下它的發展。
其實,GPU早期最大的用途,只是作為電腦游戲的顯卡,用來對圖像進行渲染。
GPU相比CPU,在圖像處理上具備優勢。比如一張4k的圖像,如果用CPU來處理,是串行處理的,從第一個像素處理到最后一個像素,它的速度再快,也得處理完前一個才能處理后一個。
但是,GPU擁有并行處理的能力,這相當于,GPU在工作時要開非常多的計算單元,每一個計算單元,相當于一個很小型的CPU。然后,GPU就可以把這些像素同時處理。
并行計算的特點,使得GPU能夠快速處理和響應。這一時期,GPU為CPU“打下手”,處理一些特定的工作。
2012年,深度學習成為火熱的賽道。在原理上,深度學習與渲染很類似,這迅速帶動了GPU的發展。
董超回憶說,2012年,他還在香港中文大學?!澳莻€時候,我們決定進入深度學習領域,第一件事情就是要開始買顯卡(GPU)?!?/p>
隨著深度學習越來越火,董超發現,做人工智能算法的實驗室,如果不用深度學習來做,可能就達不到最好的性能。這再一次助推了GPU發展。
而英偉達瞄準了這股趨勢,“英偉達很聰明的一點就是,瞄準了計算能力、做計算卡,一下子就起來了”。
英偉達的奇跡,造就了“黃氏定律”。英偉達首席科學家Bill Dally 曾總結說,從2012年的K20X到2020年的A100,GPU的推理性能提高到原來的 317倍。這就是“黃氏定律”,發展速度比“摩爾定律”還快。
董超回憶說,十年前的GPU賽道上,產品很多,然而GPU成為通用芯片的時代到來,英偉達崛起,很少聽到別的廠商了。
競爭對手少了,但市場“蛋糕”越來越大。商君曼表示,隨著大數據時代、AI時代的來臨,我們需要處理的這種圖形信息、數據信息,增長的速度非???,“順勢而為地,GPU受到越來越多的關注”。
在講求“厚積薄發”的芯片領域,“巨人”的斷供,無疑也帶來巨大壓力。
GPU賽道的火熱,自然也引起了各國重視。
董超表示,在中國,不是沒有自己的GPU,也不是沒有自己的高端顯卡,但是,我們沒有一個完整的生態。
“中國現在已經有很多企業進入了GPU賽道,目前來說,國產GPU還處在一個發展比較初期的階段?!鄙叹Q,其中的差距是比較明顯的。
而在董超看來,美國此次的技術限制,最“誅心”的是,一方面,它針對尖端科技進行打壓,另一方面,它依然“壓著”國產GPU的發展。
董超解釋,美國只禁了高端、不禁低端,這就意味著,你還可以買它的低端顯卡,這就不影響它的整個銷量。
而且,這在中國市場的占有量其實仍然很大。因為在A100之外,英偉達和AMD的低端顯卡,在中國仍然很難有國產顯卡替代。
“如果說,政策是對全部的GPU進行限制,那反而是件好事?!倍f。
這就意味著,我們必須選擇國產GPU。董超表示,在中國,不是沒有自己的GPU,也不是沒有自己的高端顯卡,但是,我們沒有一個完整的生態。
對于顯卡,除了要有計算能力,其實還要有配套的一些軟件,相應的一些代碼庫等等。這些配套的東西,會形成一個生態。
一個成熟的生態,意味著使用的人很多、教程很多,解決方案都是現成的。
如同擁有“蘋果全家桶”的人,在轉向安卓手機后,學習和使用的成本就會上升。這正是國產GPU面臨的桎梏。
這些成本包括,“它的使用非常麻煩,要求用戶重新學習,而且它的里面的那些流程一旦出了問題,沒有人幫你解決”,董超解釋。
因此,假如我們不得不用國產GPU,那就意味著,國產的生態就可以建立起來,大家強制性地進行學習。這樣,國內的GPU可以借機發展起來,國內的生態也可以發展起來。
“如果大家都用起來的話,我覺得,其實也挺有希望(突破)?!倍f。
然而,美國官方的政策“只限高端,不限低端”。在技術的壁壘和生態的加持下,哪怕是最高端的國產GPU,在對標別人的次旗艦產品時,仍然缺乏優勢。
不過,層層推進的美國政策下,不切實際的幻想早該拋棄。
董超告訴南風窗,科技水平的評價,標準在于最尖端領域。國際競爭當中,如果人家已經穩操勝券、穩居第一,這個對我們是很危險的。
“相當于倒逼了,我們的國產化,技術要繼續往上提升?!鄙叹硎?。一個中國版的“英偉達”出現,并非不可能。只不過,這一切還需要時間。