?

全民都玩AIGC,你家算力夠勁嗎?

2023-05-30 10:48
電腦報 2023年18期
關鍵詞:算力性價比旗艦

自從ChatGPT一夜之間紅遍全球之后,AI出圖更是一發不可收拾成為公眾關注的焦點。不少企業甚至已經開始使用AI出圖代替部分設計師的工作,頗有“不會用AI就要被時代淘汰”的勢頭。當然,雖然目前AI出圖在真實物體細節方面還有較大提升空間,但不能否認的是在未來算力大幅升級、模型大幅進化之后,AI是完全可以勝任部分設計工作的。所以,對AI應用有興趣的朋友現在可以行動起來開始學習啦。不過,工欲善其事必先利其器,那么玩AI出圖,應該用什么電腦呢?

本地AI出圖,高效工具不可少

我們知道,目前AI出圖分了云端和本地兩種計算方式,簡單來說在線方式(例如大名鼎鼎的Midjourney)上手難度較低、對本地電腦硬件基本沒有要求,而且出圖質量下限高,很容易就能制作出比較不錯的圖,但是屏蔽了不少提示詞,所以自由度相對較低。此外,一般來講效果比較好的AI云端出圖高級服務都需要付費,而且國內訪問也可能受到一定限制。

而本地運算方式,例如StableDiffusion雖然上手難度高,但擴展性與提示詞的自由度極高,因此出圖質量上限也極高。最重要的是,StableDiffusion本身以及可用的海量插件與模型都是免費的,自己訓練模型也比較方便,更適合廣大玩家嘗試。

當然,既然是本地計算,要求效率高的話那電腦的硬件性能肯定不能低了。StableDiffusion本地AI出圖主要依靠GPU進行計算(CPU也行,但在并行計算這方面顯然效率遠不及GPU,差了幾個數量級),同時對整機的配置也有一定的要求。因此,想要玩AI出圖的朋友,升級或者干脆入手一臺高效的新電腦是非常有必要的。

延伸閱讀:StableDiffusion本地部署注意事項

StableDiffusion的本地部署教程其實很多了,隨便一搜一大把,我們這里只簡單總結一下大家需要注意的幾個點。

●需要安裝GIT,這是安裝StableDiffusionWebUI的先決條件之一。下載地址:https://git-scm.com/download/win

●需要安裝Python3.10運行環境。miniconda下載地址:https://docs.conda.io/en/main/miniconda.html

●使用NVIDIA卡需要安裝cuDNN(CUDA深度神經網絡庫)最新版,最新版才能讓RTX40系列發揮出真正的性能。下載地址:http://go.cpcw.com/cudnn2023

要是嫌自己部署太麻煩覺得無從下手,也可以直接下載整合包,解壓即可使用。整合包不但包含了StableDiffusion需要的運行環境(如果運行不正常,也可以按照前面的提示安裝GIT和Python),也設置了一些預設方案,照顧不同配置特別是不同顯存容量的用戶,使用起來確實比較方便,特別適合新手入門。

例如B站UP主“秋葉aaaki”制作的共享整合包,目前最新已經升級到V4版,支持CPU和NVIDIA顯卡CUDA加速,大家可以自行去B站下載。此外,目前AMD顯卡在Windows下只能通過DirectML實現StableDiffusion的AI計算加速(Linux環境下支持面向GPU計算的ROCm開放軟件平臺,最近ROCm即將登陸Windows),效率遠不及NVIDIA顯卡的CUDA,所以只有少數整合包加入了AMD顯卡需要的DirectML庫(用戶可自行添加),Intel顯卡也差不多是這個情況,因此要本地AI出圖,NVIDIA顯卡幾乎是唯一值得推薦的選擇。

本地AI出圖的電腦配件怎么選?

前面已經簡單提到了本地AI出圖主要靠的是GPU計算,不過考慮到整個設計過程并非只包含AI出圖或訓練模型、或者用戶裝臺電腦來也不是只針對AI應用,很可能還包括其他設計或生產力應用需求,所以對整機配件的選擇也是有一定要求的,主要涉及處理器、內存和顯卡,而磁盤只要是SSD,足夠存放素材與模型文件就可以了,沒有特別的要求。

處理器

實際上,就算Intel酷睿i913900K這樣的旗艦級處理器,在StableDiffusion中出圖的效率也不過大約是NVIDIA顯卡旗艦RTX4090的1/256、RTX3090Ti的1/141,出一張768×768、采樣步數50的圖要費時近13分鐘,實在談不上什么效率。所以只有在電腦沒有顯卡支持在StableDiffusion中開啟硬件加速的情況下,才會輪到處理器臨時替補一下。因此,如果只針對AI出圖裝機,對處理器的性能其實沒有什么太高的要求。

不過,就算對處理器沒有特別的要求,但一是考慮到整套電腦的配置不能太老舊,必須要有足夠的擴展性和升級性,二是考慮到整機還有可能完成其他生產力工作,所以在處理器方面我們制定了不同的選擇方向。

●注重性價比,千元級U即可

如果沒有其他大型生產力應用的要求,那么一款最新的千元級U足以滿足裝機需求。Intel方面可以考慮酷睿i513400F,AMD方面可以考慮銳龍57600智酷版。為什么不用更便宜的U?一方面是這兩款都能支持PCIe5.0和DDR5內存,未來平臺升級PCIe5.0顯卡(這一點很重要,按照NVIDIA和AMD現在的做法,以后中低端顯卡有很大概率只支持8個PCIe通道,如果處理器或主板不支持PCIe5.0,就會出現帶寬減半的問題)與SSD、擴展內存容量更方便一些;另一方面是它們的性能應付主流生產力應用也是能夠勝任的,同時在價格上更加親民。

●注重全能性,可考慮高端多核U

如果電腦還要完成AI出圖之外配套的生產力工作(視頻剪輯、3D渲染輸出),那就對處理器的多線程性能提出了更高的要求,需要選擇核心數量更多的高端型號。在這里我們優先推薦AMD的銳龍7000系列旗艦型號,例如銳龍97950X和銳龍97900X,而Intel酷睿i913900系列和酷睿i713700系列則次之。

究其原因,就是我們在實測中發現,擁有大量能效核的第13代酷睿在運行包括StableDiffusion在內的部分生產力軟件時會出現核心分配不正確的問題,導致重負載進程全部分配給了能效核,性能核則處于閑置狀態,如此就會使得處理器的運算效率大打折扣。相比之下全是大核的銳龍7000系列就不會出現這樣的問題。

內存

既然已經決定了選擇銳龍7000或者第13代酷睿平臺,那么DDR5內存也是必選了。雖說第13代酷睿也支持DDR4內存,但考慮到整機未來的升級空間和對其他生產力應用的需求,明顯也是選擇帶寬更高的DDR5內存更合適。

容量方面,StableDiffusion不用處理器來出圖的話,也不怎么吃內存,32GB綽綽有余。目前內存價格比較給力,雙16GB對于主流整機來說也沒什么壓力,也可以應對更多的生產力應用,所以強烈推薦再省也要上雙16GB。

頻率部分,雖說更高的內存帶寬確實能帶來更高的生產力效率,但也要綜合考慮性價比的問題,超過DDR56400的內存還是挺貴的,綜合下來DDR56400/6000是綜合性價比最高的型號。此外,如果選擇AMD銳龍7000平臺,那么DDR56400也是極限了,不用考慮更高的型號。

顯卡

終于說到StableDiffusion出圖的主角配件了。前面已經提過,StableDiffusion本地出圖首選CUDA生態圈無可替代的NVIDIA顯卡,用DirectML實現通用計算的AMD顯卡和Intel顯卡都屬于替補(可以期待AMD顯卡Windows版的ROCm實裝后會不會有所改善),效率和兼容性都難以與NVIDIA顯卡相提并論,與其花時間去解決A卡和I卡在StableDiffusion中的各種問題還不如老老實實用N卡省事。

除了GPU的算力之外,StableDiffusion本地出圖最吃的就是顯存了,顯存越大,出圖分辨率也就可以設得越高。以本文后面的文生圖測試為例,入門推薦8GB起步,768×768分辨率夠用(大約最高占用到6.9GB);再高一些的1024×1024推薦選用12GB顯存的型號(最高占用約9GB);再往上可選的就是16GB/20GB/24GB的型號。當然,市場中也有魔改的RTX2060/2080Ti可以做到12GB/22GB顯存,但是很明顯這類卡沒有質保,所以不推薦普通用戶冒險。然而擁有海量顯存(例如NVIDIAA10080GBPCIe)的專業計算卡就不是大眾玩家消費得起的了,這里就不再多說。

此外,最近NVIDIATeslaP40/M40等“古董級”純計算卡也是AI出圖玩家關注的焦點,它們具備超大的24GB顯存,而且二手卡價格也非常誘人(M40僅需499元,P40還漲了一波從899元飆到1199元了)。但是,這類計算卡都是被動散熱,玩家拿到手需要手動改散熱器,而且老舊的Pascal與Maxwell架構功耗也非常高,改起散熱來不但成本高,難度也不是普通用戶能夠HOLD住的。還有最重要的一點,老架構不支持FP16半精度計算,而StableDiffusion在半精度模式下可以大幅提升效率并節省顯存占用,這一點也讓這些老二手卡價值大打折扣,再加上沒有可靠的質保,所以也不推薦普通玩家折騰。

當然,也有一些方法可以降低StableDiffusion對顯存的占用,讓一些顯存不太夠的顯卡也可以支持更高分辨率出圖,例如Xformers、MultiDiffusionwithTiledVAE,這就不在本文討論范圍內了,有興趣的朋友可以自行研究。

那么,我們正在使用的、可買到的NVIDIA顯卡在StableDiffusion中出圖效率到底如何呢?我們對此也進行了一個橫向測試,大家可以參考一下。

如圖可以看到我們的StableDiffusion出圖設置,默認使用NVIDIA官方提供的CKPT模型,采樣方式為Eulera,采樣步數設置為50,CFGScale(提示詞相關性)設置為7.5,生成批次為10,每批生成數量為2,圖像分辨率為768×768。提示詞為:“beautifulrenderofaTudorstylehousenearthewateratsunset,fantasyforest.Photorealistic,cinematiccomposition,cinematichighdetail,ultrarealistic,cinematiclighting,DepthofField,hyper-detailed,beautifullycolor-coded,8k,manydetails,chiaroscurolighting,++dreamlike,vignette”。

從測試結果來看,除了數據條短得都看不見的酷睿i913900K,顯卡這邊的出圖效率基本上就跟價格成正比了,不過RTX4070還是略勝了上代更貴的RTX3080,而且RTX4070本身擁有12GB顯存,相比RTX3080的10GB也更有優勢一些。但是,雖說在這樣的設置下RTX4070Ti比RTX3090略快,但不要忘了RTX3090有海量的24GB顯存,比RTX4070Ti的12GB多了一倍,所以在圖像分辨率提高到一定程度之后肯定是可以反超的。至于底部的GTX1660Ti,由于顯存只有6GB,測試中已經爆顯存了,因此效率明顯低了很大一截,但即便如此速度也是處理器的7.7倍。

綜合來看,對于主流用戶來講,RTX3060其實是個綜合性價比相對突出的選擇,雖然算力不能與高端卡相提并論,但好在有12GB大顯存,甚至比一些高端卡顯存還大,可以避免一些爆顯存的情況。當然,在資金充足的情況下,顯卡自然是越高級越好了,只是需要注意電源的搭配,畢竟出圖的時候GPU都是滿載狀態,電源功率不夠那必然是要歇菜的。

AI“設計師”裝機推薦,高中低總有一款適合你

經過前面的分析,相信大家已經對StableDiffusion的硬件需求有所了解了。如果還是不知道怎么選擇具體的裝機配件,我們也給出了低中高三套方案供大家按圖索驥。這三套方案除了可以滿足StableDiffusion的本地AI出圖需求,也能覆蓋不同檔次的生產力應用。當然,你要用它玩游戲體驗也是不錯的,畢竟“買前生產力,買后……”,懂的都懂。

基礎款:AI出圖+輕度生產力應用

對于主流用戶來講,搭載千元U和RTX3060顯卡的方案完全夠用了。雖然前面我們說過第13代酷睿大小核設計會導致一些生產力應用負載只占用小核從而影響效率,但AI出圖主要靠的是顯卡,而且千元這個級別酷睿i513400F也確實是最新一代U中性價比最突出的了,何況我們遇到核心分配有問題還可以手動把負載分配給大核來解決。

顯卡部分當然是AI出圖的重點,從前面的測試可以看到RTX3060出圖效率只是略低于RTX3060Ti,但它擁有12GB大顯存,可以支持更高分辨率出圖,價格方面也要比RTX3060Ti低不少,如果從AI出圖需求來看,主流配置選用RTX3060性價比確實更高。這里我們選擇的是技嘉RTX3060風魔12GB顯存版(注意RTX3060也有8GB顯存版,不要買錯了),雙風扇設計完全能HOLD住散熱,長時間計算出圖不用擔心穩定問題。

主流款:全能型設計師電腦

全能型設計師電腦更多地考慮到了用戶對于AI出圖之外的生產力應用需求,因此處理器方面選擇了全大核、12核24線程的銳龍97900智酷版,不存在進程分配不正確的問題,同時不帶X的銳龍97900不開PBO滿載功率僅有90W,性能相對銳龍97900X差距不到10%,因此在2000元級U中性價比非常高,不管是視頻剪輯還是3D渲染輸出,都可以提供不錯的效率。

顯卡部分則直接上了最新的RTX4070,從算力來講RTX4070已經小超了10GB顯存版的RTX3080,而且它的滿載功率也不過200W水平,對散熱和供電的要求都低于RTX3080,長時間AI出圖更穩定、更節能。同時RTX4070顯存也多出2GB,價格也更低,綜合來看很明顯比RTX3080更值得選擇。技嘉RTX4070風魔也是走性價比路線的甜品級RTX4070代表,3風扇散熱設計對付200W功率的RTX4070毫無壓力,同時噪聲也可以控制到更低的程度。

旗艦款:高效生產力利器

旗艦款配置可以說是一套高效生產力利器了,16核32線程的旗艦U銳龍97950X全大核設計不用擔心核心分配問題,相比酷睿i913900K在某些生產力應用中只能手動分配8個大核的適應性優勢明顯,從這一點來看它確實比核心數量更多的酷睿i913900K更占優勢。

顯卡部分,我們這里就選擇了RTX4080,擁有16GB超大顯存,高分辨率AI出圖效率更高。從前面的測試也可以看到,RTX4080的AI出圖效率已經超越了RTX4070Ti大約30%。同時,RTX4080這個級的旗艦N卡在視頻剪輯、3D設計方面的加速能力也是非常強大的,特別適合有高端設計需求的用戶選擇。RTX4080獵鷹則是技嘉RTX4080顯卡家族中的高性價比款,用不到萬元的售價就做到了旗艦級的供電與散熱規格,長時間滿載出圖也不用擔心散熱和穩定性的問題,這讓整套旗艦配置的購買價值也得到了進一步提升。

總結:做好準備“戰未來”,和AI共同進化

前有ChatGPT,后有AI出圖,今年AI應用突然的大眾化讓我們感受到AI時代強烈的沖擊,AI甚至在某些應用范圍內已經部分代替了人工(特別是視覺設計類和文案策劃類)。不過,AI作為生產力工具,本來就是為人類服務的,我們現在要做的只是去學習如何使用這種高效的工具。在未來,會用AI完成各種工作就像現在用Office軟件辦公一樣普及,可能也會成為就業的必備技能。因此,想要不落后于時代,就和AI一起進化,做好準備“戰未來”吧!

猜你喜歡
算力性價比旗艦
衛星通信在算力網絡中的應用研究
電動旗艦來了!試駕BMW i7
算力網絡中基于算力標識的算力服務需求匹配
這才是旗艦SUV 試駕全新一代路虎攬勝
中國電信董事長柯瑞文:算力成為數字經濟的主要生產力
沃爾沃發布全新純電旗艦SUV EX90
基于SiteAI算力終端的交通態勢感知系統
買房,要的就是性價比
旗艦,你是誰
性價比再度提升 Velodyne Acoustics(威力登)Impact 12 MKII
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合