寫在開頭
就在前幾天,NVIDIA終于正式發(fā)布了RTX 50系的最后一張顯卡——GeForce RTX 5050,包括臺(tái)式機(jī)和筆記本顯卡版本。這對(duì)于玩家來說,這確實(shí)是個(gè)好消息,畢竟上一代RTX 40系的桌面端顯卡并沒有真正的入門級(jí)顯卡,僅筆記本端推出了RTX 4050,而上一張桌面端入門級(jí)還得追溯到三年前的RTX 3050,但它的性能放在今天,顯然是有點(diǎn)力不從心了。
而這次發(fā)布的GeForce RTX 5050顯卡則延續(xù)了前面幾位RTX 50系老大哥的規(guī)格,搭載了服務(wù)器級(jí)別的Blackwell架構(gòu)、還帶來了DLSS 4、Reflex 2等黑科技,整體性能表現(xiàn)還是非常值得期待的。正好,我們最近上手了耕升最新推出的GeForce RTX 5050追風(fēng)OC 8GB顯卡,下面就給大家看看這款顯卡的性能表現(xiàn)吧!
規(guī)格介紹
開始前,照例講講新顯卡的規(guī)格。GeForce RTX 50系顯卡采用了此前NVIDIA在AI領(lǐng)域推出的Blackwell架構(gòu),以大衛(wèi)·布萊克威爾命名,其是一名受人尊敬的數(shù)學(xué)家和統(tǒng)計(jì)學(xué)家,在博弈論和統(tǒng)計(jì)學(xué)領(lǐng)域留下了不可磨滅的貢獻(xiàn),NVIDIA用其名字命名這一架構(gòu)反映了新平臺(tái)的開創(chuàng)性和先進(jìn)的計(jì)算能力。Blackwell可以說是NVIDIA近年來更新幅度最大的GPU架構(gòu)了,相比起之前的架構(gòu)來說,劃時(shí)代的引入了神經(jīng)網(wǎng)絡(luò)著色器,力圖為游戲開創(chuàng)先進(jìn)、高效更逼真的渲染方式,帶給玩家全新的游戲體驗(yàn)。
相比前代Ada架構(gòu),Blackwell的升級(jí)聚焦于四大方向:分別是AI算力的爆發(fā)、光線追蹤技術(shù)的革新以及劃時(shí)代的神經(jīng)網(wǎng)絡(luò)渲染。
第五代Tensor核心
其中AI算力的爆發(fā)就不得不提到Blackwell架構(gòu)上的第五代Tensor Core,新一代Tensor核心添加了對(duì)FP4浮點(diǎn)運(yùn)算精度的支持。FP4是一種較低的量化方法,類似于文件壓縮,可以減小模型推理過程中數(shù)據(jù)存儲(chǔ)和計(jì)算量大小,提高計(jì)算效率,降低該過程對(duì)顯存的要求。與大多數(shù)模型默認(rèn)使用的FP16相比,F(xiàn)P4使用的顯存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高達(dá)2倍。
第四代RT核心而光線追蹤技術(shù)的革新則仰賴于第四代RT Core的加持,相較于第三代RT核心來說,Blackwell架構(gòu)的第四代RT核心主要提升了檢測(cè)光線、路徑與三角形相交的效能,過往在檢測(cè)時(shí)往往只能檢測(cè)單個(gè)三角形,一旦場(chǎng)景復(fù)雜,檢測(cè)能力不足就容易導(dǎo)致渲染出錯(cuò)等問題,而現(xiàn)在檢測(cè)能夠以簇集方式進(jìn)行,檢測(cè)效率更高。同時(shí)還有三角形簇集解壓縮引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以減少渲染毛發(fā)所需的幾何圖形數(shù)量,并使用球體代替三角形以獲得更準(zhǔn)確的毛發(fā)形狀擬合,能夠讓顯卡發(fā)揮更好的性能但只消耗較小的顯存占用。
綜合來看,Blackwell架構(gòu)的光線追蹤多邊形相交效率是上一代Ada Lovelace架構(gòu)的2倍,是Turing架構(gòu)的8倍,同時(shí)還可以節(jié)省25%的顯存使用率。
第四代RT核心的改進(jìn)主要是為實(shí)現(xiàn)更好的光追效果。其中有兩項(xiàng)新技術(shù)能夠受益,第一項(xiàng)是RTX Mega Geometry技術(shù)。隨著光線追蹤游戲場(chǎng)景的幾何復(fù)雜性不斷增加,游戲畫面中幾何圖形的計(jì)算量也呈現(xiàn)出快速增長(zhǎng)的趨勢(shì)。而RTX Mega Geometry技術(shù)能夠加速構(gòu)建邊界體積層次結(jié)構(gòu)(BVH),使得在實(shí)時(shí)渲染中可以處理多達(dá)100倍的三角形數(shù)量。
該技術(shù)的出現(xiàn),也使得開發(fā)者能夠在游戲場(chǎng)景中使用更復(fù)雜的幾何圖形,而不會(huì)影響游戲幀率。過去需要一個(gè)個(gè)算BVH,現(xiàn)在RTX Mega Geometry能夠智能地在GPU上批量更新三角形簇,減少了CPU的負(fù)擔(dān),既保證了性能,也兼顧了圖像質(zhì)量。相信隨著這些技術(shù)的不斷發(fā)展和應(yīng)用,未來的游戲?qū)⒛軌虺尸F(xiàn)出更加逼真和細(xì)膩的視覺效果,同時(shí)保持高效的性能表現(xiàn)。
另外一個(gè)能夠受益的技術(shù)則是Curve Primitive,方便光追在曲面中的應(yīng)用,例如一位男士的頭發(fā)可能需要多達(dá)400萬個(gè)三角形,再加上光線追蹤技術(shù),畫面所需要的運(yùn)算負(fù)載極大。NVIDIA則通過第四代RT核心中的Linear- Swept Spheres(線性掃描球體)技術(shù)有效減少了渲染頭發(fā)所需的幾何體數(shù)量,以球形代替多邊形,更貼合頭發(fā)的形狀,從而將內(nèi)存占用量大幅縮減至三分之一,并進(jìn)一步提升了實(shí)際幀數(shù),讓頭發(fā)的渲染效果更加自然流暢。
神經(jīng)網(wǎng)絡(luò)著色器接著我們?cè)偌?xì)說一下這一代架構(gòu)最大變化,NVIDIA這次將Blackwell架構(gòu)的SM單元直接稱為神經(jīng)網(wǎng)絡(luò)著色器。相比較于之前的可編程著色、CUDA統(tǒng)一著色、通用計(jì)算著色來說,其最大的變化就是引入了AI,AI將會(huì)徹底改變GPU的著色方式。
在Blackwell架構(gòu)中,NVIDIA 進(jìn)一步拓展了神經(jīng)網(wǎng)絡(luò)渲染的范疇,引入了諸多創(chuàng)新元素,包括神經(jīng)網(wǎng)絡(luò)紋理壓縮(Neural Textures)、神經(jīng)網(wǎng)絡(luò)材質(zhì)(Neural Materials)、神經(jīng)網(wǎng)絡(luò)體積(Neural Volumes)、神經(jīng)網(wǎng)絡(luò)輻射場(chǎng)(Neural Radiance Fields)以及神經(jīng)網(wǎng)絡(luò)輻射緩存(Neural Radiance Cache)等,這些元素共同構(gòu)成了神經(jīng)網(wǎng)絡(luò)渲染中神經(jīng)網(wǎng)絡(luò)著色的重要呈現(xiàn)方式。
這里舉個(gè)例子讓大家能夠更簡(jiǎn)單的理解神經(jīng)網(wǎng)絡(luò)渲染,過去復(fù)雜的物品或大量異材質(zhì)的貼圖往往會(huì)占用相當(dāng)大的內(nèi)存空間,如果疊加光追的話,計(jì)算量將會(huì)更大。然而,得益于神經(jīng)網(wǎng)絡(luò)渲染技術(shù)中的神經(jīng)網(wǎng)絡(luò)材質(zhì)功能,這一問題得到了顯著改善。開發(fā)者可以先在離線渲染出物品的光照數(shù)據(jù),然后再用這些數(shù)據(jù)訓(xùn)練一個(gè)小的AI模型,游戲運(yùn)行時(shí)只要實(shí)時(shí)調(diào)用這個(gè)AI模型當(dāng)場(chǎng)推理就好了,這樣就能還原出想要的光照效果了,再配合神經(jīng)網(wǎng)絡(luò)紋理壓縮技術(shù),就能顯著降低實(shí)際生成的材質(zhì)數(shù)據(jù)量,從而在占用更少顯示內(nèi)存的同時(shí),實(shí)現(xiàn)了細(xì)節(jié)更豐富的材質(zhì)表現(xiàn),達(dá)到了實(shí)時(shí)生成如電影般細(xì)膩素材的效果。
目前神經(jīng)網(wǎng)絡(luò)渲染技術(shù)已經(jīng)得到了微軟的大力支持,未來也將會(huì)加入到DirectX中,玩家能夠體驗(yàn)到更真實(shí)的游戲世界。
而在硬件層面,由于神經(jīng)網(wǎng)絡(luò)渲染的加入,Blackwell架構(gòu)的SM單元相較于RTX 40系的Ada架構(gòu)還是有不小變化的,Ada架構(gòu)內(nèi)的SM內(nèi),SM單元會(huì)拆分成一半的CUDA專門用于處理FP 32(單精度浮點(diǎn)數(shù)),另一半則依需求動(dòng)態(tài)調(diào)整去處理FP32和INT32(32位整數(shù))。而在Blackwell架構(gòu)上,SM單元?jiǎng)t改成了CUDA核心可以完全依需求動(dòng)態(tài)處理FP32和INT32的形式。
另外一個(gè)改進(jìn)是,過往的著色工作往往只有SM單元的Shader在處理,而Blackwell架構(gòu)上引入了神經(jīng)網(wǎng)絡(luò)渲染以后,使得Blackwell架構(gòu)上的第五代Tensor核心也能共同分擔(dān)著色工作,大大提高了著色效率。
這樣改進(jìn)的好處是,Blackwell架構(gòu)能夠進(jìn)一步針對(duì)神經(jīng)網(wǎng)絡(luò)渲染工作進(jìn)行排序,即把傳統(tǒng)的著色工作分配給Shader,而需要?jiǎng)佑蒙窠?jīng)網(wǎng)絡(luò)渲染的工作負(fù)載則可以給到Tensor核心上,兩種核心同時(shí)運(yùn)用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可編程渲染管線,現(xiàn)在開發(fā)者或API也能更好的調(diào)用Tensor核心,未來游戲內(nèi)我們能見到的AI技術(shù)勢(shì)必越來越多。
先進(jìn)的AI管理處理器此外,AI的應(yīng)用也越來越多,不僅游戲中應(yīng)用AI技術(shù),現(xiàn)在連可編程渲染的過程里也引入了AI,因此如何去分配顯卡內(nèi)部多樣化工作就成了一個(gè)問題。如過往顯卡在開啟DLSS玩游戲時(shí),其中應(yīng)用到的語言模型和游戲引擎需要同時(shí)與GPU的不同核心交互,生成游戲幀,但是往往很難做到每一幀都有一致的生成時(shí)間,亦或者是游戲AI對(duì)話的響應(yīng)不夠及時(shí),這些情況都會(huì)造成游戲體驗(yàn)不友好。
而Blackwell架構(gòu)為了解決這一問題,引入了AI管理處理器(AMP)。它能夠?qū)崟r(shí)調(diào)度資源,確保在神經(jīng)網(wǎng)絡(luò)渲染、幀生成和 AI 驅(qū)動(dòng)的游戲交互中實(shí)現(xiàn)智能化的任務(wù)分配。這種設(shè)計(jì)不僅帶來了更高效的性能輸出,還讓顯卡在游戲渲染和 AI 運(yùn)算之間實(shí)現(xiàn)了絕佳的平衡,確保幀的間隔均勻,對(duì)話類型的AI能夠及時(shí)響應(yīng),玩家的游戲體驗(yàn)一致性能夠比較好的保障。
GeForce RTX 5050 8GB規(guī)格說了這么多,接下來給大家介紹一下GeForce RTX 5050 8GB的硬件規(guī)格,不同于兩張60級(jí)別的顯卡,它的核心采用了新的GB207芯片,核心代號(hào)為GB207-300-A1。在架構(gòu)上擁有2個(gè)GPC,GeForce RTX 5050 8GB上總共集成了10個(gè)TPC,20個(gè)SM單元,80個(gè)TMUs紋理單元,32個(gè)ROPs光柵化處理單元以及2560個(gè)CUDA核心。
在工藝制程方面,新的GB207芯片沿用了TSMC 4nm 4N NVIDIA Custom
Process工藝。內(nèi)部晶體管數(shù)量為169億,晶體管數(shù)量對(duì)比RTX 3050的話,整整提升了28%。基礎(chǔ)頻率與Boost頻率也大幅上升,由RTX 3050的1552MHz與1770MHz提升至現(xiàn)在的2317MHz以及2572MHz,甚至比RTX 4060還要高一些。除此之外,PCIe總線也更新為PCIe 5.0×8標(biāo)準(zhǔn),能夠帶來更高的傳輸速率。
最后一點(diǎn)區(qū)別就是售價(jià)了,全新上市的GeForce RTX 5050 8GB MSRP版本官方建議零售價(jià)為2099元,對(duì)比之前的GeForce RTX 3050 8GB稍微提升了200元,對(duì)比同代的RTX 5060則是便宜了400元。這個(gè)定價(jià)對(duì)于預(yù)算有限,但又想體驗(yàn)最新DLSS 4的玩家來說還是相當(dāng)給力的。
顯卡外觀賞析
接著我們來個(gè)開箱,首先是耕升GeForce RTX 5050追風(fēng)OC 8GB的外包裝,黑色主色調(diào)搭配醒目的紫色圖案,整體視覺效果更加年輕化。
包裝右下角很醒目標(biāo)注了型號(hào)"GEFORCE RTX 5050"。
包裝左下角則標(biāo)注了這款顯卡的顯存容量,為8GB GDDR6。
包裝右上角還有"三年質(zhì)保"以及"個(gè)人送保"的標(biāo)識(shí),玩家可以放心購買。
包裝的背面就比較常規(guī)了,主要是一些顯卡的賣點(diǎn)介紹以及RTX 50系顯卡的參數(shù),旨在讓玩家更全面的了解自己手上的這款利器。
終于見到了耕升GeForce RTX 5050追風(fēng)OC 8GB的本體。這款顯卡的三圍是236×128.5×42mm,大約是兩槽的厚度,這個(gè)尺寸能夠輕松適配mini-ITX和micro-ATX機(jī)箱,非常適合追求空間效率與一定性能的玩家。
設(shè)計(jì)語言上,耕升GeForce RTX 5050追風(fēng)OC 8GB延續(xù)了耕升風(fēng)系列經(jīng)典的外觀造型設(shè)計(jì),整體以黑色為基底,搭配醒目的紅色點(diǎn)綴,形成強(qiáng)烈的視覺對(duì)比,四四方方的造型盡顯硬朗風(fēng)格,妥妥的電競(jìng)黑武士。
正面搶眼的還有兩把散熱風(fēng)扇,耕升GeForce RTX 5050追風(fēng)OC 8GB采用第三代炫風(fēng)之刃風(fēng)扇設(shè)計(jì),在風(fēng)扇方面加大了尺寸,兩把風(fēng)扇大小為92mm,每把風(fēng)扇配備7 組環(huán)形扇葉,每組扇葉精心設(shè)計(jì)導(dǎo)流線,提升高負(fù)載時(shí)的風(fēng)壓與進(jìn)風(fēng)量,獲得最好的散熱效能。
顯卡的背板上印有耕升的英文Logo和幾何圖案,為單調(diào)的背板增添了一絲點(diǎn)綴。背板一側(cè)則是鏤空散熱設(shè)計(jì),能夠增加空氣的流通路徑,進(jìn)一步提升了散熱效能,確保顯卡在長(zhǎng)時(shí)間高負(fù)載運(yùn)行時(shí)也能保持冷靜,穩(wěn)定發(fā)揮性能。
顯卡頂部可以看到密密麻麻的散熱鰭片,這里是顯卡的出風(fēng)區(qū)域。耕升在這里印上了品牌LOGO,能夠進(jìn)一步提升辨識(shí)度。
供電接口位于顯卡頂部的中央位置,耕升GeForce RTX 5050追風(fēng)OC 8GB采用的是單8Pin供電,老設(shè)備的玩家也能無損升級(jí)!
視線繼續(xù)往上則可以看到NVIDIA顯卡的另一經(jīng)典標(biāo)識(shí)"GEFORCE RTX"。
底部則是顯卡的金手指,支持PCIe 5.0×8標(biāo)準(zhǔn),總帶寬為64GB/s。
顯示接口方面,耕升GeForce RTX 5050追風(fēng)OC 8GB同樣采用目前RTX50系標(biāo)配的3個(gè)DP2.1b接口與1個(gè)HDMI2.1b接口,接口速率最大可滿足原生4K240Hz視頻信號(hào)傳輸與顯示需求。
顯卡拆解介紹拆解環(huán)節(jié),這里需要注意,拆解這款顯卡需要從背部開始,另外顯卡背板與PCB利用了單獨(dú)的螺絲進(jìn)行固定,因此需要先擰下這些螺絲,才能順利分離背板和PCB。
卸下PCB以后,不難看出耕升GeForce RTX 5050追風(fēng)OC 8GB的PCB為自研的非公版設(shè)計(jì),并且面積非常小,另外耕升也對(duì)其中的電路進(jìn)行了優(yōu)化。
PCB的背面則比較干凈了,不同于正面密密麻麻的元器件,背面僅有2顆控制芯片。
PCB中間的就是這款顯卡的GB207-300-A1芯片,由TSMC 4N工藝打造,擁有2560組CUDA核心,規(guī)格上與RTX 3050一致,不過應(yīng)用了最新的Blackwell架構(gòu),整體性能表現(xiàn)也更加出色。
核心的四周是4顆GDDR6顯存,由三星提供,顯存型號(hào)為K4ZAF325BC-SC20,速率為20Gbps。
下面我們講講這款顯卡的供電設(shè)計(jì),從PCB上可以看出它是4+2相供電,對(duì)于這款TGP僅有130W的顯卡來說,完全足夠了。
其中PCB左側(cè)的4相供電為核心供電,每相供電均配上了固態(tài)電容、全封閉電感,以及DrMos芯片。其中DrMos芯片為SIC 653A,最大持續(xù)輸出電流達(dá)50A,確保核心供電穩(wěn)定高效。
PCB右側(cè)的兩相則是顯存供電,DrMos則是來自力智的QA3111。
下面讓我們來關(guān)注一下耕升GeForce RTX 5050追風(fēng)OC 8GB的散熱裝置,正中央是超大面積的鍍鎳銅底,上面則是厚厚的硅脂,能夠緊密貼合GPU核心,確保熱量能夠迅速傳遞至熱管。
整個(gè)散熱器為兩段式設(shè)計(jì),兩側(cè)均為大面積的鰭片模塊設(shè)計(jì),搭配鏤空金屬背板能夠允許熱空氣排出,增強(qiáng)了氣流,防止PCB熱量積聚。
鰭片之下則是2根6毫米鍍鎳熱管,采用回流焊接技術(shù)優(yōu)化熱傳導(dǎo)。并且它還與銅底直觸,能夠更快的將熱量傳導(dǎo)出顯卡。
主動(dòng)散熱部分為正面的兩把92mm風(fēng)扇,其能夠在提供強(qiáng)勁的氣流同時(shí)保持低噪音。風(fēng)扇還采用優(yōu)化的葉片設(shè)計(jì),最大化空氣壓力,確保熱量有效散布于顯卡的散熱片上。
測(cè)試平臺(tái)介紹關(guān)于測(cè)試平臺(tái)則還是原來RTX 50系顯卡首發(fā)時(shí)的配置, CPU使用的是目前毫無爭(zhēng)議的游戲神U——AMD Ryzen R7-9800X3D,主板則是來自微星的MPG X870E CARBON WIFI 暗黑主板。內(nèi)存為G.Skill的幻鋒戟Z5 RGB DDR5,在這塊主板上能輕松達(dá)成DDR5-8000 C38的成績(jī),并且我們這次選用的是24G×2的套條,確保這張顯卡能夠釋放全部性能。
完整配置如下所示:
理論性能測(cè)試測(cè)試開始前,我們先用GPU-Z看看這款顯卡的基本信息,耕升GeForce RTX 5050 追風(fēng)OC 8GB的基準(zhǔn)頻率為2317 MHz,Boost頻率為2632 MHz,畢竟是帶著OC后綴的型號(hào),其Boost頻率對(duì)比MSRP版本的RTX 5050要高一些,由2572 MHz提升到了2632 MHz,這也意味著其性能釋放更強(qiáng)勁一些。
理論性能測(cè)試方面我們則是以3DMark為基準(zhǔn),實(shí)測(cè)在Fire Strike系列測(cè)試中,耕升GeForce RTX 5050 追風(fēng)OC 8GB表現(xiàn)非常亮眼,其中1080P分辨率下不僅大幅領(lǐng)先前作RTX 3050,對(duì)比RTX 4060也有2%左右的領(lǐng)先;2K下則可以領(lǐng)先RTX 3050約76%;4K則差距最大,對(duì)比RTX 4060有9%的提升。而在以DX12為代表的Time Spy測(cè)試中,新顯卡同樣逆天,對(duì)比RTX 3050,領(lǐng)先幅度超過63%,不過對(duì)比RTX 4060則稍遜色一些,畢竟單論核心規(guī)格,二者還差了20%左右。
但是沒關(guān)系,得益于Blackwell架構(gòu)的加持,以及第五代Tensor Core與第四代RT Core的應(yīng)用,新顯卡的光追項(xiàng)目也有史詩級(jí)的提升,耕升GeForce RTX 5050 追風(fēng)OC 8GB得分6255,這個(gè)成績(jī)與RTX 4060差不多,領(lǐng)先約5%左右,至于對(duì)比RTX 3050,提升幅度甚至可以用代際來形容,74%的領(lǐng)先接近翻倍,非常夸張。
DLSS 4性能測(cè)試
看完了理論性能部分的測(cè)試,我們接下來將聚焦于本次RTX 50系列顯卡最令人振奮、也最具"顛覆性"的升級(jí)——DLSS 4技術(shù)。RTX 40系顯卡上引入了DLSS 3幀生成技術(shù),其能夠依靠AI在兩幀之間生成一幀AI幀,從而實(shí)現(xiàn)幀數(shù)的翻倍,用過的玩家都說好!不過由于每生成一個(gè)新的幀都需要光流加速器和 AI 模型參與,因此生成多幀的開銷相當(dāng)高昂,而過高的性能開銷會(huì)帶來瓶頸,導(dǎo)致幀率提升受限。
而這次DLSS 4全新升級(jí),引入了多幀生成技術(shù),它可以利用 AI 為每個(gè)渲染幀額外生成多達(dá)3幀!相比傳統(tǒng)渲染的方式,能夠最多實(shí)現(xiàn)8倍的性能提升。無論是對(duì)性能、顯存的開銷還是延遲都比之前要好了許多。
另外,由于多幀生成技術(shù),輸出的幀多了,要給每一幀都安排一個(gè)合理的間隔刷新才能讓觀感更好。因此NVIDIA還引入了專屬的Flip Metering來代替CPU Pacing,它將幀節(jié)奏邏輯轉(zhuǎn)移到顯示引擎,讓GPU能夠更精確地管理顯示時(shí)間,盡可能的將每一幀畫面的生成時(shí)間保持一致,從而提高整體游戲視覺的流暢感。不過由于Flip Metering是硬件級(jí)的控制器,因此DLSS 4的多幀生成目前只有RTX 50系顯卡支持。
同時(shí)DLSS 4 還引入了圖形行業(yè)首個(gè) Transformer 模型實(shí)時(shí)應(yīng)用。熟悉AI的應(yīng)該對(duì)它很熟系了,它在AI生成領(lǐng)域已經(jīng)應(yīng)用多年了。基于Transformer架構(gòu)的 DLSS 超分辨率和光線重建模型,相比之前DLSS使用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型來說,具備2倍的參數(shù)量和4倍的計(jì)算量。在游戲場(chǎng)景中,能夠提供更高的穩(wěn)定性、更少的拖影、更高的細(xì)節(jié)和更強(qiáng)的抗鋸齒能力,使畫面更加清晰、流暢和逼真。
不過雖然DLSS 4的多幀生成功能是RTX 50系顯卡的獨(dú)占功能,但新的Transformer模型將會(huì)逐步下放至DLSS 3、DLSS 2等,將適用于所有GeForce RTX顯卡。并且根據(jù)NVIDIA的說法,超過75款游戲和應(yīng)用將在GeForce RTX 50系列開售時(shí)支持DLSS 4的全新DLSS多幀生成功能,包括《賽博朋克2077》《戰(zhàn)神:諸神黃昏》《心靈殺手2》《霍格沃茲之遺》等。隨著時(shí)間的推移,支持DLSS 4的游戲和應(yīng)用數(shù)量將不斷增加。
光說DLSS 4有多強(qiáng)你可能沒有實(shí)感,還是用經(jīng)典的3DMark測(cè)試一下才行。別看耕升GeForce RTX 5050 追風(fēng)OC 8GB只是一張入門級(jí)顯卡,但在搭配上DLSS 4后,幀數(shù)就跟打了雞血一樣,開關(guān)前后的性能簡(jiǎn)直天壤之別!開完DLSS 4以后完全不像一張入門級(jí)顯卡的表現(xiàn),甚至可以比肩主流級(jí)顯卡。其中2K分辨率下,開關(guān)前后性能差距足足有4倍之多,4K分辨率時(shí)幀數(shù)差距直接就是6倍,換作以前,誰敢相信入門級(jí)顯卡也能暢享2K游戲。
接著我們看看DLSS 4在實(shí)際游戲中的表現(xiàn),率先登場(chǎng)的就是有著"顯卡殺手"之稱的《賽博朋克2077》,它的設(shè)置頁面是目前支持DLSS 4游戲中最為豐富一款,除了能夠設(shè)置DLSS 4的多幀生成外,還可以切換DLSS 4的另一個(gè)特性——Transfomer Mode,據(jù)說能夠讓畫質(zhì)更清晰,同時(shí)還能改善此前的拖影問題,對(duì)玩家可以說是一大利好。
我們直接來一波對(duì)比,左側(cè)為Transformer模型,右側(cè)則是原本的CNN模型。從第一個(gè)場(chǎng)景來看,Transformer模型能夠帶來更多的細(xì)節(jié)。例如左側(cè)圖片中的欄桿倒影,這部分表現(xiàn)是比較清晰的,而CNN模型中則幾乎不可見。
第二個(gè)場(chǎng)景也是能夠一眼看出區(qū)別的,例如金屬門的紋理細(xì)節(jié)以及磚墻的接縫處,明顯是Transformer模型的優(yōu)化要更好一些。
這個(gè)場(chǎng)景的區(qū)別主要在于地板細(xì)節(jié)刻畫以及右側(cè)鐵欄桿部分,采用Transformer模型的情況下,地板細(xì)節(jié)更接近真實(shí)世界,并且鐵欄桿的細(xì)節(jié)也能更好的還原。而CNN模型則會(huì)丟失比較多的細(xì)節(jié),雖然不影響觀感,但總有種"失真感"。
不過Transformer模型目前也并非萬能,畢竟是由AI生成而來,因此在部分細(xì)節(jié)上還是有些錯(cuò)誤的。例如下方的窗口部分,陽光照射下應(yīng)該是斑駁的光影,比較正確顯示的應(yīng)該是CNN模型中的樣式。整體來看,現(xiàn)在Transformer模型瑕不掩瑜,大幅改善的畫面細(xì)節(jié)能夠給玩家?guī)砀碌挠螒蛘宫F(xiàn)。
見識(shí)完Transformer模型的魅力以后,我們?cè)賮砜碊LSS 4的性能表現(xiàn),畢竟,對(duì)于像《賽博朋克2077》這樣的"顯卡殺手"級(jí)游戲來說,即使是頂級(jí)顯卡也面臨著不小的壓力。在1080P分辨率,最高畫質(zhì)+路徑追蹤的情況下,耕升GeForce RTX 5050 追風(fēng)OC 8GB只能跑15 FPS,幾乎不可游玩。開啟DLSS 3以后,游戲幀數(shù)勉強(qiáng)來到了63 FPS,已經(jīng)能玩了。但是在開啟DLSS 4以后,耕升GeForce RTX 5050 追風(fēng)OC 8GB已經(jīng)可以暢玩了,游戲幀數(shù)能夠做到111 FPS,對(duì)比原生分辨率,性能足足提升了7.4倍。
DLSS 4帶來的性能提升是有目共睹的,不過也有玩家擔(dān)心DLSS 4的畫質(zhì)表現(xiàn)如何,這里我們也在游戲中截取了部分畫面,第一個(gè)場(chǎng)景其實(shí)差距不大,肉眼很難分辨出區(qū)別。
第二與第三個(gè)場(chǎng)景還是能夠看出部分細(xì)節(jié)的,例如第二幅圖中的霓虹燈牌,DLSS開至性能檔以后,能夠看到燈牌與前面三張圖有些許差異,不過你得靠細(xì)致的對(duì)比才能看出。實(shí)際游戲過程中很難發(fā)現(xiàn),基本不影響觀感。
總的來說,DLSS對(duì)畫質(zhì)的影響沒有玩家想象中那么大,甚至于在紋理細(xì)節(jié)上能夠不輸或超越原生分辨率。如果你是敏感型玩家,那建議可以開至平衡檔,在畫面質(zhì)量和幀率之間能夠做到很好的平衡。如果你是追求超高幀率,那性能檔也絕對(duì)可用,細(xì)節(jié)保留也不錯(cuò),不對(duì)比基本看不出,同時(shí)幀率還能進(jìn)一步提高。它徹底顛覆了我們對(duì)入門級(jí)顯卡性能的認(rèn)知,DLSS 4的強(qiáng)大優(yōu)化能力,使得主流玩家也能在極致畫質(zhì)下,流暢體驗(yàn)最具挑戰(zhàn)性的游戲大作,這無疑是游戲技術(shù)發(fā)展的一大里程碑。
我們測(cè)試的第二款DLSS 4游戲是《霍格沃茲之遺》,支持DLSS 4技術(shù)以后可以在設(shè)置看到幀生成部分多了一些選擇,其中×2則是原本DLSS 3的幀生成,而×4則是RTX 50系獨(dú)有的多幀生成功能,另外你也可以選擇插2幀的方式,也就是所謂的×3選項(xiàng)。
有一說一《霍格沃茲之遺》這款游戲的優(yōu)化比2077不要好太多,1080P分辨率畫質(zhì)光追均設(shè)置最高的情況下,耕升GeForce RTX 5050 追風(fēng)OC 8GB在不開任何超分技術(shù)的情況下,平均幀為49 FPS,已經(jīng)達(dá)到能玩的水平了。不過當(dāng)你開啟DLSS 3質(zhì)量檔,此時(shí)幀數(shù)已經(jīng)能夠做到108 FPS了,滿足高刷完全沒有問題,體驗(yàn)相當(dāng)絲滑。開啟DLSS 4以后,幀數(shù)則進(jìn)一步提升至169 FPS,對(duì)比原生1080P的表現(xiàn),性能提升了約3.5倍左右。
第三款游戲我們測(cè)試的是《星球大戰(zhàn)》,一樣你能在設(shè)置中看到其幀生成功能已經(jīng)支持4X的選項(xiàng),也就是DLSS 4多幀生成功能。這款游戲的優(yōu)化更是出色,一會(huì)兒的實(shí)際性能絕對(duì)能夠嚇你一跳!
實(shí)測(cè)在1080P原生分辨率下,將畫質(zhì)、光追均設(shè)定為Ultra,此時(shí)耕升GeForce RTX 5050 追風(fēng)OC 8GB的平均幀僅有71 FPS,流暢游玩絕對(duì)是沒有問題了。而開啟DLSS 3質(zhì)量檔以后,游戲平均幀則有152 FPS,游戲體驗(yàn)已經(jīng)能夠?qū)崿F(xiàn)高刷了,在數(shù)據(jù)層面,對(duì)比原生1080P的表現(xiàn),完全是翻倍的提升。如果你開啟DLSS 4質(zhì)量檔,平均幀更加逆天,247 FPS已經(jīng)是超高刷的水準(zhǔn)了,換作以前,你敢相信這是入門級(jí)顯卡在最高畫質(zhì)最高光追下能跑出來的成績(jī)嗎?
接下來我們?cè)贉y(cè)一下第一款國(guó)產(chǎn)3A大作、去年的熱門單機(jī)游戲《黑神話:悟空》,去年發(fā)售時(shí),這款游戲也是率先支持了DLSS 3幀生成功能,如今它還支持了RTX 50系顯卡的DLSS 4多幀生成,游玩體驗(yàn)將會(huì)更加順暢,開啟方式也很簡(jiǎn)單,在游戲菜單設(shè)置中即可找到4X的選項(xiàng)。
我們?cè)?080P下將畫質(zhì)調(diào)整至影視級(jí),全景光追也拉到最高,此時(shí)耕升GeForce RTX 5050 追風(fēng)OC 8GB在不借助任何超分技術(shù)的條件下,游戲幀數(shù)僅有13 FPS。而有DLSS 3的幫助后,游戲幀數(shù)也只是勉強(qiáng)能夠去到39 FPS,當(dāng)然,如果你降低一些畫質(zhì),其實(shí)DLSS 3也能夠暢玩,不過這時(shí)如果你有RTX 50系顯卡,開啟DLSS 4多幀生成以后,就完全不需要擔(dān)心,全高畫質(zhì)隨便開,此時(shí)游戲幀數(shù)也能穩(wěn)定在72 FPS,對(duì)比原生分辨率提升了5倍以上,非常夸張。
網(wǎng)游方面我們測(cè)的是《漫威爭(zhēng)鋒》,這款游戲在RTX 50系顯卡首發(fā)之時(shí),它還沒有完全適配DLSS 4,玩家想要體驗(yàn)多幀生成功能還需要依靠
NVIDIA App的DLSS 4優(yōu)設(shè)功能。不過現(xiàn)在《漫威爭(zhēng)鋒》也正式支持DLSS 4了,與上面的游戲一樣,玩家在游戲設(shè)置中就能直接開啟,并且提供了2x、3x以及4x選項(xiàng),玩家可以隨意選擇是插一幀、插兩幀還是插三幀。
實(shí)測(cè)耕升GeForce RTX 5050 追風(fēng)OC 8GB在1080P全高設(shè)置下,不開超分,幀數(shù)為69 FPS,游玩肯定是沒有問題了。不過FPS游戲肯定追求更高的幀數(shù),開啟DLSS 3后幀數(shù)可以達(dá)到141 FPS,相比原生分辨率已經(jīng)提升了一倍以上,如果再開啟DLSS 4多幀生成,性能對(duì)比原生分辨率直接提升3.7倍,256 FPS的表現(xiàn)妥妥的高刷電競(jìng)。同時(shí)延遲以及1%Low表現(xiàn)也非常出色,反應(yīng)在游戲中會(huì)更加跟手,體感更佳。
最后一款游戲我們測(cè)的是最近剛支持DLSS 4的《毀滅戰(zhàn)士:黑暗時(shí)代》,實(shí)測(cè)耕升GeForce RTX 5050 追風(fēng)OC 8GB在1080P分辨率、超級(jí)噩夢(mèng)畫質(zhì)下,表現(xiàn)還是非常不錯(cuò)的,即便不開啟超分,也能以62 FPS流暢游戲;開啟DLSS 3質(zhì)量檔后,游戲幀數(shù)基本能夠達(dá)到高刷需求了,為115 FPS,接著開啟DLSS 4質(zhì)量檔后,游戲幀數(shù)則可以輕松實(shí)現(xiàn)188 FPS,稍微降低一些畫質(zhì),沖上200 FPS完全沒有問題!
當(dāng)然,如果你想玩的游戲還不支持DLSS 4,那也不用擔(dān)心,NVIDIA App還提供DLSS 4優(yōu)設(shè)功能,說人話就是能夠讓游戲強(qiáng)開DLSS 4,像此前的《漫威爭(zhēng)鋒》,在未更新前,玩家可以直接在NVIDIA App中簡(jiǎn)單設(shè)置,就能將幀生成調(diào)至"4×",一鍵實(shí)現(xiàn)多幀生成。目前也有不少游戲支持DLSS 4優(yōu)設(shè)功能,感興趣的玩家可以前往體驗(yàn)。
在體驗(yàn)了一系列支持 DLSS 4 技術(shù)的 3A 大作后,不得不說DLSS 4 多幀生成技術(shù)還是厲害,它確實(shí)使更多玩家能在更高分辨率下享受到了流暢的游戲過程。以實(shí)際測(cè)試的這幾款游戲?yàn)槔郧暗?RTX 3050 顯卡在 1080P 分辨率下開啟 DLSS 2 時(shí),仍有不少游戲難以暢玩,玩家往往要在畫質(zhì)和幀數(shù)之間做出權(quán)衡;而 RTX 4060 雖然有 DLSS 3 加持,但面對(duì)像《黑神話:悟空》這種頂級(jí) 3A 游戲仍稍顯吃力。再看新推出的耕升 GeForce RTX 5050 追風(fēng) OC 8GB 顯卡,雖是入門級(jí)顯卡,但憑借 DLSS 4 黑科技,1080P 最高畫質(zhì)暢玩毫無壓力,甚至有望挑戰(zhàn) 2K 分辨率。
另外,值得一提的是,與DLSS 4一起到來的還有全新的NVIDIA Reflex 2技術(shù)。延遲一直是電競(jìng)中繞不開的話題,玩家的每個(gè)動(dòng)作都會(huì)經(jīng)過復(fù)雜的計(jì)算,再在屏幕上渲染,這其中的每一步都會(huì)增加延遲。雖然延遲往往只有幾十毫秒,但是你卻能明顯的感覺到游戲的不流暢、卡頓。
為了盡可能的降低延遲所帶來的不良游戲體驗(yàn),NVIDIA發(fā)布了NVIDIA Reflex技術(shù),它可以使GPU和CPU同步,確保最佳響應(yīng)速度和低系統(tǒng)延遲。目前NVIDIA Reflex已集成到超過100款游戲中,可以將PC延遲降低50%。
而GeForce RTX 50系顯卡再度升級(jí),帶來了NVIDIA Reflex 2技術(shù)。它結(jié)合了Reflex低延遲模式與
Frame Warp技術(shù)。它可以把最新的鼠標(biāo)輸入指令同步給渲染幀,及時(shí)更新渲染的游戲幀并在渲染幀被發(fā)送到顯示器之前獲取最新的鼠標(biāo)信息,通過刷新渲染的游戲幀以進(jìn)一步減少延遲,將PC延遲進(jìn)一步降低多達(dá)75%。
另外,F(xiàn)rame Warp的加入,能夠進(jìn)一步將延遲降低。當(dāng)一個(gè)幀被GPU渲染時(shí),CPU會(huì)根據(jù)最新鼠標(biāo)或手柄輸入計(jì)算工作流中下一幀的視角位置。Frame Warp從CPU采樣新的視角位置,然后將GPU剛才渲染的幀扭轉(zhuǎn)到最新的視角位置。在渲染幀被發(fā)送到顯示器之前,在盡可能最新的時(shí)間進(jìn)行扭轉(zhuǎn)操作,確保屏幕上反映最新鼠標(biāo)輸入。
而當(dāng)Frame Warp轉(zhuǎn)移游戲像素時(shí),圖像中可能會(huì)產(chǎn)生縫隙撕裂、鏡頭位置的變化會(huì)讓游戲場(chǎng)景中顯示新的部分。NVIDIA則開發(fā)了一種優(yōu)化了延遲的預(yù)測(cè)渲染算法,該算法使用來自先前幀的視角、顏色和深度數(shù)據(jù),對(duì)這些撕裂空白的像素進(jìn)行準(zhǔn)確的圖像修復(fù)。玩家可以通過更新的視角看到?jīng)]有撕裂的渲染幀,并降低了改變游戲內(nèi)視角位置而產(chǎn)生的延遲。說人話就是現(xiàn)在NVIDIA Reflex 2還可以根據(jù)上一幀的信息去腦補(bǔ)一些空白的像素,有種無中生有但你又看不出來的感覺。
游戲性能測(cè)試
下面我們要測(cè)試的是常規(guī)的游戲以及支持DLSS 3的游戲性能。還是老樣子,先看看DLSS 3的理論性能如何。實(shí)測(cè)在3DMark的測(cè)試?yán)铮鼼eForce RTX 5050 追風(fēng) OC 8GB在2K分辨率下,對(duì)比RTX 4060,二者性能幾乎不相上下,差距在4%以內(nèi);4K分辨率下,開啟DLSS 3以后,對(duì)比RTX 4060,兩張顯卡的差距就更小了,只有1%,甚至可以忽略不計(jì)。
實(shí)際游戲表現(xiàn)又如何呢?這里我們選取了10款游戲進(jìn)行測(cè)試,包含光追及光柵性能方面的測(cè)試,而游戲畫質(zhì)方面均全部選擇最高畫質(zhì),光追設(shè)定部分,如有則采用最高。至于超分方面,RTX 3050只能開啟DLSS 2,而剩余顯卡我們則是用DLSS 3進(jìn)行測(cè)試。
經(jīng)過實(shí)測(cè),在 1080P 分辨率下,耕升 GeForce RTX 5050 追風(fēng) OC 8GB 顯現(xiàn)出強(qiáng)勁實(shí)力,運(yùn)行大多數(shù)游戲都十分輕松,并且這一成果是在開啟 DLSS 3 的情況下達(dá)成的。從目前的幀數(shù)表現(xiàn)來看,若是搭配 DLSS 4 多幀生成技術(shù),它完全有能力在 2K 分辨率下流暢運(yùn)行眾多 3A 大作。此外,從實(shí)測(cè)數(shù)據(jù)綜合分析,耕升 GeForce RTX 5050 追風(fēng) OC 8GB 在整體性能上與 RTX 4060 基本持平,二者在多款游戲中的表現(xiàn)各有千秋。而與 RTX 3050 相比,則呈現(xiàn)出碾壓式的優(yōu)勢(shì),在不少游戲中性能領(lǐng)先達(dá) 2 倍以上。
圖像視頻創(chuàng)作性能測(cè)試
游戲性能的表現(xiàn)應(yīng)該給大家?guī)砹瞬恍〉恼鸷场O旅婢褪菍I(yè)創(chuàng)作領(lǐng)域的內(nèi)容了。先給大家伙看一下綜合場(chǎng)景的性能表現(xiàn),在PCMark 10 Extended測(cè)試,耕升GeForce RTX 5050追風(fēng)OC 8GB在游戲、數(shù)位內(nèi)容創(chuàng)作方面的表現(xiàn)更佳,基本上要比RTX 4060高14%左右,對(duì)比RTX 3050則最高可以做到92%左右的提升,幾乎是翻倍的性能提升。總分方面,耕升GeForce RTX 5050追風(fēng)OC 8GB則與RTX 4060持平,領(lǐng)先RTX 3050約19%。
再看大伙關(guān)心的圖像編輯與視頻創(chuàng)作表現(xiàn),我們采用UL Procyon進(jìn)行測(cè)試,在圖像編輯上耕升GeForce RTX 5050追風(fēng)OC 8GB已經(jīng)有不小的性能提升,綜合性能對(duì)比另外兩張卡領(lǐng)先約8%左右,而在視頻剪輯方面,耕升GeForce RTX 5050追風(fēng)OC 8GB更是進(jìn)一步擴(kuò)大了優(yōu)勢(shì),對(duì)比RTX 4060以及RTX 3050分別領(lǐng)先19%和30%。
在Adobe以及達(dá)芬奇的Benchmark測(cè)試?yán)铮鼼eForce RTX 5050追風(fēng)OC 8GB延續(xù)了剛剛領(lǐng)先的優(yōu)勢(shì),例如視頻編輯部分,由于這一代RTX 50系顯卡對(duì)編碼器進(jìn)行了升級(jí),不僅編解碼的效率更高,同時(shí)支持的格式也更豐富。在達(dá)芬奇和PR的測(cè)試中,耕升GeForce RTX 5050追風(fēng)OC 8GB領(lǐng)先RTX 4060與RTX 3050 分別20%和30%以上。
3D渲染創(chuàng)作性能測(cè)試簡(jiǎn)單的圖像視頻創(chuàng)作過后,讓我們上點(diǎn)強(qiáng)度,看看壓力更大的3D渲染性能表現(xiàn)。首先關(guān)注到的是Blender以及V-Ray測(cè)試,在這兩項(xiàng)測(cè)試中,耕升GeForce RTX 5050追風(fēng)OC 8GB的表現(xiàn)還可以。雖然CUDA核心數(shù)比RTX 4060少了20%,不過實(shí)際性能表現(xiàn)絲毫不遜色,實(shí)測(cè)性能僅跟RTX 4060差了10%左右。當(dāng)然,如果對(duì)比對(duì)象換成RTX 3050的話,那領(lǐng)先優(yōu)勢(shì)就大了,基本都是翻倍的性能提升,非常可觀。
再看看另外一款渲染器,D5 Render是一款基于DXR和光線追蹤技術(shù)構(gòu)建的GPU渲染器。正因?yàn)槠溆泄饩€追蹤技術(shù),其渲染的畫面相當(dāng)出色。這款軟件在RTX 40系顯卡測(cè)試時(shí)支持了DLSS 3幀生成,而現(xiàn)在隨著RTX 50系顯卡的發(fā)布,它也可以通過NVIDIA App的方式支持最新的DLSS 4多幀生成功能。
實(shí)際測(cè)試中,有了DLSS 4加持的耕升GeForce RTX 5050追風(fēng)OC 8GB與另外兩張顯卡完全不在一個(gè)維度上。例如RTX 3050在開啟DLSS 2以后依舊只有22 FPS,RTX 4060開啟DLSS 3能夠做到72 FPS,而耕升GeForce RTX 5050追風(fēng)OC 8GB在DLSS 4下能夠輕松做到117 FPS,性能是RTX 3050的5倍,RTX 4060的2倍左右。之前卡頓的渲染體驗(yàn),一掃而空,換來的是極致流程的創(chuàng)作感受。
工業(yè)領(lǐng)域我們用的是最新的SPECviewperf 15進(jìn)行測(cè)試,最新版本引入了對(duì)最新圖形 API 的支持,包括 DirectX 12 和 Vulkan,并具有反映新興行業(yè)用例的工作負(fù)載。憑借這些增強(qiáng)功能,SPECviewperf 15 使用戶能夠準(zhǔn)確評(píng)估其首選應(yīng)用程序的最新版本在當(dāng)前一代硬件上的性能表現(xiàn)。實(shí)測(cè)在多項(xiàng)測(cè)試中耕升GeForce RTX 5050追風(fēng)OC 8GB對(duì)比RTX 4060幾乎持平,少部分項(xiàng)目后者有10%以內(nèi)的領(lǐng)先幅度,而對(duì)比RTX 3050則可以說是完勝,部分項(xiàng)目提升幅度超過100%。
NVIDIA編解碼測(cè)試接下來的測(cè)試則是介紹RTX 50系顯卡的編解碼器,GeForce RTX 50系列顯卡上換裝了第9代NVENC編碼器與第6代NVDEC解碼器,在視頻規(guī)格上支持AV1 UHQ(超高畫質(zhì) AV1)與MV-HEVC(多視角HEVC)編解碼。同時(shí)由于GeForce RTX 50系列顯卡還升級(jí)支持DisplayPort 2.1 UHBR20輸出,單一通道支持20Gbps帶寬,因此用戶可以體驗(yàn)到令人驚嘆的HDR視覺效果、超高分辨率和更流暢的游戲體驗(yàn)。
這里我們直接使用NVIDIA提供的4K60片源與工程文件分別測(cè)試AV1、H.265以及H.264下的編碼導(dǎo)出時(shí)間。實(shí)測(cè)同一段素材下,耕升 GeForce RTX 5050 追風(fēng) OC 8GB導(dǎo)出三段視頻的時(shí)間均為15秒,效率比另外兩張顯卡快了80%左右。
同時(shí),我們也對(duì)導(dǎo)出的不同格式的視頻進(jìn)行了畫質(zhì)對(duì)比,實(shí)測(cè)AV1編碼的視頻在畫質(zhì)上與H.265或H.264也沒有明顯差距,無論是在文字、人像還是建筑等畫面里,三者的畫質(zhì)可以說是伯仲之間,如果不特地標(biāo)注其格式,一般人很難用肉眼分辨出來。隨著目前越來越多視頻網(wǎng)站、剪輯軟件和硬件廠商的推動(dòng),未來AV1勢(shì)必會(huì)成為下一個(gè)最受歡迎的格式。
值得一提的是,GeForce RTX 50系顯卡還能夠支持4:2:2色度取樣的視頻編解碼,這將節(jié)省CPU的負(fù)擔(dān),加快創(chuàng)作速度。上面的圖表里也可以看到我們的測(cè)試成績(jī),實(shí)測(cè)導(dǎo)出時(shí)間會(huì)比上代顯卡快不少,畢竟RTX 40系顯卡不支持該功能,僅支持4:2:0色度采樣,如果一定要4:2:2導(dǎo)出只能靠CPU軟解。
4:2:2色度采樣的視頻文件采用的是YUV顏色格式,與存儲(chǔ)紅色、綠色和藍(lán)色(RGB)值不同,顏色被存儲(chǔ)為亮度Y、藍(lán)差色度U和紅差色度V。在這類視頻中,視頻的完整亮度將被保留,而原始色度信息只保留一半,因此相比4:4:4的視頻,其視頻幀數(shù)據(jù)量?jī)H有不到三分之二,而相比4:2:0的視頻又能提供兩倍的顏色分辨率,因此創(chuàng)作者采用這種格式拍攝,能夠在保留更多色彩信息的同時(shí)還能減少文件大小和帶寬需求。
AI性能測(cè)試在深入剖析新一代顯卡的游戲和編解碼能力后,我們把目光聚焦到同樣備受矚目的 AI 性能領(lǐng)域。我們對(duì) RTX 50 系列顯卡展開了全面的 AI 測(cè)試,測(cè)試范圍涵蓋當(dāng)前流行的本地大語言模型部署以及熱門的文生圖應(yīng)用。
先來了解一下 RTX 50 系顯卡在 AI 部分的升級(jí)亮點(diǎn)。其中最具突破性的改進(jìn)是加入了對(duì) FP4 精度模型加速處理的支持。與之前 RTX 40 系列顯卡支持的 FP8 精度相比,F(xiàn)P4 精度能在保證相近計(jì)算精度的基礎(chǔ)上,大幅加快生成速度,同時(shí)顯著減少顯存占用。這使得用戶可以在有限顯存條件下運(yùn)行更大規(guī)模的 AI 模型,或者更快速地生成內(nèi)容,從而極大提升了 AI 應(yīng)用的效率和可玩性。
實(shí)際測(cè)試中,另外兩款顯卡因顯存不足,無法完成測(cè)試任務(wù)。而同為 8GB 顯存的耕升 GeForce RTX 5050 追風(fēng) OC 8GB 憑借對(duì) FP4 精度模型的支持,成功跑完了測(cè)試流程,生成一張圖片僅用時(shí) 33.439 秒,表現(xiàn)相當(dāng)出色。這無疑是入門級(jí)顯卡在本地 AI 應(yīng)用能力上的關(guān)鍵突破,讓眾多玩家有機(jī)會(huì)親身體驗(yàn) AI 技術(shù)帶來的便捷與樂趣。
接下來看看耕升 GeForce RTX 5050 追風(fēng) OC 8GB 在
Stable Diffusion 中 FP16 精度下的表現(xiàn)。依然采用 UL Procyon 進(jìn)行測(cè)試,在相對(duì)輕松的 SD 1.5 文生圖 FP16 精度測(cè)試中,耕升 GeForce RTX 5050 追風(fēng) OC 8GB 生成一張圖片的速度僅需 4.696 秒,比 RTX 4060 的效率高出 10%。當(dāng)切換至 INT8 精度時(shí),該顯卡生成同樣一張圖片的效率依然超過 RTX 4060,且領(lǐng)先幅度達(dá)到 20% 之多。
而在本地大模型部署測(cè)試環(huán)節(jié),我們采用 MLPerf Client v0.5 大語言模型進(jìn)行測(cè)試,該模型基于 Meta 的 Llama 2 7B 開源 LLM 構(gòu)建,包含內(nèi)容生成、創(chuàng)意寫作以及對(duì)兩份不同長(zhǎng)度文本進(jìn)行總結(jié)摘要這四項(xiàng) AI 任務(wù)。實(shí)測(cè)結(jié)果顯示,新顯卡的表現(xiàn)與 RTX 4060 基本相當(dāng),二者性能差距僅在 2% 左右。而與 RTX 3050 相比,耕升 GeForce RTX 5050 追風(fēng) OC 8GB 的性能則領(lǐng)先 35% 左右。
此外,我們還利用 UL Procyon 的 AI Text Generation 功能對(duì)更多大語言模型進(jìn)行了測(cè)試。結(jié)果表明,耕升 GeForce RTX 5050 追風(fēng) OC 8GB 的性能依舊與 RTX 4060 不相上下,而對(duì)比 RTX 3050 則實(shí)現(xiàn)了 20 - 50% 左右的性能提升。
功耗與溫度表現(xiàn)最后一項(xiàng)測(cè)試烤機(jī),這也是許多玩家關(guān)注的重點(diǎn)。得益于耕升GeForce RTX 5050追風(fēng)OC 8GB顯卡出色的散熱配置,整體表現(xiàn)非常出色。在室溫20℃下,F(xiàn)urmark燒機(jī)10分鐘后,整張顯卡的溫度并不高,甚至可以說涼快,核心僅有58.8度,顯存溫度更是低至54度,此時(shí)顯卡的最大功率為130W,已經(jīng)完全頂著TDP的上限了,風(fēng)扇轉(zhuǎn)速則是1500RPM,整體性能釋放強(qiáng)勁,幾乎沒有噪音。
橫向?qū)Ρ萊TX 3050跟RTX 4060兩張顯卡時(shí)可以看到,耕升GeForce RTX 5050追風(fēng)OC 8GB整體的散熱效果極其出色,無論是待機(jī)時(shí)還是滿載時(shí)的溫度都比115W的RTX 4060還要低,屬于是非常驚喜了。對(duì)比前作RTX 3050更是出色,用更低的功耗與更低的溫度實(shí)現(xiàn)了更高的性能釋放!
評(píng)測(cè)總結(jié)總的來說,耕升GeForce RTX 5050追風(fēng)OC的表現(xiàn)還是非常給力的。幾乎給入門級(jí)玩家交上了一份不錯(cuò)的答卷,可以說是專為1080P分辨率的輕度游戲愛好者,或者是辦公、輕度AI用戶群體量身定制。憑借全新NVIDIA Blackwell架構(gòu)和各種黑科技實(shí)現(xiàn)了跨代提升,甚至可以挑戰(zhàn)前代更高級(jí)別的顯卡。
這款顯卡最大的亮點(diǎn)還是性能表現(xiàn)方面,經(jīng)過實(shí)測(cè)耕升GeForce RTX 5050追風(fēng)OC 8GB擁有跟上一代更高級(jí)別顯卡RTX 4060相近的性能,這意味著它在1080P分辨率中能以高幀率游玩絕大部分的網(wǎng)游,并能通過DLSS 4技術(shù)來讓3A光追游戲達(dá)到極其流暢的水平。對(duì)于還在使用RTX 3050、RTX 2060乃至GTX 16系的玩家來說,這張顯卡絕對(duì)是絕佳的升級(jí)選擇,游戲體驗(yàn)?zāi)軌颢@得史詩級(jí)的加強(qiáng)。
當(dāng)然,玩家最關(guān)心的還是它的售價(jià),耕升GeForce RTX 5050追風(fēng)OC 8GB的起售價(jià)為2099元,作為一款定位入門級(jí)的顯卡來說,這個(gè)價(jià)格說實(shí)話并沒有那么"入門",不過考慮到這款顯卡應(yīng)用了Blackwell架構(gòu),還有目前最強(qiáng)的DLSS 4多幀生成,對(duì)比其他入門級(jí)來說,確實(shí)是爆殺般的存在,性能表現(xiàn)絕對(duì)包贏的,這一點(diǎn)完全不用擔(dān)心。如果你預(yù)算有限,但又想升級(jí)顯卡,那這款顯卡還是值得考慮的。