NVIDIA 於日前發(fā)表了傳聞以久的新一代顯示卡產(chǎn)品 GeForce 6800,不但令外界耳目一新,更洗刷了 NVIDIA 長(zhǎng)久以來(lái)在微軟 DirectX 9 世代產(chǎn)品一直居於下風(fēng)的恥辱,並且以超越現(xiàn)有高階產(chǎn)品兩倍以上的高效能,以及具備目前最高影像品質(zhì)與最完備影像處理功能,替下一代的顯示晶片立下了一個(gè)典範(fàn)。
GeForce 6800 是以代號(hào) NV40 的繪圖晶片為核心,NV40 是首顆支援 DirectX 9 Shader Model 3.0,或稱(chēng)為 DirectX 9.0c 規(guī)格的繪圖晶片,晶片內(nèi)部是以 6 組 Vertex Shader(頂點(diǎn)著色器),以及 16 條具備超純量設(shè)計(jì)管線(xiàn)的 Pixel Shader(像素著色器)所構(gòu)成,並整合了 MPEG 1、2、4 以及 Windows Media Video 9 格式動(dòng)態(tài)影像壓縮與解壓縮的輔助處理電路。
GeForce 6800 產(chǎn)品目前分為 Ultra 版與非 Ultra 版兩種:
|
GeForce 6800 Ultra
|
GeForce 6800
|
繪圖晶片
|
NV40
|
NV40
|
頂點(diǎn)著色器
|
6 組
|
6 組
|
像素著色器管線(xiàn)
|
16 條超純量
|
12 條超純量
|
核心時(shí)脈
|
400MHz
|
未確認(rèn),推測(cè) 350MHz
|
記憶體類(lèi)型
|
GDDR3
|
DDR
|
記憶體運(yùn)作時(shí)脈
|
1.1GHz
|
1GHz
|
匯流排寬度
|
256 位元
|
256 位元
|
記憶體容量
|
256MB
|
128MB
|
記憶體頻寬
|
35GBps
|
32GBps
|
電源供應(yīng)需求
|
2 組電源接頭,建議配備 480 瓦以上電源供應(yīng)器
|
1 組電源接頭
|
預(yù)估售價(jià)
|
499 美金
|
299 美金
|
◆ DirectX 9 第二世代產(chǎn)品
自 ATI 推出 R300 顯示晶片產(chǎn)品後,顯示卡產(chǎn)品正式進(jìn)入 DX9 的世代中,而 NVIDIA 在 DX9 產(chǎn)品的推出上,不但晚了對(duì)手一步,而且首次推出的 NV30,因?yàn)樵O(shè)計(jì)與製程的問(wèn)題,使得首代的 GeForce 5800 產(chǎn)品不但耗電量大,散熱系統(tǒng)體積與噪音驚人(NVIDIA 研發(fā)人員亦曾製作搞笑影片來(lái)自我嘲諷),而且效能明顯的不如競(jìng)爭(zhēng)對(duì)手的產(chǎn)品,使得自 TNT 以來(lái)連戰(zhàn)連勝的 NVIDIA 遭逢了第一次的重大挫敗。
其後 NVIDIA 雖然於 NV35 上力求振作,修改了部分設(shè)計(jì),如記憶體匯流排與像素著色器的配置,但是由於其整體設(shè)計(jì)仍然是與 NV30 屬於同一代的架構(gòu),所以一直無(wú)法於效能競(jìng)賽中真正領(lǐng)先。
因此,NVIDIA 在這次所推出的 NV40 產(chǎn)品上,採(cǎi)取了幾乎完全翻新的設(shè)計(jì),其執(zhí)行單元的數(shù)目、配置、功能...等等都與前代的 NV3X 有著非常大的不同,如將 NV3X 視為 NVIDIA DX9 第一世代的產(chǎn)品,則 NV40 即可視為 DX9 第二世代的產(chǎn)品,一般預(yù)料也將會(huì)是 NVIDIA DX9 的末代產(chǎn)品,架構(gòu)上不會(huì)再有大更動(dòng)。
◆ 效能成長(zhǎng)
與前一代產(chǎn)品 GeForce 5950 相比,GeForce 6800 Ultra 的效能成長(zhǎng)了數(shù)倍之多,以各種不同的應(yīng)用程式與遊戲的綜合測(cè)試下,總合表現(xiàn)約比 GeForce 5950 高出一倍。在 NVIDIA 以廣泛用於評(píng)估 3D 繪圖效能的 3DMark 2003 所做的測(cè)試中,特製高時(shí)脈版本的 GeForce 6800 Ultra 更得到了史無(wú)前例的 14860 分,而標(biāo)準(zhǔn)版本的 GeForce 6800 Ultra 則是 12353,兩者皆遠(yuǎn)超越現(xiàn)有的任何產(chǎn)品。
◆ DirectX 9.0 Shader Model 3.0
NV40 首度支援了 DirectX 9 Shader Model 3.0(以下簡(jiǎn)稱(chēng) Shader 3.0),以下就 Shader 2.0 與 3.0 的差異作一列表:
|
Shader 2.0
|
Shader 3.0
|
頂點(diǎn)著色器指令
|
256
|
65535
|
置換式貼圖
|
─
|
ˇ
|
頂點(diǎn)材質(zhì)擷取
|
─
|
ˇ
|
座標(biāo)引用機(jī)制
|
─
|
ˇ
|
動(dòng)態(tài)流程控制
|
─
|
ˇ
|
著色器精確度
|
24 位元浮點(diǎn)數(shù)
|
32 位元浮點(diǎn)數(shù)
|
像素著色器指令
|
96
|
65535
|
子常式
|
─
|
ˇ
|
迴圈與分支
|
─
|
ˇ
|
動(dòng)態(tài)流程控制
|
─
|
ˇ
|
由列表中可以看出,Shader 3.0 主要的進(jìn)步在於著色器程式所能容許的指令數(shù)目大幅的增加,像素著色器也導(dǎo)入了原先只有頂點(diǎn)著色器才支援的迴圈與流程控制,且頂點(diǎn)與像素著色器兩者皆增加了動(dòng)態(tài)流程控制,使得著色器程式碼的撰寫(xiě)自由度大幅提高。在先前的 Shader 2.0 標(biāo)準(zhǔn)中,僅允許靜態(tài)的流程控制。利用動(dòng)態(tài)流程控制,將可以依照實(shí)際情況動(dòng)態(tài)判定使用何種程式碼來(lái)進(jìn)行處理,NVIDIA 於 NV40 虛擬代言人,美人魚(yú) Nalu 的展示中,在 Nalu 身上皮膚與鱗甲交錯(cuò)之處,使用了動(dòng)態(tài)流程控制的分支執(zhí)行功能來(lái)針對(duì)皮膚與鱗甲所需不同處理的需求,動(dòng)態(tài)決定該使用哪一種著色器程式碼來(lái)處理,使得原本需要多步驟繁複處理的過(guò)程可以大幅的簡(jiǎn)化,提昇程式撰寫(xiě)與執(zhí)行的效率。
◆ 頂點(diǎn)著色器
NV40 的頂點(diǎn)著色器相較於 NV3X 家族所具備,較標(biāo)準(zhǔn) Shader 2.0 更為強(qiáng)化的 Shader 2.0a 相比,主要的改進(jìn)在於支援了頂點(diǎn)材質(zhì)貼圖擷取功能,用以支援 Shader 3.0 內(nèi)入標(biāo)準(zhǔn)支援項(xiàng)目的置換式貼圖(Displacement Mapping),置換式貼圖可以使用各種不同的頂點(diǎn)材質(zhì),配合相同的基礎(chǔ) 3D 模型,讓頂點(diǎn)依照頂點(diǎn)材質(zhì)的資料來(lái)作偏移,產(chǎn)生不同外觀(guān)的模型。
而大幅強(qiáng)化的頂點(diǎn)著色器程式碼長(zhǎng)度限制,以及靈活的動(dòng)態(tài)流程控制,使得頂點(diǎn)著色器能更有效率的處理複雜的運(yùn)算。
◆ 像素著色器
原本於 NV3X 世代產(chǎn)品中,其像素著色器皆是以虛擬 8 條管線(xiàn),實(shí)際 4 條管線(xiàn)的配置,一般視為 4 x 2(4 管線(xiàn) x 2 材質(zhì)貼圖單元)或 8 x 0(處理 Z-stencil 像素時(shí)),而這個(gè)設(shè)計(jì)並未能與真正 8 條管線(xiàn)的 ATI 競(jìng)爭(zhēng)產(chǎn)品達(dá)成相同的效益,所以 NVIDIA 在 NV40 的設(shè)計(jì)上,採(cǎi)用了真正 16 條管線(xiàn)並列的設(shè)計(jì),而且不單是如此,每條管線(xiàn)還配置了兩組著色器,數(shù)量為前一代的四倍之多。
NVIDIA 先前並未承認(rèn)過(guò)外界認(rèn)定 NV3X 是 4 x 2、8 x 0 架構(gòu)的說(shuō)法,但這次在 NV40 發(fā)表資料中,首次以此標(biāo)準(zhǔn)來(lái)突顯 NV40 的進(jìn)步,就 NVIDIA 的說(shuō)法,如果 NV3X 是 4 x 2、8 x 0 架構(gòu),那麼 NV40 就是 16 x 1、32 x 0 的架構(gòu),執(zhí)行單元成長(zhǎng)了 2~4 倍之多。
而 NV40 像素著色器所具備的超純量 16 管線(xiàn)設(shè)計(jì),則是以每條管線(xiàn)配置兩個(gè)著色器執(zhí)行單元的方式,達(dá)成兩倍於前一代設(shè)計(jì)的執(zhí)行效能,不過(guò)由於其中一組著色器與材質(zhì)貼圖處理單元是共用的,所以在執(zhí)行材質(zhì)貼圖處理時(shí),仍舊與前代產(chǎn)品相同,每週期可執(zhí)行 1 材質(zhì)貼圖運(yùn)算 + 4 組著色器運(yùn)算,但在執(zhí)行著色器指令時(shí),則較前代產(chǎn)品的每週期 4 組運(yùn)算多出一倍,達(dá)每週期 8 組運(yùn)算??商幚淼闹噶顢?shù)亦由前代的每個(gè)週期每個(gè)像素 2 個(gè)指令提昇至每個(gè)週期每個(gè)像素 4 個(gè)指令,像素元件(R G B A)的群組設(shè)定(例如 RGB + A 或 RG + BA 等配置)上,亦提供較前代更充分的彈性。因此,當(dāng)執(zhí)行指令數(shù)目較多較複雜的著色器程式時(shí),NV40 將能得到顯著的效能提昇。
對(duì)於像素著色器的資料格式來(lái)說(shuō),NV40 則是充分對(duì)應(yīng) Shader 3.0,全面提升為 32 位元浮點(diǎn)數(shù),而且內(nèi)部的處理單元完全對(duì)應(yīng) 32 位元浮點(diǎn)數(shù)格式。由於 NV3X 家族使用 32 位元浮點(diǎn)數(shù)效率僅有 16 位元浮點(diǎn)數(shù)的一半,明顯不如競(jìng)爭(zhēng)對(duì)手 ATI 以 24 位元浮點(diǎn)數(shù)所達(dá)成的品質(zhì)與效能的良好平衡,所以在 NV40 上 NVIDIA 改以完全的 32 位元浮點(diǎn)數(shù)架構(gòu)設(shè)計(jì),能保持一貫的速度運(yùn)作,並得到最佳的品質(zhì)。
◆ 影像處理器引擎
除了 3D 繪圖效能與功能上的進(jìn)步之外,NV40 更針對(duì)了動(dòng)態(tài)影像編解碼的需求,整合了可程式化的影像處理器引擎,以高效能的專(zhuān)屬硬體支援高解析度高畫(huà)質(zhì)的 MPEG 1、2、4 與微軟 Windows Media Video 9 影像格式的壓縮解壓縮處理。在執(zhí)行 MPEG2 編碼時(shí),NV40 所具備的影像處理器引擎可負(fù)擔(dān) 60% 的運(yùn)算量,解碼時(shí)更可負(fù)擔(dān)高達(dá) 95% 的運(yùn)算量,並可以硬體支援如去交錯(cuò)、色域轉(zhuǎn)換、伽碼校正、雜訊消除...等處理,大幅減輕 CPU 的負(fù)擔(dān)。
NV40 的影像處理器引擎並具備完整的視訊輸出入處理功能,支援視訊輸入,高傳真電視(HDTV)解析度高達(dá) 1920 x 1080(i) 的視訊輸出,以及高傳真影像訊號(hào)版權(quán)保護(hù)標(biāo)準(zhǔn) HDCP,充分滿(mǎn)足新一代的高傳真多媒體影音需求。也正因?yàn)?NV40 內(nèi)建完整的影像處理功能,所以在實(shí)作顯示卡產(chǎn)品時(shí)很容易整合必要的外部視訊輸出入轉(zhuǎn)換控制元件,讓顯示卡具備視訊輸出入的功能,由 NVIDIA 提供給各廠(chǎng)商的公版設(shè)計(jì),以及目前眾多廠(chǎng)商所推出的 NV40 頂級(jí)顯示卡產(chǎn)品 GeForce 6800 Ultra 幾乎都具備此功能,即可看出此一趨勢(shì)。
而針對(duì)此一強(qiáng)大的影像處理器引擎,動(dòng)態(tài)影像處理軟體龍頭廠(chǎng)商 Adobe 亦發(fā)表將充分發(fā)揮 NV40 可程式化影像處理引擎所帶來(lái)的新功能,來(lái)加強(qiáng)旗下動(dòng)態(tài)影像處理軟體的功能與效能。
◆ 記憶體匯流排
相較於繪圖晶片核心的大幅進(jìn)步,GeForce 6800 的記憶體匯流排的進(jìn)展顯得不是那麼的突出,GeForce 6800 Ultra 版本採(cǎi)用了時(shí)脈 1.1GHz,匯流排寬度 256 位元的 GDDR3 記憶體,理論頻寬約 35GBps,相較於前代產(chǎn)品的 950MHz 256bits GDDR 來(lái)說(shuō),頻寬約提昇 15%,而由於 GDDR3 採(cǎi)用了較低的運(yùn)作時(shí)脈,所以記憶體的耗電量較前代所採(cǎi)用的 GDDR2下降,有助於顯示卡的散熱處理。
但由於相對(duì)於繪圖晶片核心兩倍以上的效能成長(zhǎng),僅僅 15% 的記憶體頻寬成長(zhǎng)於是成了效能的瓶頸之一,為了解決這個(gè)問(wèn)題,提昇多管線(xiàn)著色器的實(shí)際效能,NV40 首次採(cǎi)用了二階材質(zhì)快?。↙2 Texture Cache)的設(shè)計(jì),讓個(gè)別頂點(diǎn)著色器與像素著色器管線(xiàn)內(nèi)部的一階材質(zhì)快取連結(jié)到統(tǒng)一的二階材質(zhì)快取,以減低著色器管線(xiàn)對(duì)於外部記憶體存取的需求。
但這並未完全解決記憶體頻寬的瓶頸,使得 NV40 理論上應(yīng)該可以達(dá)到單一週期內(nèi)處理 16 個(gè)單材質(zhì)貼圖的像素,但實(shí)際上僅能達(dá)到 12.27 個(gè)像素,相較於 NV35 理論 4 實(shí)際 3.99 來(lái)說(shuō),落差較大,後續(xù)產(chǎn)品如改用更高速的 GDDR3 繪圖記憶體時(shí),將能有效提昇實(shí)際處理效能。
而由於 NV40 使用了完全的浮點(diǎn)數(shù)頂點(diǎn)與像素格式,並支援浮點(diǎn)數(shù)材質(zhì),所以對(duì)於記憶體空間的需求也將較前代產(chǎn)品提昇,目前所發(fā)表的頂級(jí)產(chǎn)品 GeForce 6800 Ultra 配備有 256MB 記憶體,NVIDIA 公布後續(xù)將發(fā)表高達(dá) 512MB 記憶體的產(chǎn)品,以充分發(fā)揮 NV40 的高精準(zhǔn)度浮點(diǎn)數(shù)處理與儲(chǔ)存格式,應(yīng)用於高階遊戲或者是專(zhuān)業(yè) 3D 繪圖製作的輔助上。
◆ 製程與功率
以往 NVIDIA 的顯示晶片都是交由臺(tái)積電代工,但自去年 3 月 NVIDIA 正式與 IBM 簽定合作案之後,部分效能取向產(chǎn)品便由 IBM 代工生產(chǎn),這次 NV40 則是完全以 IBM 所提供的 0.13 微米製程所生產(chǎn),這是否意味著將來(lái) NVIDIA 會(huì)自 TSMC 抽身而大幅轉(zhuǎn)進(jìn) IBM 代工,目前尚不得而知。
與同樣是採(cǎi)用 0.13 微米製程所生產(chǎn)的 NV3X 家族來(lái)說(shuō),這次 NV40 的電晶體數(shù)與晶片尺寸則是史無(wú)前例的巨大,共包含了 2.22 億的電晶體,相對(duì)於 NV35 的 1.3 億來(lái)說(shuō),整整成長(zhǎng)了 70%,而晶片尺寸也由 NV35 的約 200 平方公厘成長(zhǎng)為 300 平方公厘。另一個(gè)引人側(cè)目之處在於由 NV40 所構(gòu)成的 GeForce 6800 Ultra 顯示卡居然配備了“兩”個(gè)外部電源接頭,官方並建議最好配備超過(guò) 480 瓦的電源供應(yīng)器來(lái)供電,可見(jiàn)其功率消耗的可觀(guān)程度。
晶片尺寸與耗電過(guò)大,是 NV40 兩個(gè)最大的隱憂(yōu),因?yàn)檫@會(huì)導(dǎo)致 NV40 產(chǎn)能的低落與成本的高昂。如果以先前 NV3X 家族的規(guī)劃來(lái)看,NV4X 家族陸續(xù)應(yīng)會(huì)推出像素著色器管線(xiàn)減半(8 條)的效能導(dǎo)向產(chǎn)品,以及再減半(4 條)的主流及價(jià)位導(dǎo)向產(chǎn)品,如 NV40 的晶片尺寸過(guò)大,則這些削減管線(xiàn)的中低價(jià)位晶片也將連帶的受到影響,而無(wú)法有效的壓低成本與耗電量,由於實(shí)際上獲利最多的是這兩個(gè)產(chǎn)品線(xiàn),所以 NVIDIA 將必須要面對(duì)採(cǎi)用既有 0.13 製程硬上超多電晶體設(shè)計(jì)的苦果。
一般認(rèn)為唯有儘速轉(zhuǎn)移至 90 奈米製程,才能讓 NV4X 家族達(dá)到成本與效能的平衡,目前 0.13 微米製程對(duì)於超過(guò) 2 億電晶體的設(shè)計(jì),已經(jīng)頗為勉強(qiáng)。不過(guò),雖然目前 NV40 的耗電量驚人,但是在實(shí)際的測(cè)試中,GeForce 6800 Ultra 的溫度並未如耗電量般高,僅微溫而已,而且散熱系統(tǒng)的噪音也不大,並不像當(dāng)初 GeForce 5800 Ultra 被比喻作電熱吹風(fēng)機(jī)那般的高熱與吵雜。
◆ AGP 8X 與 PCI-Express 16X
如同 NV3X 家族一般,NV40 仍舊以 AGP 為原生支援介面,對(duì)於 PCI-Express 的支援則是透過(guò) HSI(High-Speed Interconnect)橋接晶片,以獨(dú)特的 AGP 16X 規(guī)格來(lái)轉(zhuǎn)換至 PCI-Express 16X 的全雙工 4GBps 新一代高速匯流排。目前所發(fā)表的 GeForce 6800 產(chǎn)品皆為 AGP 8X 版本,PCI-Express 16X 版本則預(yù)定於今年下半年推出。
有別於競(jìng)爭(zhēng)對(duì)手 ATI 以設(shè)計(jì)原生支援 PCI-Express 繪圖晶片的方式來(lái)提供 PCI-Express 顯示卡產(chǎn)品,NVIDIA 目前皆?huà)?cǎi)用 HSI 橋接晶片的方式來(lái)提供 PCI-Express 的支援,HSI 方案的優(yōu)點(diǎn)在於不需要變動(dòng)既有繪圖晶片的設(shè)計(jì),但缺點(diǎn)在於橋接方式並無(wú)法完全滿(mǎn)足 PCI-Express 全雙工 4GBps 的傳輸頻寬,以及 HSI 橋接晶片與電路造成生產(chǎn)成本的上升,這對(duì)於獲利空間較小的效能與主流市場(chǎng)產(chǎn)品來(lái)說(shuō),影響不可謂不大。
目前 NVIDIA 預(yù)計(jì)於 NV40 的下一代改良產(chǎn)品上實(shí)作 PCI-Express 的原生支援,預(yù)計(jì)當(dāng)正式支援 PCI-Express 原生模式後,將更能充分發(fā)揮 NV4X 家族的效能優(yōu)勢(shì)與應(yīng)用範(fàn)圍。
◆ 結(jié)論
在 ATI 率先以 R300 繪圖處理器進(jìn)入 DirectX 9 世代之後,NVIDIA 在 DX9 世代可以說(shuō)是棋差一著,在一連串的產(chǎn)品競(jìng)賽中落於下風(fēng),如今 NVIDIA 推出大幅革新的 GeForce 6800 新一代產(chǎn)品,希望藉此扭轉(zhuǎn)情勢(shì),而由目前所公布資料顯示,GeForce 6800 確實(shí)已領(lǐng)先 ATI 預(yù)定推出的新一代產(chǎn)品 R420。
對(duì)此情勢(shì),目前傳聞 ATI 將於 5 月初正式發(fā)表新一代的產(chǎn)品 R420 Pro 來(lái)迎戰(zhàn) NV40,由先前 ATI 所釋出的 R420 產(chǎn)品資訊來(lái)看,規(guī)格與效能與 NV40 有一段落差,所以這次冠上 Pro 的 R420,究竟作了哪些強(qiáng)化,相當(dāng)引人注意,而這場(chǎng) 4 對(duì) 4 的競(jìng)賽(NV4X 對(duì) R4XX)究竟鹿死誰(shuí)手,也將會(huì)是 PC 遊戲業(yè)界與遊戲玩家們所關(guān)心的焦點(diǎn),GNN 後續(xù)亦將針對(duì) ATI 與 NVIDIA 新產(chǎn)品的競(jìng)爭(zhēng)作深入分析報(bào)導(dǎo)。
(C) 2004 NVIDIA