新一代顯示晶片 NV40

（GNN 記者 Sam 報(bào)導(dǎo)） 2004-04-22 09:10:24

　　NVIDIA 於日前發(fā)表了傳聞以久的新一代顯示卡產(chǎn)品 GeForce 6800，不但令外界耳目一新，更洗刷了 NVIDIA 長(zhǎng)久以來(lái)在微軟 DirectX 9 世代產(chǎn)品一直居於下風(fēng)的恥辱，並且以超越現(xiàn)有高階產(chǎn)品兩倍以上的高效能，以及具備目前最高影像品質(zhì)與最完備影像處理功能，替下一代的顯示晶片立下了一個(gè)典範(fàn)。

　　GeForce 6800 是以代號(hào) NV40 的繪圖晶片為核心，NV40 是首顆支援 DirectX 9 Shader Model 3.0，或稱(chēng)為 DirectX 9.0c 規(guī)格的繪圖晶片，晶片內(nèi)部是以 6 組 Vertex Shader（頂點(diǎn)著色器），以及 16 條具備超純量設(shè)計(jì)管線(xiàn)的 Pixel Shader（像素著色器）所構(gòu)成，並整合了 MPEG 1、2、4 以及 Windows Media Video 9 格式動(dòng)態(tài)影像壓縮與解壓縮的輔助處理電路。

　　GeForce 6800 產(chǎn)品目前分為 Ultra 版與非 Ultra 版兩種：

	GeForce 6800 Ultra	GeForce 6800
繪圖晶片	NV40	NV40
頂點(diǎn)著色器	6 組	6 組
像素著色器管線(xiàn)	16 條超純量	12 條超純量
核心時(shí)脈	400MHz	未確認(rèn)，推測(cè) 350MHz
記憶體類(lèi)型	GDDR3	DDR
記憶體運(yùn)作時(shí)脈	1.1GHz	1GHz
匯流排寬度	256 位元	256 位元
記憶體容量	256MB	128MB
記憶體頻寬	35GBps	32GBps
電源供應(yīng)需求	2 組電源接頭，建議配備 480 瓦以上電源供應(yīng)器	1 組電源接頭
預(yù)估售價(jià)	499 美金	299 美金

◆ DirectX 9 第二世代產(chǎn)品

　　自 ATI 推出 R300 顯示晶片產(chǎn)品後，顯示卡產(chǎn)品正式進(jìn)入 DX9 的世代中，而 NVIDIA 在 DX9 產(chǎn)品的推出上，不但晚了對(duì)手一步，而且首次推出的 NV30，因?yàn)樵O(shè)計(jì)與製程的問(wèn)題，使得首代的 GeForce 5800 產(chǎn)品不但耗電量大，散熱系統(tǒng)體積與噪音驚人（NVIDIA 研發(fā)人員亦曾製作搞笑影片來(lái)自我嘲諷），而且效能明顯的不如競(jìng)爭(zhēng)對(duì)手的產(chǎn)品，使得自 TNT 以來(lái)連戰(zhàn)連勝的 NVIDIA 遭逢了第一次的重大挫敗。

　　其後 NVIDIA 雖然於 NV35 上力求振作，修改了部分設(shè)計(jì)，如記憶體匯流排與像素著色器的配置，但是由於其整體設(shè)計(jì)仍然是與 NV30 屬於同一代的架構(gòu)，所以一直無(wú)法於效能競(jìng)賽中真正領(lǐng)先。

　　因此，NVIDIA 在這次所推出的 NV40 產(chǎn)品上，採(cǎi)取了幾乎完全翻新的設(shè)計(jì)，其執(zhí)行單元的數(shù)目、配置、功能...等等都與前代的 NV3X 有著非常大的不同，如將 NV3X 視為 NVIDIA DX9 第一世代的產(chǎn)品，則 NV40 即可視為 DX9 第二世代的產(chǎn)品，一般預(yù)料也將會(huì)是 NVIDIA DX9 的末代產(chǎn)品，架構(gòu)上不會(huì)再有大更動(dòng)。

◆ 效能成長(zhǎng)

　　與前一代產(chǎn)品 GeForce 5950 相比，GeForce 6800 Ultra 的效能成長(zhǎng)了數(shù)倍之多，以各種不同的應(yīng)用程式與遊戲的綜合測(cè)試下，總合表現(xiàn)約比 GeForce 5950 高出一倍。在 NVIDIA 以廣泛用於評(píng)估 3D 繪圖效能的 3DMark 2003 所做的測(cè)試中，特製高時(shí)脈版本的 GeForce 6800 Ultra 更得到了史無(wú)前例的 14860 分，而標(biāo)準(zhǔn)版本的 GeForce 6800 Ultra 則是 12353，兩者皆遠(yuǎn)超越現(xiàn)有的任何產(chǎn)品。

◆ DirectX 9.0 Shader Model 3.0

　　NV40 首度支援了 DirectX 9 Shader Model 3.0（以下簡(jiǎn)稱(chēng) Shader 3.0），以下就 Shader 2.0 與 3.0 的差異作一列表：

	Shader 2.0	Shader 3.0
頂點(diǎn)著色器指令	256	65535
置換式貼圖	─	ˇ
頂點(diǎn)材質(zhì)擷取	─	ˇ
座標(biāo)引用機(jī)制	─	ˇ
動(dòng)態(tài)流程控制	─	ˇ
著色器精確度	24 位元浮點(diǎn)數(shù)	32 位元浮點(diǎn)數(shù)
像素著色器指令	96	65535
子常式	─	ˇ
迴圈與分支	─	ˇ
動(dòng)態(tài)流程控制	─	ˇ

　　由列表中可以看出，Shader 3.0 主要的進(jìn)步在於著色器程式所能容許的指令數(shù)目大幅的增加，像素著色器也導(dǎo)入了原先只有頂點(diǎn)著色器才支援的迴圈與流程控制，且頂點(diǎn)與像素著色器兩者皆增加了動(dòng)態(tài)流程控制，使得著色器程式碼的撰寫(xiě)自由度大幅提高。在先前的 Shader 2.0 標(biāo)準(zhǔn)中，僅允許靜態(tài)的流程控制。利用動(dòng)態(tài)流程控制，將可以依照實(shí)際情況動(dòng)態(tài)判定使用何種程式碼來(lái)進(jìn)行處理，NVIDIA 於 NV40 虛擬代言人，美人魚(yú) Nalu 的展示中，在 Nalu 身上皮膚與鱗甲交錯(cuò)之處，使用了動(dòng)態(tài)流程控制的分支執(zhí)行功能來(lái)針對(duì)皮膚與鱗甲所需不同處理的需求，動(dòng)態(tài)決定該使用哪一種著色器程式碼來(lái)處理，使得原本需要多步驟繁複處理的過(guò)程可以大幅的簡(jiǎn)化，提昇程式撰寫(xiě)與執(zhí)行的效率。

◆ 頂點(diǎn)著色器

　　NV40 的頂點(diǎn)著色器相較於 NV3X 家族所具備，較標(biāo)準(zhǔn) Shader 2.0 更為強(qiáng)化的 Shader 2.0a 相比，主要的改進(jìn)在於支援了頂點(diǎn)材質(zhì)貼圖擷取功能，用以支援 Shader 3.0 內(nèi)入標(biāo)準(zhǔn)支援項(xiàng)目的置換式貼圖（Displacement Mapping），置換式貼圖可以使用各種不同的頂點(diǎn)材質(zhì)，配合相同的基礎(chǔ) 3D 模型，讓頂點(diǎn)依照頂點(diǎn)材質(zhì)的資料來(lái)作偏移，產(chǎn)生不同外觀(guān)的模型。

　　而大幅強(qiáng)化的頂點(diǎn)著色器程式碼長(zhǎng)度限制，以及靈活的動(dòng)態(tài)流程控制，使得頂點(diǎn)著色器能更有效率的處理複雜的運(yùn)算。

◆ 像素著色器

　　原本於 NV3X 世代產(chǎn)品中，其像素著色器皆是以虛擬 8 條管線(xiàn)，實(shí)際 4 條管線(xiàn)的配置，一般視為 4 x 2（4 管線(xiàn) x 2 材質(zhì)貼圖單元）或 8 x 0（處理 Z-stencil 像素時(shí)），而這個(gè)設(shè)計(jì)並未能與真正 8 條管線(xiàn)的 ATI 競(jìng)爭(zhēng)產(chǎn)品達(dá)成相同的效益，所以 NVIDIA 在 NV40 的設(shè)計(jì)上，採(cǎi)用了真正 16 條管線(xiàn)並列的設(shè)計(jì)，而且不單是如此，每條管線(xiàn)還配置了兩組著色器，數(shù)量為前一代的四倍之多。

　　NVIDIA 先前並未承認(rèn)過(guò)外界認(rèn)定 NV3X 是 4 x 2、8 x 0 架構(gòu)的說(shuō)法，但這次在 NV40 發(fā)表資料中，首次以此標(biāo)準(zhǔn)來(lái)突顯 NV40 的進(jìn)步，就 NVIDIA 的說(shuō)法，如果 NV3X 是 4 x 2、8 x 0 架構(gòu)，那麼 NV40 就是 16 x 1、32 x 0 的架構(gòu)，執(zhí)行單元成長(zhǎng)了 2～4 倍之多。

　　而 NV40 像素著色器所具備的超純量 16 管線(xiàn)設(shè)計(jì)，則是以每條管線(xiàn)配置兩個(gè)著色器執(zhí)行單元的方式，達(dá)成兩倍於前一代設(shè)計(jì)的執(zhí)行效能，不過(guò)由於其中一組著色器與材質(zhì)貼圖處理單元是共用的，所以在執(zhí)行材質(zhì)貼圖處理時(shí)，仍舊與前代產(chǎn)品相同，每週期可執(zhí)行 1 材質(zhì)貼圖運(yùn)算 + 4 組著色器運(yùn)算，但在執(zhí)行著色器指令時(shí)，則較前代產(chǎn)品的每週期 4 組運(yùn)算多出一倍，達(dá)每週期 8 組運(yùn)算?？商幚淼闹噶顢?shù)亦由前代的每個(gè)週期每個(gè)像素 2 個(gè)指令提昇至每個(gè)週期每個(gè)像素 4 個(gè)指令，像素元件（R G B A）的群組設(shè)定（例如 RGB + A 或 RG + BA 等配置）上，亦提供較前代更充分的彈性。因此，當(dāng)執(zhí)行指令數(shù)目較多較複雜的著色器程式時(shí)，NV40 將能得到顯著的效能提昇。

　　對(duì)於像素著色器的資料格式來(lái)說(shuō)，NV40 則是充分對(duì)應(yīng) Shader 3.0，全面提升為 32 位元浮點(diǎn)數(shù)，而且內(nèi)部的處理單元完全對(duì)應(yīng) 32 位元浮點(diǎn)數(shù)格式。由於 NV3X 家族使用 32 位元浮點(diǎn)數(shù)效率僅有 16 位元浮點(diǎn)數(shù)的一半，明顯不如競(jìng)爭(zhēng)對(duì)手 ATI 以 24 位元浮點(diǎn)數(shù)所達(dá)成的品質(zhì)與效能的良好平衡，所以在 NV40 上 NVIDIA 改以完全的 32 位元浮點(diǎn)數(shù)架構(gòu)設(shè)計(jì)，能保持一貫的速度運(yùn)作，並得到最佳的品質(zhì)。

◆ 影像處理器引擎

　　除了 3D 繪圖效能與功能上的進(jìn)步之外，NV40 更針對(duì)了動(dòng)態(tài)影像編解碼的需求，整合了可程式化的影像處理器引擎，以高效能的專(zhuān)屬硬體支援高解析度高畫(huà)質(zhì)的 MPEG 1、2、4 與微軟 Windows Media Video 9 影像格式的壓縮解壓縮處理。在執(zhí)行 MPEG2 編碼時(shí)，NV40 所具備的影像處理器引擎可負(fù)擔(dān) 60％的運(yùn)算量，解碼時(shí)更可負(fù)擔(dān)高達(dá) 95％的運(yùn)算量，並可以硬體支援如去交錯(cuò)、色域轉(zhuǎn)換、伽碼校正、雜訊消除...等處理，大幅減輕 CPU 的負(fù)擔(dān)。

　　NV40 的影像處理器引擎並具備完整的視訊輸出入處理功能，支援視訊輸入，高傳真電視（HDTV）解析度高達(dá) 1920 x 1080(i) 的視訊輸出，以及高傳真影像訊號(hào)版權(quán)保護(hù)標(biāo)準(zhǔn) HDCP，充分滿(mǎn)足新一代的高傳真多媒體影音需求。也正因?yàn)?NV40 內(nèi)建完整的影像處理功能，所以在實(shí)作顯示卡產(chǎn)品時(shí)很容易整合必要的外部視訊輸出入轉(zhuǎn)換控制元件，讓顯示卡具備視訊輸出入的功能，由 NVIDIA 提供給各廠(chǎng)商的公版設(shè)計(jì)，以及目前眾多廠(chǎng)商所推出的 NV40 頂級(jí)顯示卡產(chǎn)品 GeForce 6800 Ultra 幾乎都具備此功能，即可看出此一趨勢(shì)。

　　而針對(duì)此一強(qiáng)大的影像處理器引擎，動(dòng)態(tài)影像處理軟體龍頭廠(chǎng)商 Adobe 亦發(fā)表將充分發(fā)揮 NV40 可程式化影像處理引擎所帶來(lái)的新功能，來(lái)加強(qiáng)旗下動(dòng)態(tài)影像處理軟體的功能與效能。

◆ 記憶體匯流排

　　相較於繪圖晶片核心的大幅進(jìn)步，GeForce 6800 的記憶體匯流排的進(jìn)展顯得不是那麼的突出，GeForce 6800 Ultra 版本採(cǎi)用了時(shí)脈 1.1GHz，匯流排寬度 256 位元的 GDDR3 記憶體，理論頻寬約 35GBps，相較於前代產(chǎn)品的 950MHz 256bits GDDR 來(lái)說(shuō)，頻寬約提昇 15％，而由於 GDDR3 採(cǎi)用了較低的運(yùn)作時(shí)脈，所以記憶體的耗電量較前代所採(cǎi)用的 GDDR2下降，有助於顯示卡的散熱處理。

　　但由於相對(duì)於繪圖晶片核心兩倍以上的效能成長(zhǎng)，僅僅 15％的記憶體頻寬成長(zhǎng)於是成了效能的瓶頸之一，為了解決這個(gè)問(wèn)題，提昇多管線(xiàn)著色器的實(shí)際效能，NV40 首次採(cǎi)用了二階材質(zhì)快?。↙2 Texture Cache）的設(shè)計(jì)，讓個(gè)別頂點(diǎn)著色器與像素著色器管線(xiàn)內(nèi)部的一階材質(zhì)快取連結(jié)到統(tǒng)一的二階材質(zhì)快取，以減低著色器管線(xiàn)對(duì)於外部記憶體存取的需求。

　　但這並未完全解決記憶體頻寬的瓶頸，使得 NV40 理論上應(yīng)該可以達(dá)到單一週期內(nèi)處理 16 個(gè)單材質(zhì)貼圖的像素，但實(shí)際上僅能達(dá)到 12.27 個(gè)像素，相較於 NV35 理論 4 實(shí)際 3.99 來(lái)說(shuō)，落差較大，後續(xù)產(chǎn)品如改用更高速的 GDDR3 繪圖記憶體時(shí)，將能有效提昇實(shí)際處理效能。

　　而由於 NV40 使用了完全的浮點(diǎn)數(shù)頂點(diǎn)與像素格式，並支援浮點(diǎn)數(shù)材質(zhì)，所以對(duì)於記憶體空間的需求也將較前代產(chǎn)品提昇，目前所發(fā)表的頂級(jí)產(chǎn)品 GeForce 6800 Ultra 配備有 256MB 記憶體，NVIDIA 公布後續(xù)將發(fā)表高達(dá) 512MB 記憶體的產(chǎn)品，以充分發(fā)揮 NV40 的高精準(zhǔn)度浮點(diǎn)數(shù)處理與儲(chǔ)存格式，應(yīng)用於高階遊戲或者是專(zhuān)業(yè) 3D 繪圖製作的輔助上。

◆ 製程與功率

　　以往 NVIDIA 的顯示晶片都是交由臺(tái)積電代工，但自去年 3 月 NVIDIA 正式與 IBM 簽定合作案之後，部分效能取向產(chǎn)品便由 IBM 代工生產(chǎn)，這次 NV40 則是完全以 IBM 所提供的 0.13 微米製程所生產(chǎn)，這是否意味著將來(lái) NVIDIA 會(huì)自 TSMC 抽身而大幅轉(zhuǎn)進(jìn) IBM 代工，目前尚不得而知。

　　與同樣是採(cǎi)用 0.13 微米製程所生產(chǎn)的 NV3X 家族來(lái)說(shuō)，這次 NV40 的電晶體數(shù)與晶片尺寸則是史無(wú)前例的巨大，共包含了 2.22 億的電晶體，相對(duì)於 NV35 的 1.3 億來(lái)說(shuō)，整整成長(zhǎng)了 70％，而晶片尺寸也由 NV35 的約 200 平方公厘成長(zhǎng)為 300 平方公厘。另一個(gè)引人側(cè)目之處在於由 NV40 所構(gòu)成的 GeForce 6800 Ultra 顯示卡居然配備了“兩”個(gè)外部電源接頭，官方並建議最好配備超過(guò) 480 瓦的電源供應(yīng)器來(lái)供電，可見(jiàn)其功率消耗的可觀(guān)程度。

　　晶片尺寸與耗電過(guò)大，是 NV40 兩個(gè)最大的隱憂(yōu)，因?yàn)檫@會(huì)導(dǎo)致 NV40 產(chǎn)能的低落與成本的高昂。如果以先前 NV3X 家族的規(guī)劃來(lái)看，NV4X 家族陸續(xù)應(yīng)會(huì)推出像素著色器管線(xiàn)減半（8 條）的效能導(dǎo)向產(chǎn)品，以及再減半（4 條）的主流及價(jià)位導(dǎo)向產(chǎn)品，如 NV40 的晶片尺寸過(guò)大，則這些削減管線(xiàn)的中低價(jià)位晶片也將連帶的受到影響，而無(wú)法有效的壓低成本與耗電量，由於實(shí)際上獲利最多的是這兩個(gè)產(chǎn)品線(xiàn)，所以 NVIDIA 將必須要面對(duì)採(cǎi)用既有 0.13 製程硬上超多電晶體設(shè)計(jì)的苦果。

　　一般認(rèn)為唯有儘速轉(zhuǎn)移至 90 奈米製程，才能讓 NV4X 家族達(dá)到成本與效能的平衡，目前 0.13 微米製程對(duì)於超過(guò) 2 億電晶體的設(shè)計(jì)，已經(jīng)頗為勉強(qiáng)。不過(guò)，雖然目前 NV40 的耗電量驚人，但是在實(shí)際的測(cè)試中，GeForce 6800 Ultra 的溫度並未如耗電量般高，僅微溫而已，而且散熱系統(tǒng)的噪音也不大，並不像當(dāng)初 GeForce 5800 Ultra 被比喻作電熱吹風(fēng)機(jī)那般的高熱與吵雜。

◆ AGP 8X 與 PCI-Express 16X

　　如同 NV3X 家族一般，NV40 仍舊以 AGP 為原生支援介面，對(duì)於 PCI-Express 的支援則是透過(guò) HSI（High-Speed Interconnect）橋接晶片，以獨(dú)特的 AGP 16X 規(guī)格來(lái)轉(zhuǎn)換至 PCI-Express 16X 的全雙工 4GBps 新一代高速匯流排。目前所發(fā)表的 GeForce 6800 產(chǎn)品皆為 AGP 8X 版本，PCI-Express 16X 版本則預(yù)定於今年下半年推出。

　　有別於競(jìng)爭(zhēng)對(duì)手 ATI 以設(shè)計(jì)原生支援 PCI-Express 繪圖晶片的方式來(lái)提供 PCI-Express 顯示卡產(chǎn)品，NVIDIA 目前皆?huà)?cǎi)用 HSI 橋接晶片的方式來(lái)提供 PCI-Express 的支援，HSI 方案的優(yōu)點(diǎn)在於不需要變動(dòng)既有繪圖晶片的設(shè)計(jì)，但缺點(diǎn)在於橋接方式並無(wú)法完全滿(mǎn)足 PCI-Express 全雙工 4GBps 的傳輸頻寬，以及 HSI 橋接晶片與電路造成生產(chǎn)成本的上升，這對(duì)於獲利空間較小的效能與主流市場(chǎng)產(chǎn)品來(lái)說(shuō)，影響不可謂不大。

　　目前 NVIDIA 預(yù)計(jì)於 NV40 的下一代改良產(chǎn)品上實(shí)作 PCI-Express 的原生支援，預(yù)計(jì)當(dāng)正式支援 PCI-Express 原生模式後，將更能充分發(fā)揮 NV4X 家族的效能優(yōu)勢(shì)與應(yīng)用範(fàn)圍。

◆ 結(jié)論

　　在 ATI 率先以 R300 繪圖處理器進(jìn)入 DirectX 9 世代之後，NVIDIA 在 DX9 世代可以說(shuō)是棋差一著，在一連串的產(chǎn)品競(jìng)賽中落於下風(fēng)，如今 NVIDIA 推出大幅革新的 GeForce 6800 新一代產(chǎn)品，希望藉此扭轉(zhuǎn)情勢(shì)，而由目前所公布資料顯示，GeForce 6800 確實(shí)已領(lǐng)先 ATI 預(yù)定推出的新一代產(chǎn)品 R420。

　　對(duì)此情勢(shì)，目前傳聞 ATI 將於 5 月初正式發(fā)表新一代的產(chǎn)品 R420 Pro 來(lái)迎戰(zhàn) NV40，由先前 ATI 所釋出的 R420 產(chǎn)品資訊來(lái)看，規(guī)格與效能與 NV40 有一段落差，所以這次冠上 Pro 的 R420，究竟作了哪些強(qiáng)化，相當(dāng)引人注意，而這場(chǎng) 4 對(duì) 4 的競(jìng)賽（NV4X 對(duì) R4XX）究竟鹿死誰(shuí)手，也將會(huì)是 PC 遊戲業(yè)界與遊戲玩家們所關(guān)心的焦點(diǎn)，GNN 後續(xù)亦將針對(duì) ATI 與 NVIDIA 新產(chǎn)品的競(jìng)爭(zhēng)作深入分析報(bào)導(dǎo)。

以太坊官方下载网址

新一代顯示晶片 NV40

NT$1190

NT$2580

NT$850

NT$10480

NT$680

延伸報(bào)導(dǎo)