NVIDIA(輝達(dá))今日宣布發(fā)表 AI 研究成果,使開發(fā)者首度能運(yùn)用從真實(shí)場景影片訓(xùn)練學(xué)習(xí)而得的模型,透過系統(tǒng)自動(dòng)繪製出完全合成的互動(dòng)式 3D 環(huán)境。
官方表示,在目前虛擬世界中的每個(gè)物件都必須個(gè)別建模,這樣的流程不僅昂貴且廢時(shí),NVIDIA 研究成果採用的模型則是系統(tǒng)由實(shí)景影片中自動(dòng)學(xué)習(xí)所得,自動(dòng)繪製出包括建築物、樹木與車輛等物體。新開發(fā)的技術(shù)將有潛力能夠快速為包括汽車、建築、機(jī)器人或虛擬實(shí)境等應(yīng)用迅速繪製虛擬環(huán)境。此類神經(jīng)網(wǎng)路能根據(jù)特定地點(diǎn)的實(shí)景或消費(fèi)者最喜愛明星舞姿生成可互動(dòng)的電腦場景。
帶領(lǐng)這項(xiàng)研究的 NVIDIA 深度學(xué)習(xí)應(yīng)用研究部副總裁 Bryan Catanzaro 表示:「NVIDIA 在過去 25 年持續(xù)針對互動(dòng)式影像生成進(jìn)行研發(fā),如今透過類神經(jīng)網(wǎng)路我們首度能夠達(dá)成。此類神經(jīng)網(wǎng)路,特別是生成模型,將改變影像產(chǎn)生的方式,讓開發(fā)者以遠(yuǎn)低於傳統(tǒng)方法的成本創(chuàng)造出嶄新的場景。」
此次研究的成果是一個(gè)簡單的駕駛遊戲,讓駕駛在都市情境中駕車遊走。所有內(nèi)容都是透過類神經(jīng)網(wǎng)路進(jìn)行互動(dòng)著色而成,將傳統(tǒng)繪圖引擎繪製的 3D 世界轉(zhuǎn)換成影片。
生成類神經(jīng)網(wǎng)路已學(xué)會(huì)模擬如光照、材質(zhì)與其他動(dòng)態(tài)等真實(shí)世界的樣貌。由於該場景是完全合成,因此能輕易進(jìn)行編輯,各物體都能加以移除、修改或新增。
研究人員在其論文中指出,掌握建模與重建視覺世界動(dòng)態(tài)的能力對於建構(gòu)智能代理(intelligent agents)至關(guān)重要。除了純粹的科學(xué)愛好,學(xué)習(xí)如何合成連續(xù)視覺體驗(yàn)在包括電腦視覺、機(jī)器人與電腦繪圖等領(lǐng)域都存在眾多的應(yīng)用潛力。