從 8 月 8 日起連續(xù)兩日在臺北國際會議中心舉辦的臺北遊戲開發(fā)者論壇(TGDF),在今(9)日邀請到雷亞遊戲技術(shù)總監(jiān)李根逸與現(xiàn)場聽眾分享深度強(qiáng)化學(xué)習(xí)於《
伊甸之魂》的開發(fā)經(jīng)驗(yàn)。
李根逸曾參與雷亞遊戲動作類型手機(jī)遊戲 《
Implosion 聚爆》的開發(fā)並專精於遊戲效能與使用者體驗(yàn)的優(yōu)化。在雷亞遊戲即將問市的新款即時(shí)策略卡牌競技型手機(jī)遊戲《Soul of Eden
伊甸之魂》中,除負(fù)責(zé)帶領(lǐng)工程技術(shù)團(tuán)隊(duì)之外,也率領(lǐng)人工智慧團(tuán)隊(duì)研究引入機(jī)器學(xué)習(xí)至遊戲開發(fā)領(lǐng)域的各種可能。
李根逸表示,隨著類神經(jīng)網(wǎng)路的突破、AlphaGo 的成功使雷亞遊戲認(rèn)為將深度強(qiáng)化學(xué)習(xí)應(yīng)用在遊戲的開發(fā)上,己經(jīng)具有足夠的技術(shù)水平與邊際效應(yīng)。
例如在遊戲開發(fā)週期中,可能會經(jīng)常因?yàn)檫[戲機(jī)制的調(diào)整造成 NPC AI 需要做相對應(yīng)的調(diào)整;或者在遊戲平衡的評估上,早期的小型測試比較難得到完整妥善的驗(yàn)證。雷亞遊戲認(rèn)為深度強(qiáng)化學(xué)習(xí)可以一方面簡化程式設(shè)計(jì)師的工作,另一方面也可以讓遊戲設(shè)計(jì)師快速地獲得相對完整的驗(yàn)證結(jié)果當(dāng)參考,加速整個(gè)遊戲開發(fā)的迭代。
-
《伊甸之魂(Soul of Eden)》
基於這樣的動機(jī),雷亞遊戲於即將面世的即時(shí)策略卡牌競技型手機(jī)遊戲《
伊甸之魂(Soul of Eden)》中,嘗試透過深度強(qiáng)化學(xué)習(xí)來讓 AI 自動學(xué)習(xí)出戰(zhàn)勝的策略,並獲得初步的成果。藉此次機(jī)會分享過去實(shí)作的經(jīng)驗(yàn)、遇到的困難與對於遊戲開發(fā)一個(gè)新的可能的期待。
李根逸指出,隨著人工智能的高度發(fā)展,因此嘗試藉由這樣的技術(shù)來改善遊戲製作流程。他坦言,每一款遊戲的根本可以說是其核心玩法,但當(dāng)玩法發(fā)展完成推出遊戲後若要進(jìn)行其他修改時(shí),在過去往往會面臨是否要打掉重練的窘境,因此在這樣的心態(tài)下,想到如果能運(yùn)用人工智慧讓遊戲在推出前能夠更快獲得回饋,得知目前的作法對不對、好不好,相信能夠在遊戲製作流程上有很大的助益。而透過這樣的工作,更能夠達(dá)到自動化來提升效率,讓以往需要多數(shù)人力才能完成的工作如可以可以達(dá)到事半功倍之效。
李根逸表示,像是大家熟悉的 AlphaGo,其實(shí)就是透過不斷的學(xué)習(xí)吸收大量的資料,讓人工智能得以成長。而就遊戲開發(fā)來說 ,過去就有利用人工智慧來檢視單人遊戲的案例。由於單人遊戲通常是以分?jǐn)?shù)為基準(zhǔn),因此可以讓人工智能透過深度學(xué)習(xí),直接使用原始輸入的操作和輸出資訊進(jìn)行強(qiáng)化行為。現(xiàn)今更進(jìn)一步運(yùn)用到多人遊戲,也由於變因的增加,導(dǎo)致難度提升許多。以圍棋來說,賽局的可能性千變?nèi)f化,跟單人遊戲的分?jǐn)?shù)相比,實(shí)在難以運(yùn)算出有多少種終局可能性。
而回到《
伊甸之魂(Soul of Eden)》,究竟遊戲是否平衡、公平,製作團(tuán)隊(duì)要如何得知呢?李根逸指出,以往大多是透過大量的玩家資訊及場次來累積資訊量,進(jìn)而得知卡牌組合的勝率等遊戲資訊,而透過深度強(qiáng)化學(xué)習(xí),期望能達(dá)到遊戲開發(fā)流程的改善、深度強(qiáng)化學(xué)習(xí)的突破以及競技對戰(zhàn)遊戲的公平性三個(gè)目標(biāo)。
究竟什麼是平衡、公平其實(shí)各有定見,以井字遊戲來說,基本上先手玩家只要在不犯錯(cuò)的情況下一定不會輸,這樣對於後手玩家的公平性就值得質(zhì)疑。至於在遊戲中,如果兩方玩家透過同樣的出牌順序、出牌位置等對稱情況進(jìn)行遊戲的話,理論上應(yīng)該是不分勝負(fù)。不過由於遊戲中的變因相對井字遊戲來說更加變化多端,再加上卡牌的數(shù)值或是新增卡牌往往又會對過去的資料產(chǎn)生影響,所以如何克服訓(xùn)練的速度、深度強(qiáng)化學(xué)習(xí)的訓(xùn)練成本以及是否在新增資訊後要重新訓(xùn)練,則是目前的挑戰(zhàn)與難題。