首頁(yè) > 智能 > 正文

    斯坦福&谷歌研發(fā)“生成式智能體”,讓游戲NPC“活了”

    2023-04-30 09:27:30來(lái)源:智嗨網(wǎng)  

    撰文| 李 熙

    編輯 | 楊博丞


    (相關(guān)資料圖)

    題圖 | ICPhoto

    電子游戲業(yè)經(jīng)歷了三十多年的牛市,游戲中的NPC在畫(huà)面視效上有了飛躍,然而互動(dòng)智能上并沒(méi)有給玩家相似的體驗(yàn)提升。

    玩家們?cè)?995年的國(guó)產(chǎn)角色扮演游戲里,見(jiàn)過(guò)漁夫NPC只會(huì)重復(fù)一句“今天是釣魚(yú)的好天氣”;在2017年的育碧開(kāi)放沙盒游戲里,聽(tīng)過(guò)玻利維亞鄉(xiāng)民NPC反復(fù)只說(shuō)單調(diào)的西語(yǔ)粗口。

    其他領(lǐng)域的人工智能已經(jīng)改頭換面,但用在游戲NPC上的人工智能長(zhǎng)久以來(lái)還像復(fù)讀機(jī)。“身邊槍林彈雨,NPC八風(fēng)不動(dòng)”的哏,已經(jīng)讓瑞恩·雷諾茲老師拍成熱賣(mài)電影了。

    電影《失控玩家》截圖

    在大語(yǔ)言模型風(fēng)靡的當(dāng)下,以之改造游戲NPC成為可能。然而2023年4月7日,斯坦福大學(xué)和谷歌的研究者在預(yù)印本平臺(tái)上發(fā)布的論文,成就遠(yuǎn)過(guò)于業(yè)界期待:NPC豈止更聰明,簡(jiǎn)直算是“活過(guò)來(lái)了”。

    一、開(kāi)游戲業(yè)與AI界40年未有之先河

    生成式AI和大語(yǔ)言模型興起前,用AI改善游戲NPC的努力,一般是在更易實(shí)現(xiàn)的強(qiáng)化學(xué)習(xí)方向,其中最出名的是2019年在DOTA2里擊敗人類(lèi)世界冠軍的OpenAI 公司制作的5個(gè)AI。

    這種思路的概括,是用有清晰爭(zhēng)勝目標(biāo)的對(duì)抗性環(huán)境來(lái)作為獎(jiǎng)懲機(jī)制來(lái)訓(xùn)練NPC,最終完成的AI架構(gòu)能讓NPC自我修正行為以取得勝利目標(biāo)。

    OpenAI的DOTA2 AI與人類(lèi)對(duì)戰(zhàn)截圖

    不過(guò)游戲業(yè)的產(chǎn)品生態(tài)不止于此。不少游戲產(chǎn)品以?shī)Z旗、清空敵手等可以明確定義的對(duì)抗性勝利目標(biāo)為基礎(chǔ),但很多游戲沒(méi)有這種對(duì)抗性,游戲機(jī)制是模擬下廚、賣(mài)雜貨、拖拉機(jī)耕地、校園戀愛(ài)等隨機(jī)度更高的活動(dòng)。更多游戲的機(jī)制是開(kāi)放性沙盒,沒(méi)有明確定義的取勝路徑與規(guī)則。

    這些游戲的NPC功能如何從AI技術(shù)革命中獲益,很長(zhǎng)時(shí)間內(nèi)業(yè)內(nèi)大公司暫時(shí)還沒(méi)明確答案。

    然而2023年4月中旬谷歌與斯坦福大學(xué)研究者的論文《生成式行為體:人際行為的交互式互動(dòng)》,給出了通往答案的路徑:用大語(yǔ)言模型,讓沙盒模擬游戲里的NPC“獲得生命”。

    研究者稱(chēng),過(guò)去四十年來(lái),學(xué)界嘗試過(guò)創(chuàng)造行為可信的NPC的各種途徑,但在實(shí)際應(yīng)用中,這些途徑基于簡(jiǎn)單環(huán)境或智能體行為的單調(diào)維度,否則無(wú)法運(yùn)行。而此研究的成功,突破了上述局限。

    二、原理:ChatGPT讓NPC“思考”,本地?cái)?shù)據(jù)庫(kù)讓NPC“記憶”

    簡(jiǎn)單來(lái)說(shuō),研究者通過(guò)普通編程,為一個(gè)《模擬人生》類(lèi)型游戲的虛擬小鎮(zhèn)中的NPC們寫(xiě)好了虛擬環(huán)境設(shè)定、智能體人物設(shè)定、記憶庫(kù)架構(gòu)、擬定計(jì)劃等各方面程序代碼。然后在NPC與虛擬環(huán)境間、多名NPC之間的每次接觸時(shí),將以上各方面基礎(chǔ)數(shù)據(jù)、互動(dòng)環(huán)境等以自然語(yǔ)言描述后,通過(guò)應(yīng)用程序接口輸入給ChatGPT,再將ChatGPT的答案作為NPC下一步行為的指令。

    具體而言,研究中的“生成式行為體”NPC,其決策路徑如下圖所示:感知-錄入記憶流-檢索記憶庫(kù)-反思/計(jì)劃-行為

    “生成式行為體” 決策路徑簡(jiǎn)圖

    “感知”是NPC行為體對(duì)互動(dòng)、虛擬環(huán)境等的信息輸入,錄入“記憶流”后,與記憶數(shù)據(jù)庫(kù)對(duì)比。

    然后“檢索”是從數(shù)據(jù)庫(kù)中提取相關(guān)的記憶事項(xiàng),NPC行為體會(huì)用自然語(yǔ)言將事項(xiàng)輸入給ChatGPT,由大語(yǔ)言模型來(lái)決策事項(xiàng)的優(yōu)先級(jí),優(yōu)先級(jí)由事項(xiàng)的晚近程度、ChatGPT判斷的重要度與相關(guān)性為判斷基準(zhǔn)。給出的答案作為NPC思維流程的下一步輸入詞。

    接著,數(shù)據(jù)庫(kù)與大語(yǔ)言模型會(huì)開(kāi)始NPC的“反思”過(guò)程,數(shù)據(jù)庫(kù)將行為體最近100條記憶事項(xiàng)以自然語(yǔ)言輸入ChatGPT,讓大模型來(lái)推斷出由此可知最重要/相關(guān)的觀點(diǎn)。

    “檢索”獲取的答案、“反思”得出的觀點(diǎn)、結(jié)合NPC本身的人設(shè)數(shù)據(jù),都以自然語(yǔ)言自動(dòng)再次輸入ChatGPT,用大模型得出最符合人類(lèi)行為邏輯的行動(dòng)指令。

    試運(yùn)行截圖

    如此設(shè)計(jì)的用意,是因?yàn)榇笳Z(yǔ)言模型在訓(xùn)練期間已經(jīng)被寫(xiě)入了廣泛的人類(lèi)行為資料,在給出背景涵義足夠精準(zhǔn)的提示詞時(shí),ChatGPT等大模型可以生成高擬真度的人類(lèi)行為預(yù)測(cè)答案。

    然而在這個(gè)迅速驚艷世界的功能后,大語(yǔ)言模型存在小瑕疵:它不能記住每個(gè)用戶(hù)的個(gè)性化錄入內(nèi)容,所有用戶(hù)與模型間的對(duì)話(huà)都不能直接修改模型的參數(shù),任何顯得ChatGPT有記憶的表現(xiàn)都是算法在復(fù)讀最時(shí)新的用戶(hù)錄入內(nèi)容緩存。

    所以谷歌與斯坦福的研究者,結(jié)合存儲(chǔ)在云服務(wù)器上的數(shù)據(jù)庫(kù)與ChatGPT,來(lái)制作出能完成前述“思維步驟”的NPC,讓它們可以實(shí)時(shí)模擬人類(lèi)的自主決策。固定數(shù)據(jù)庫(kù)與軟件架構(gòu)是NPC佐助連續(xù)性思考的“記憶”,而大語(yǔ)言模型是NPC用來(lái)即時(shí)性思考的“靈魂”。

    三、效果:NPC能自行談戀愛(ài)和選鎮(zhèn)長(zhǎng)了

    在研究者的試運(yùn)行中,NPC智能體可以做到?jīng)]有人工干預(yù)微操、只給簡(jiǎn)單指令,就能自行完成復(fù)雜事件。當(dāng)研究者讓名叫伊莎貝拉的NPC籌劃情人節(jié)聚會(huì)時(shí),她自行在虛擬小鎮(zhèn)中開(kāi)始逐個(gè)邀請(qǐng)自己的朋友和熟人,并自行裝飾作為聚會(huì)場(chǎng)所的咖啡館。

    智能體與虛擬環(huán)境間的互動(dòng)可以完全自發(fā)且自洽。在環(huán)境狀況設(shè)置為“食物引燃”的狀況下,“伊莎貝拉”能自主做出“關(guān)閉燃?xì)庠睢钡臎Q策。如果這用普通編程也可以做到的話(huà),智能體接下來(lái)的“重做早飯”行為,就是較前有顯著突破的AI自發(fā)決策。

    智能體之間的互動(dòng),已經(jīng)達(dá)到可以模擬實(shí)際人際關(guān)系中的“信息擴(kuò)散”與“協(xié)作”行為。

    例如“伊莎貝拉”宣布要開(kāi)情人節(jié)聚會(huì)后,她邀請(qǐng)到的AI智能體們又進(jìn)一步邀請(qǐng)其他與伊莎貝拉無(wú)直接接觸的AI,例如名叫瑪麗婭的AI就邀請(qǐng)自己的“暗戀對(duì)象”克勞斯一同赴會(huì)。

    情人節(jié)聚會(huì)消息在NPC中擴(kuò)散的過(guò)程

    再如名叫“山姆”的AI宣布要競(jìng)選虛擬小鎮(zhèn)鎮(zhèn)長(zhǎng)后,AI“伊莎貝拉”與“湯姆”對(duì)此有自發(fā)的議論:“伊莎貝拉”詢(xún)問(wèn)“湯姆”的意見(jiàn),“湯姆”答出自己的觀點(diǎn):“老實(shí)說(shuō)我不看好山姆,他與本社區(qū)已經(jīng)脫節(jié),也并不真把我們的攸關(guān)利益放在心上“。

    在研究者的兩日試運(yùn)行中,虛擬小鎮(zhèn)的25個(gè)NPC里,得知“山姆”參選鎮(zhèn)長(zhǎng)的從單個(gè)擴(kuò)散到8個(gè)、得知“伊莎貝拉”辦聚會(huì)的從單個(gè)擴(kuò)散的12個(gè),過(guò)程中完全無(wú)人工干預(yù)。并且NPC們?cè)诨?dòng)內(nèi)容的置信度上部分超過(guò)了真人玩家。

    論文里各種狀態(tài)下NPC與人類(lèi)的行為置信度對(duì)比量表

    當(dāng)然,論文出圈后的“《西部世界》實(shí)現(xiàn)“熱議并不準(zhǔn)確。仔細(xì)的觀察者們大都發(fā)現(xiàn),不管所用的ChatGPT還是自制的NPC程序,并沒(méi)有真正的自主人類(lèi)意識(shí),只是將大模型的相關(guān)性引擎性能潛力進(jìn)一步發(fā)掘。

    由于大語(yǔ)言模型的現(xiàn)有局限,研究中的NPC也經(jīng)常有無(wú)厘頭的“幻覺(jué)”缺陷。例如NPC觀測(cè)到虛擬小鎮(zhèn)中有“公廁”,就不認(rèn)為是“單人廁所”,出現(xiàn)了“AI使用洗手間時(shí)常被其他AI闖入”的互動(dòng)場(chǎng)景。虛擬小鎮(zhèn)上的商店是下午五點(diǎn)關(guān)門(mén),然而NPC們時(shí)常在歇業(yè)時(shí)間試圖進(jìn)入。有AI看到其他NPC的名字是亞當(dāng)·史密斯,就說(shuō):“啊我曉得你,你就是那個(gè)18世紀(jì)的經(jīng)濟(jì)學(xué)宗師。”

    論文中提到了這些缺陷,還說(shuō)“提示詞黑客手段-即人類(lèi)玩家用仔細(xì)準(zhǔn)備好的對(duì)話(huà)內(nèi)容來(lái)迷惑NPC行為體,可以讓AI幻覺(jué)出從未發(fā)生的事件的記憶。”

    現(xiàn)在很多游戲業(yè)者認(rèn)為生成式AI的技術(shù)還在襁褓期,暴炒Chatgpt的人很多五六年前在狂吹加密貨幣。有名的波蘭游戲公司CD Projekt Red,其動(dòng)作游戲系列的內(nèi)容開(kāi)發(fā)者領(lǐng)軍人在2023年1月說(shuō),NPC離自行建立一個(gè)生態(tài)活躍的虛擬社區(qū),還太過(guò)遙遠(yuǎn)。

    生成式AI的確是在襁褓期,但襁褓中的生物,最突出特征就是飛快的生長(zhǎng)速度。AI大模型將如何改變游戲業(yè),實(shí)在讓人充滿(mǎn)憧憬。

    標(biāo)簽:

    相關(guān)閱讀

    相關(guān)詞

    推薦閱讀

    91亚洲导航深夜福利| 亚洲天堂在线播放| 在线亚洲97se亚洲综合在线| 亚洲综合精品伊人久久| 亚洲白嫩在线观看| 亚洲国产美女精品久久| 久久精品国产亚洲77777| 亚洲成a人片在线观看无码专区 | 亚洲高清无码专区视频| 久久综合亚洲色hezyo| 亚洲AV永久无码精品一福利| 亚洲国产成人精品无码区二本| 亚洲女女女同性video| 亚洲一区二区三区丝袜| 亚洲精品第一国产综合亚AV| 亚洲精品国产首次亮相 | 亚洲AV无码乱码国产麻豆| 久久久久亚洲精品无码系列| 久久久久亚洲av无码尤物| 亚洲午夜精品一区二区| 亚洲小说区图片区| 国产91在线|亚洲| 亚洲精品伦理熟女国产一区二区| 亚洲精华液一二三产区| 国产精品观看在线亚洲人成网| 亚洲国产成人VA在线观看| 亚洲精品456播放| 国产亚洲精品自在线观看| 国产亚洲精品一品区99热| 亚洲成人免费在线| 亚洲欧洲国产经精品香蕉网| 亚洲一区二区三区播放在线| 亚洲人成无码网站在线观看| 日日摸日日碰夜夜爽亚洲| 亚洲一区二区三区在线视频| 久久精品国产69国产精品亚洲| 亚洲另类激情综合偷自拍| 亚洲自偷自拍另类图片二区| 精品丝袜国产自在线拍亚洲| 欧美亚洲国产SUV| 久久久久久A亚洲欧洲AV冫|