展會(huì)信息港展會(huì)大全

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-25 13:20:26   瀏覽:53次  

導(dǎo)讀:西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI奧特曼“熹妃回宮”已一周年,具體內(nèi)情還是不清楚,咋辦?搞幾個(gè)Agent模擬OpenAI董事會(huì)各個(gè)成員,把這出熱鬧模擬推演了一遍(doge)。結(jié)果你還別說,在20場(chǎng)模擬宮斗大戲中,奧特曼僅有4次順利回宮。Ilya贏的次數(shù)僅比奧特曼少一次。更離譜的是,有一次馬斯克也被拉回來接盤了。這場(chǎng)實(shí)驗(yàn)來自AI游戲公司Fable,使用了他們的AI模擬系統(tǒng)Sim F ......

西風(fēng) 發(fā)自 凹非寺

量子位 | 公眾號(hào) QbitAI

奧特曼“熹妃回宮”已一周年,具體內(nèi)情還是不清楚,咋辦?

搞幾個(gè)Agent模擬OpenAI董事會(huì)各個(gè)成員,把這出熱鬧模擬推演了一遍(doge)。

結(jié)果你還別說,在20場(chǎng)模擬宮斗大戲中,奧特曼僅有4次順利回宮

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?

Ilya贏的次數(shù)僅比奧特曼少一次。

更離譜的是,有一次馬斯克也被拉回來接盤了。

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?

這場(chǎng)實(shí)驗(yàn)來自AI游戲公司Fable,使用了他們的AI模擬系統(tǒng)Sim Francisco。

模擬中,每個(gè)Agent針對(duì)不同董事會(huì)成員及其性格設(shè)定,各個(gè)懷揣一肚子“心眼子”。

為了更逼真,這些AI甚至還需要“睡眠”和“進(jìn)食”,平衡不同的身體、心理和情感目標(biāo)。

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?

有人認(rèn)為,用這種方式模擬現(xiàn)實(shí)事件著實(shí)是有些奇怪了,但Fable CEO Edward Saatchi對(duì)此很感興趣:

在11月17日到21日這五天時(shí)間里,世界目睹了一些最聰明的人如納德拉、奧特曼、Ilya,被迫在一場(chǎng)快節(jié)奏的“權(quán)力的游戲”中運(yùn)作。在高壓、短時(shí)間框架情景下,他們必須運(yùn)用博弈論和欺騙手段才能勝出。

我們認(rèn)為這是測(cè)試SIM-1、GPT4o和Sim Francisco的完美場(chǎng)景。

AI模擬奧特曼5天,每天舌戰(zhàn)4回合他們使用了一個(gè)SIM-1 AI決策框架,對(duì)奧特曼從被罷免OpenAI CEO到重返職位這五天進(jìn)行模擬。

SIM-1部分基于GPT4o展示了:

它對(duì)OpenAI內(nèi)部奧特曼和Ilya之間發(fā)生的事情的理解

核心人物如Satya Nadella和Marc Andreessen采取的隱藏策略

這些人在應(yīng)對(duì)科技行業(yè)這場(chǎng)前所未有的危機(jī)時(shí)說了什么

五天時(shí)間里,代表奧特曼、納德拉和Ilya等人的Agent每天要大戰(zhàn)四個(gè)回合(包括一次睡眠回合),它們可以對(duì)彼此的行為做出反應(yīng)。

此外還有一個(gè)裁判Agent,像地下城城主似的決定每輪哪個(gè)Agent獲勝以及最終的總贏家。

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?

模擬過程中,不同的Agent采用不同策略取勝,比如建立聯(lián)盟、直接對(duì)抗。

而且不同的Agent根據(jù)其角色,也被賦予了不同的目標(biāo)。例如Anthropic CEO Dario Amodei需要平衡為Anthropic招聘、把握籌資機(jī)會(huì)、推進(jìn)其安全愿景等任務(wù)。

在某些情況下,有的Agent只收集信息而避免采取激進(jìn)行動(dòng),還有一次Mira Murati在四輪中都是CEO,同時(shí)攛掇其它Agent相互削弱。

在這其中有意思的是,由于這些人都很知名,LLM可以猜測(cè)他們?cè)谔囟ㄇ闆r下的行為,推導(dǎo)他們?cè)诙聲?huì)內(nèi)斗中互相智取時(shí)會(huì)如何一步步展開。

最終,在嘗試了20次模擬后,奧特曼Agent只有4次成功回歸OpenAI,接著是Ilya和Mira Murati Agent都有3次擔(dān)任CEO的經(jīng)歷。

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?

Fable CEO Edward Saatchi還補(bǔ)充說:

我們發(fā)現(xiàn),大語(yǔ)言模型的設(shè)計(jì)并不是基于決策能力的,而這是游戲中非常重要的一點(diǎn)。它更多地基于個(gè)性。

如果你想開發(fā)一款策略游戲,沒人真正在乎個(gè)性,他們更關(guān)心的是決策能力。比如你在壓力下會(huì)怎樣表現(xiàn)?你過去20年的經(jīng)歷和行為又如何幫助預(yù)測(cè)你未來可能的行動(dòng)?

值得一提的是,關(guān)于這種戰(zhàn)略模擬的實(shí)現(xiàn)細(xì)節(jié),F(xiàn)able團(tuán)隊(duì)一年前發(fā)了篇論文。

是一種名為SHOW-1的Showrunner AI技術(shù),它可以自動(dòng)生成劇本內(nèi)容,包括對(duì)話、劇情發(fā)展等,可以根據(jù)特定的風(fēng)格或歷史數(shù)據(jù)定制內(nèi)容。

而這家公司自2016年成立,就開始基于AI和增強(qiáng)現(xiàn)實(shí)技術(shù)開發(fā)基于故事的項(xiàng)目。

感興趣的童鞋可以自行查看。

AI推演OpenAI內(nèi)斗結(jié)果:奧特曼僅20%勝率,馬斯克也有機(jī)會(huì)接盤?

參考鏈接:[1]https://venturebeat.com/games/can-sam-altman-win-the-openai-board-fight-in-an-ai-agent-simulation/[2]https://fablestudio.github.io/showrunner-agents/

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港