西风 发自 凹非寺
量子位 | 公众号 QbitAI
在11月17日到21日这五天时间里,世界目睹了一些最聪明的人如纳德拉、奥特曼、Ilya,被迫在一场快节奏的“权力的游戏”中运作。在高压、短时间框架情景下,他们必须运用博弈论和欺骗手段才能胜出。
我们认为这是测试SIM-1、GPT4o和Sim Francisco的完美场景。
我们发现,大语言模型的设计并不是基于决策能力的,而这是游戏中非常重要的一点。它更多地基于个性。
如果你想开发一款策略游戏,没人真正在乎个性,他们更关心的是决策能力。比如你在压力下会怎样表现?你过去20年的经历和行为又如何帮助预测你未来可能的行动?
通信人家园 (https://test.txrjy.com/) | Powered by C114 |