在科技日益进步的今天,人工智能(AI)的应用领域不断拓展,其中一项引人注目的创新是利用大语言模型(LLMs)来驱动社会模拟游戏中的智能体。然而,这一领域的探索也面临着一个意想不到的挑战:这些由LLMs驱动的NPC(非玩家角色)变得过于啰嗦,缺乏自然互动的真实感。
想象一下,如果教一位外国朋友打麻将时,你选择事无巨细地指导每一步,而不是让他们自主探索,那么他们可能会失去学习和发现的乐趣。同样地,研究者在设计大语言模型社会模拟时,也陷入了类似的误区。例如,在模拟霍布斯的“人人相争”理论时,研究者为智能体编写了详细的“剧本”,如“打不过就投降”或“抢劫比种地更有效就继续抢劫”。这种预设的行为模式虽然确保了实验的“稳妥”,但却剥夺了智能体之间真实互动和创新的可能性。
这种过度指导的问题不仅在于它可能掩盖了真实的社会现象,更在于它可能导致研究者“发现”的社会规律其实只是他们预设的剧本。正如魔术表演中,观众惊叹于魔术师从帽子里掏出的兔子,却未曾想这只兔子本就藏在帽子里。因此,在使用大语言模型研究社会现象时,“少即是多”的原则显得尤为重要。过于详细的指导语可能会遮蔽更有价值的发现,因为现实社会中的精彩故事往往源自于自由互动和不可预测性。
尽管如此,研究者们依然看到了LLMs在社会模拟中的巨大潜力。2024年,一项在arXiv上发表的研究利用LLMs模拟了人类社会的演化过程,并成功复现了霍布斯的利维坦理论。在这个模拟世界中,智能体通过耕种、抢夺、交易或捐赠等行为争夺有限的资源,最终形成了一个由绝对主权者统治的社会秩序。这一实验不仅验证了霍布斯的理论,还展示了LLMs在模拟复杂社会现象方面的潜力。
另一个例子则更加雄心勃勃,罗格斯大学和密歇根大学的研究团队开发了一款名为WarAgent的多智能体系统,通过模拟历史上的重大战争来探索战争是否可以避免。在这个系统中,每个国家智能体都拥有独特的属性,并可以根据实际情况采取多种行动。实验结果显示,该系统能够准确模拟历史上的战略决策过程,并揭示了战争爆发的内在机制。
为了更好地利用LLMs进行社会模拟,研究者们提出了一种新的分类方法和模块化框架——生成式智能体模型(GABM)。GABM通过LLM进行推理和决策,而不是依赖预设的规则。这种方法不仅提高了模拟的真实性,还为研究复杂社会现象提供了有力工具。例如,在模拟办公室着装规范的演化时,GABM可以追踪每个员工的着装选择并记录整体趋势,同时根据员工的性格特征和组织文化等因素生成着装决策。
然而,GABM也面临着一些挑战。其中之一就是如何平衡参数化提示和文本描述提示的使用。参数化提示允许研究者对智能体属性和行为进行精确调整,但可能限制智能体行为的多样性;而文本描述提示则使智能体表现出更复杂和逼真的行为模式,但可能增加结果的不可预测性。因此,研究者需要根据具体的模拟目标和研究需求合理组合这两种方法。
LLMs在理解和处理纯数值参数方面也存在一定的局限性。由于LLMs主要在自然语言文本上进行训练,对纯数值的敏感度相对较低。因此,在使用LLMs进行社会模拟时,研究者需要精心设计提示词以确保智能体能够正确理解并响应数值参数的变化。
最后,值得注意的是,基于LLMs的社会模拟虽然具有巨大的潜力,但也存在一些方法论上的争议。过于直白的指导语可能会削弱研究的生态效度,导致观察到的行为模式更多是研究者的预设而非智能体之间真实的动态交互结果。因此,研究者在设计GABM时应更加谨慎地选择指导语以确保模拟的真实性。
图2. LLMs模拟的世界战争
虽然LLMs在社会模拟中展现出了巨大的潜力但也面临着诸多挑战。研究者需要不断探索新的方法和工具以克服这些挑战并推动该领域的发展。同时,他们也需要保持谨慎和客观以确保模拟结果的真实性和可靠性。
图4. 生成性基于智能体模型(GABM)的概念图
图:流行病患者的生成性智能体模型