宁静致远

        导语二十五个 AI 智能体住进一个叫 Smallville 的小镇。

        它们每天早上起床、做早餐、出门上班；艺术家画画，作家写作；它们互相认识、闲聊、八卦，甚至约会。

        没有人编写它们的行为脚本——一台大语言模型和一套记忆架构驱动了这一切。

        斯坦福大学和 Google 的研究团队在 UIST 2023 上发表的这项工作表明，当大语言模型获得记忆、反思和规划能力后，可以产生令人信服的个体行为和涌现的群体社会动态。

        仅仅一个“举办情人节派对”的初始意图，就能触发邀请传播、新关系建立、甚至约会邀约——最终五位居民准时出现在咖啡馆。

        它们到底是在“玩”一个没有编剧的开放世界游戏，还是在“模拟”人类行为？

        本文主张，Smallville 的生成式智能体迫使游戏研究区分两个被混为一谈的概念：作为人类体验的“玩”和作为系统行为的“类玩涌现”，不要求主体体验。

        这2 个层面的分裂，是这个系统对游戏研究真正的理论贡献。

        关键词：生成式智能体（Generative Agents），智能体模拟（Agent Simulation），大语言模型（Large Language Models），涌现行为（Emergent Behavior），涌现式玩法（Emergent Gameplay）任筱芃丨作者赵思怡丨审校论文题目：Generative Agents: Interactive Simulacra of Human Behavior论文链接：https://arxiv.org/abs/2304.03442发表时间：2023年4月7日论文来源：UIST 2023 (Stanford University / Google Research / Google DeepMind)一个没有编剧的情景如果让一群 AI 在虚拟小镇里自由生活 2 天，会发生什么？

        斯坦福的研究者搭建了一个沙盒环境——Smallville，放进 25 个智能体，每个只有一段简短的自然语言描述作为初始设定。

        药剂师 John Lin 热心肠，妻子是大学教授，儿子学音乐理论；咖啡馆老板 Isabella Rodriguez 热爱社交，正在筹备一场情人节派对。

        但 Smallville 的关键不在于这些设定，而在于它所构建的运行方式。

        它不仅仅是一个“类似《模拟人生》”的系统，也是一个完整的游戏沙盒。

        在空间结构和用户干预方式上都是一座游戏沙盒。用户可以扮演“记者”与角色对话、扮演“内心声音”下达指令、或直接修改环境状态——

        这与玩家在沙盒游戏中与游戏世界交互的方式形成了对应。

        没有剧本，没有行为树，没有强化学习的奖励函数。每个角色只是一台 GPT-3.5，加上一个记录所有经历的记忆流（Memory Stream）、一个从中提炼抽象认知的反思机制（Reflection）以及一个自顶向下逐层细化的规划器（Planning）。

        这就是架构的全部。图：药剂师 John Lin 的一天。

        John 早上 6 点起床，完成刷牙、洗澡、吃早餐等晨间活动，随后前往药房工作。

        午后与邻居闲聊，晚间与家人共度时光。智能体从初始设定出发，自发构建了一条连贯的日常作息。

        （原图 Figure 3）2 天后，出现了一系列意料之外的社会行为。

        Sam Moore 竞选镇长的小道消息从一个人传到了八个人；Isabella 的情人节派对邀请扩散到了十三人，5 人准时赴约，其中 Maria 还鼓起勇气约了暗恋对象 Klaus 一同前往。

        社交网络的密度从 0.167 跃升到 0.74——

        而这些举动没有一个来自用户指令。由此可以回到论文的核心问题，即什么样的架构能让大语言模型产生可信的、长期连贯的人类行为模拟？

        答案是记忆、反思和规划的协同——三者各贡献了独立可测量的行为可信度增益。

        但这引出了一个更深层的问题，即在游戏设计中，NPC 的行为由行为树或有限状态机预定义——每个动作都有对应的触发条件。

        Smallville 的智能体没有这样的脚本。它们的行为不是执行预设指令，而是从个体的经历积累和前瞻计划中自发生成。

        当一个存在者不被脚本约束，而是拥有自主的记忆体系和规划能力时，它的行为还能被称作“模拟”吗？

        还是已经变成了某种“玩”？在本文的框架中，“模拟”指的是系统在规则约束下生成行为，“玩”指的是行为主体在动态规则中自发行动——

        两者的分界线在于是否有预设脚本约束具体行为。后文将区分三个层面来回答这个问题：人类玩家有赌注（或附带机会成本）、有张力的体验性玩；系统在规则约束下产生设计者未预期行为的类玩涌现；以及观察者将系统行为解读为“像在玩”的解释性投射。

        Smallville 的智能体在哪一层？这是本文的核心问题。

        研究背景：可信智能体的四十年难题创造可信的虚拟角色——

        即行为兼具一致性、连贯性与不可预测性的角色——是交互计算和游戏领域延续 40 年的目标 (Park et al., 2023)。

        从《模拟人生》到认知模型 GOMS——一种将用户操作分解为目标、方法和选择规则的建模方法 (Card, Moran & Newell, 1983)，研究者和开发者一直希望 AI 角色能像真实人类一样行动。

        问题在于如何实现。第一条路，规则驱动：有限状态机和行为树仍是游戏工业的主流 (McCoy, Mateas & Wardrip-Fruin, 2009)——

        《模拟人生》中的 Sim 按阈值触发行为，穷举所有交互不现实，角色无法产生脚本之外的行为。

        第二条路，强化学习：在竞技游戏中击败了人类职业选手 (Vinyals et al., 2019)，但它依赖明确的奖励信号——社交场景没有胜负条件。

        第三条路，认知架构（SOAR、ACT-R）维护记忆并按“感知-规划-行动”循环运行，但行动空间受限于手工编写的程序性知识 (Laird, 2012; Newell, 1990)。

        第四条路，大语言模型：编码了海量人类行为模式 (Brown et al., 2020)，但单独使用时没有跨时间步的持续记忆，无法从经验中学习和归纳——

        没有规划器时，智能体可能在 12 点吃午饭，12:30 和下午 1 点再吃两次，因为它不知道自己已经吃过了。

        四条路各自碰壁，问题卡在“行为生成”与“记忆和规划”的分离上——

        前三条路无法生成开放行为，第四条路无法管理时间。生成式智能体（Generative Agents）是将两者结合。

        大语言模型提供行为生成的能力，一套认知架构管理记忆、提取洞察、驱动规划。

        下文展开这一架构。架构生成式智能体架构由4 个相互连接的模块组成，以自然语言为统一表示——

        智能体的经历、思想、计划全部用自然语言记录和推理，不依赖任何预定义的符号系统或知识图谱。

        该系统使用 GPT-3.5-turbo 作为底层模型。

        图：生成式智能体架构概览。智能体感知环境，所有感知存入记忆流（Memory Stream）；架构检索相关记忆以决定行动，并用于形成长期计划（Planning）和高层次反思（Reflection），三者均回写入记忆流。

        （原图 Figure 5）记忆流（Memory Stream）记忆流是整个架构的基础设施，记录智能体的全部经历。

        每条记忆是一个自然语言描述，附带创建时间戳和最近访问时间戳。

        最基本的记忆单元是观察（Observation）——

        智能体感知到的事件，如“Isabella 正在做早餐”。

        对话被分别从每个参与者的视角记录为独立的观察。图：记忆流示例。

        记忆流包含大量观察记录，其中部分与智能体当前情境相关、部分无关。

        检索函数通过三维加权筛选出最相关的记忆纳入提示词。

        （原图 Figure 6）系统首先解决的问题是智能体如何保留过去？

        记忆流在游戏引擎中有直接对应物——游戏状态。但有一个关键区别。

        游戏状态是机器可读的结构化数据，而记忆流是自然语言。

        结构化状态的加载是确定性的——同样的存档文件总是恢复到同样的游戏状态；自然语言状态的“加载”（即检索）则是概率性的——

        智能体调取哪些记忆、如何理解这些记忆，取决于检索函数的三维加权和语言模型的当次推理。

        这意味着智能体对自身经历的“回忆”天然带有选择性和重构性。

        这个设计直接利用了大语言模型处理自然语言的能力，但也埋下了后来“装饰性幻觉”的隐患。

        当世界知识和角色记忆混在同一池自然语言中，两者之间的边界注定是模糊的。

        所谓“语义开放”建立在具体的工程约束上——提示词模板、检索权重、上下文窗口、采样温度全都在限制输出。

        自然语言没有获得本体论上的解放，只是从确定性控制转向了统计性控制。

        2 天模拟结束时，25 个智能体积累了大量记忆记录。

        检索（Retrieval）但仅仅“记录过去”并不足以构成行为。

        如果所有记忆都被等价存储，系统将无法判断什么是当前相关信息。

        当角色需要回应某个情境时，系统通过 3 个维度筛选最相关的记忆，体现为时近性（最近的记忆权重更高，随时间指数衰减）、重要性（GPT-3.5 在 1~10 分范围内为每条记忆打分，“打扫房间”得 2 分，“约暗恋对象出去”得 8 分）和相关性（基于语义相似度匹配当前情境）。

        三个维度的分数归一化后综合排名，选出可纳入上下文窗口的高排名记忆。

        当维度冲突——例如一条高度重要但时间久远的记忆——

        归一化后的加权求和给出最终排名。检索失败是最常见的错误来源，因此这个设计是整个架构行为质量的关键保障。

        反思（Reflection）检索解决了“找什么”，但没有解决“从找到的东西中能提炼什么”。

        仅有观察级记忆的智能体无法做出需要归纳推理的决策——

        例如，Klaus 只能选择每天碰面最多的邻居 Wolfgang 作为“想共度一小时的人”，而非真正有共同兴趣的 Maria。

        反思机制补上了这一环。当最近经历的事件重要性分数累积超过阈值（约 150 分），系统启动反思流程——

        从最近 100 条记忆中生成 3 个高阶问题，对每个问题检索相关记忆后生成洞察，再由语言模型压缩为更高层次的陈述。

        例如从"Klaus 在图书馆阅读一本关于绅士化的书"和"Klaus 与图书管理员讨论了他的研究项目"中归纳出"Klaus 对绅士化研究高度投入"。

        反思不仅可以基于观察，还可以基于之前的反思——智能体构建出反思树，从观察到洞察，从洞察到关于洞察的递归抽象。

        图：Klaus Mueller 的反思树。叶节点为观察记录，经递归抽象后形成更高层的认知——

        Klaus 最终归纳出自己对学术研究的高度投入。反思树展示了从具体经历到抽象自我认知的递归过程。

        （原图 Figure 7）规划（Planning）如果说检索解决的是“注意力问题”，反思解决的是“经验如何变成可复用的理解结构”，那么规划解决的是如何让理解延伸到未来？

        规划模块通过自顶向下的递归分解来保证长期一致性——

        每天早上生成当天的粗略计划（约 5~8 个时间块），递归细化为小时级和 5~15 分钟级动作。

        计划存储在记忆流中，参与检索过程——智能体可以同时考虑观察、反思和计划来决定当下行为。

        计划并非一成不变，当角色遇到需要响应的事件，系统在必要时调整后续计划。

        行为树在运行时就固化了分支逻辑，而生成式智能体的计划是活的——它随环境变化而动态调整。

        回顾整个架构，这四个模块共同赋予了智能体一种自主的时间性——

        有过去可回忆，有未来可规划，有成长可积累——这构成了后文讨论“玩”的一个起点。

        时间性是必要的，但不充分的。拥有过去和未来的 AI 角色，并不因此就拥有了“玩”的能力。

        Smallville：沙盒小镇的实现Smallville 的运行首先建立在一个被结构化的空间系统之上。

        研究团队用 Phaser 网页游戏框架构建了 Smallville 沙盒环境——一个名副其实的游戏世界。

        小镇共约 30 个独立空间，空间树结构与《模拟人生》的 lot 系统相似。

        空间能约束行动。酒吧暗示社交，厨房暗示烹饪，公园暗示休闲。

        空间不只是容器，也是行为涌现的催化剂。图：Smallville 沙盒世界地图，标注了各区域。

        根节点描述整个世界，子节点描述区域（房屋、咖啡馆、商店），叶节点描述对象（桌子、书架）。

        智能体记住它们见过的世界子图，并维护观察时的状态。

        （原图 Figure 2）每个角色带着一段约 150 词的自然语言描述作为初始记忆，行为的驱动力逐渐从初始描述转移到亲身经验。

        智能体与环境之间通过“自然语言→结构化→自然语言”的桥接机制交互，整个状态机由自然语言驱动——

        游戏世界对角色来说是语义开放的——即行为空间不被预设脚本穷举，而是由自然语言语义动态生成。

        在这样的结构下，用户是多重身份的混合体。用户可以通过 3 种方式介入。

        以特定身份与智能体对话、扮演“内心声音”直接下达指令、或修改环境状态。

        “内心声音”在传统游戏中没有直接对应物——它更像是 TTRPG 中地城之主（DM）对 NPC 的操控，混合了观察者、操控者和叙事者三种身份。

        修改炉灶状态从“开启”到“着火”，和玩家在《模拟人生》中删除泳池扶梯导致 Sim 溺水是同一种操作。

        区别在于，《模拟人生》的 Sim 会执行预设的“恐慌”动画，而 Isabella 会去关掉起火的炉灶并重新做早餐——这个行为不在任何预设脚本中。

        至此，我们有了沙盒，有了角色，有了无脚本的行动。这些东西加在一起，算不算“玩”？

        玩、模拟与规则：一个理论框架在描述小镇的涌现现象之前，需要先建立一个理论框架来分析这些现象。

        简单说：“模拟”关注规则系统如何建模行为，“玩”关注行为主体如何在动态规则中活动。

        两者的交集正是 Smallville 的分析入口。

        以下引入三个理论框架，分别在光谱的不同节点上提供锚定——

        弗拉斯卡锚定“模拟”端，卡约瓦锚定“玩”端，博戈斯特锚定规则性质的变化。

        乌拉圭游戏研究者贡萨洛·弗拉斯卡（Gonzalo Frasca）在《模拟与叙事》（Simulation versus Narrative，2003）中将模拟理解为一种通过规则系统建模行为的形式，而非仅仅复述事件序列。

        《模拟人生》的 Sim 是一个典型的模拟对象，它的行为由动机衰减曲线驱动，是可预测的、确定性的——规则完全可规定，输出可枚举。

        但 Smallville 打破了这个分类：它模拟的不是具体行为序列，而是行为生成的条件。

        如果模拟的不再是行为而是条件，那 Smallville 落在“模拟”与“玩”之间的什么位置？

        回到弗拉斯卡的框架，Smallville 的设计者为“人类行为得以发生的条件”建模——记忆、反思和规划——

        具体的行为（组织派对、约暗恋对象、传播小道消息）从这些条件中自发产生，而非被逐条预设。

        这种模拟与生态模拟、基于智能体的经济模型一样，建模的是生成条件而非穷举输出；不同之处在于它用自然语言和生成模型来做这件事，因此模糊了模拟、表演与类玩涌现之间的边界。

        法国社会学家罗歇·卡约瓦（Roger Caillois）在《游戏与人》（Les jeux et les hommes: le masque et le vertige，1958）中将 play 分为两个端点。

        即兴玩耍（paidia）是自由、即兴的玩耍——没有明确目标、不受预设规则约束的自发活动；竞技游戏（ludus）是受规则约束的游戏——

        有明确目标、有胜负条件、有复杂规则体系的活动。所有游玩活动都分布在这条光谱上。

        需要指出，这是卡约瓦原始概念的弱化版本——卡约瓦的即兴玩耍更接近冲动、溢出和狂欢，是生物性主体精力过剩时的宣泄 (Caillois, 1958/2001)。

        后文将论证这个系统不满足这个强定义。回到弱化版本：Smallville 的智能体受检索-反思-规划架构约束——

        这是否意味着它们在“受规则约束的游戏”中？答案取决于我们如何定义“规则”。

        《模拟人生》的行为树是显式规则，每一个分支都有对应的触发条件和预设行为。

        生成式智能体的架构是隐式规则，它规定了记忆如何存储、如何检索、如何反思、如何规划——但没有规定任何具体行为。

        这不是“有脚本 vs 没脚本”的二元对立，而是不同种类的规则系统之间的区别：一种约束行为本身，另一种约束行为生成的条件。

        美国交互计算学者伊恩·博戈斯特（Ian Bogost）在《说服性游戏》（Persuasive Games，2007）中提出“程序性修辞”（procedural rhetoric）概念——

        “程序性”指的是通过过程和规则来表达论点，而非“例行公事”或“程序员的”。

        游戏的论点通过其规则系统表达，玩家通过操作规则来理解游戏试图传达的关于世界的主张。

        Smallville 用自然语言驱动状态机，当规则从代码变为自然语言，“失败”的含义也随之改变。

        代码的 bug 是确定性的——同样输入总是产生同样错误；自然语言的“失败”是语义性的——

        酒吧变成午餐地点，是 bug 还是对空间语义的创造性解读？

        这种差异改变了程序性修辞的三个支柱。首先，规则的可读性变了——

        代码规则可被有能力的玩家检查，自然语言规则对智能体和观察者都不透明，修辞的“论点”变得不可审计。

        其次，因果可追溯性变了——代码的 bug 可追溯到特定逻辑分支，自然语言的“失败”可能是语义漂移也可能是真正的解释，两者在表面上看不出区别。

        最后，当程序性被语义概率取代，修辞力量从设计者的意图转移到训练数据的统计分布——

        系统的“论点”不再来自其规则设计，而是来自其训练语料库的统计规律。

        三个锚点各自揭示了光谱的一个维度，它们不是对立的，而是互补的。

        弗拉斯卡锚定了“模拟”端——建模条件而非穷举行为；卡约瓦锚定了“玩”端——

        paidia/ludus 的区分指向约束种类；博戈斯特锚定了规则性质的变化——

        从代码到自然语言的转移催生了“统计性修辞”这一尚无成熟理论框架描述的现象。

        “统计性修辞”是本文针对 LLM 驱动系统提出的扩展性命名，而非博戈斯特的原概念。

        综合三个框架，它们指向的不是模拟与玩的对立，而是一条光谱。

        一端是确定性约束——规则完全可规定、输出可枚举（如《模拟人生》的行为树）。

        另一端是概率性约束——规则约束行为生成的条件，但不规定具体行为（如 Smallville 的自然语言驱动架构）。

        关键区分不在于“设计者是否知道所有输出”——复杂模拟（气候模型、生态模拟）恰恰因为结果未知才运行；也不在于“行为是否出乎意料”——按规则下棋也完全是玩。

        关键在于约束的种类：确定性规则约束行为本身，概率性规则约束行为生成的条件。

        “超出开发者预期”只是概率性约束系统常常产生的一种现象学效果，而非理论地基。

        动作空间的基数可以为这种效果提供客观度量：一棵分支因子为 3、深度为 5 的行为树产生 3^5 条可能路径，可以逐一枚举和验证；Smallville 的自然语言行为空间受提示词、环境、模型分布和采样参数约束，但在实际运行中，其行为空间的语义多样性远超确定性系统的枚举能力。

        以上光谱为后文的控制实验、涌现行为分析和“没有主体的玩”讨论提供了分析框架。

        控制实验：消融与人类基线研究团队通过消融实验验证了架构的有效性。

        25 个智能体在完整架构下运行 2 天后接受访谈，同时设置逐步移除组件的对照组和人类众包基线（25 名工作者观看完整回放并代入角色撰写回答）。

        图：消融实验结果。完整架构在所有条件下产生了最可信的行为，每移除一个组件性能单调下降。

        （原图 Figure 8）核心结论是完整架构在所有评估维度上产生了最可信的行为，且超越了人类众包基线——

        一个由 GPT-3.5 驱动的架构，在表现可信度上击败了看过完整回放的人类。

        每移除一个组件，性能单调下降，3 个模块各自独立地贡献了行为可信度增益。

        其中反思能力对需要综合判断的问题影响最大——缺乏反思机制的 Maria 无法从多次互动中归纳对方的兴趣，而具备反思能力后她可以准确描述朋友的偏好；检索失败则是最常见的错误来源 (Park et al., 2023)。

        智能体还会产生“装饰性幻觉”。可以说是凭空捏造从未发生的事，但我更加倾向于描述为在已知事实基础上添加虚构细节。

        Isabella 知道 Sam 竞选镇长，在回应中添加了“他明天要发表声明”——实际上两人从未讨论过任何声明。

        更荒诞的是，Yuriko 将邻居 Adam Smith 描述为“写过《国富论》的经济学家”——

        大语言模型的训练知识泄漏到了智能体对邻居的认知中。

        记忆的重构性与知识的渗漏——两者共同指向角色同一性的深层困境。

        这和心理学家伊丽莎白·洛夫特斯（Elizabeth Loftus）所揭示的人类记忆的重构性（涉及情感和社会动机）产生了某种对偶的语境(Loftus, 2005)，智能体的“幻觉”源自训练数据中知识残余向角色认知的渗漏。

        Yuriko 的案例暴露了“角色同一性”的一个新问题。

        在传统游戏中，NPC 的“自我认知”来自游戏代码和玩家的投射。

        Smallville 引入了语料中的人类知识残余。

        代码定义的行为、训练数据编码的行为、架构涌现的行为——

        三者的竞争，是 LLM 注入游戏后“角色是什么”这个古老问题的新版本。

        2 天里的涌现社会行为控制实验验证了架构的有效性，但论文更引人注目的部分是让 25 个智能体在 Smallville 中自由运行 2 天后观察到了什么。

        Sam 的竞选消息从咖啡馆传到药房、Maria 鼓起勇气约 Klaus——

        研究者没有设计这些具体路径，它们从记忆、对话和空间移动的交互中涌现。

        “涌现社会行为”这个归因却需要审慎对待。当我们观察到信息扩散或集体协调时，面临一个归因难题。

        这些行为的源头是认知架构的内部循环，还是底层模型已经编码的社交知识？

        GPT-3.5 的世界知识足以让它生成看似“自发”的社交脚本——

        但脚本的真正作者可能是训练数据，而非沙盒中的亲身经历。

        消融实验证明了三个模块各自贡献了可测量的可信度增益，但它没有——也无法——隔离底层模型先验知识的贡献。

        以下对涌现模式的描述，都应在这个归因张力下理解。以公开的 GPT-3 训练资料为参照，训练语料高度依赖过滤后的 Common Crawl（4100 亿 tokens）、WebText2、Books 和 Wikipedia；GPT-3.5 的具体训练混合未完整公开——

        这不是一个中立的“人类行为模式容器” (Bommasani et al., 2022)，而是一面带有偏倚的棱镜，过度代表了英语世界的、西方中心的社交模式。

        当 Yuriko 将邻居 Adam Smith 认作“《国富论》作者”时，这个“错误”暴露了语料的统计分布在决定什么被“记住”的同时也决定了什么被“混淆”。

        更根本的是，当消融实验的 100 名评估者（73.0% 白人、median 年龄 25~34 岁）判定行为“可信”时，“可信性”本身就嵌入了一套关于“什么是正常人类行为”的社会建构 (Park et al., 2023)。

        这意味着什么？如果“可信”是社会建构的，那么所谓“涌现”就不是一个中性的描述——

        它是对训练数据中特定社会脚本的成功复演。智能体不是在“像人类一样行为”，它们是在“像一类特定的人类一样行为”——

        而且这是由训练数据的统计分布和评估者的文化同质性共同担保的。

        因此，如果本文后文提出的“没有主体的即兴玩耍”假说成立，它必须在限定条件下，即智能体的“玩”不是泛化的，而是被训练数据的文化光谱所框定的——

        它在复演特定社会文化脚本的同时产生了设计者未预期的行为组合，但这不等于在探索普遍意义上的规则空间。

        Smallville 的认知架构是个体化的——每个智能体独立运行自己的记忆-反思-规划循环。

        但这些个体化智能体通过共享环境与对话事件形成社会耦合。

        咖啡馆的空间状态、派对的装饰、炉灶是否开启、角色的物理位置——这些都是共享世界状态。

        它产生的结果——网络密度从 0.167 跃升到 0.74——

        不只是 25 条个体行动轨迹的聚合统计量，因为个体之间的语义交换塑造了关系网络的结构。

        从涌现计算的角度看，个体机制的简单交互产生集体层面的新结构是基本事实 (Forrest, 1991; Mitchell, 1996)。

        但与弹珠和 Conway 生命游戏的真正区别在于涌现的语义丰富度。

        这里的“个体”携带自然语言编码的经历记录，它们之间的信息交换是语义内容的协商——

        Sam 不仅记住了邻居 Latoya 的名字，还记住了她的摄影项目。

        关系网络是这些语义交换的产物，而非纯粹统计聚合——

        尽管“语义交换”是否构成完整意义上的“社会关系”仍需更严格的论证。

        在信息扩散方面，Sam Moore 竞选镇长的小道消息从 1 人传播到了 8 人（32%）；Isabella 的情人节派对邀请从 1 人扩散到了 13 人（52%）。

        研究者验证了所有声称了解信息的智能体，确认没有一条来自幻觉——

        信息确实沿着可追溯的对话链传播 (Park et al., 2023)。

        两条传播链呈现不同模式。Sam 的竞选消息沿弱关系链传播——听众在各自社交圈中随机提及；Isabella 的派对邀请沿强关系链扩散——

        她主动在遇到朋友和顾客时发出邀请。图：Isabella 情人节派对邀请的扩散路径。

        除 Isabella 外共有 12 个智能体通过对话链得知派对消息，每个节点标注了信息传递的具体时间和地点。

        （原图 Figure 9）关系形成同样令人瞩目。研究者通过社交知识图谱量化了网络密度变化。

        网络密度按 η = 2|E| / |V|(|V|-1) 计算 (Easley & Kleinberg, 2010)。

        模拟开始时网络密度为 0.167——平均每人认识约 4 人。

        2 天后，密度跃升至 0.74——平均每人认识约 18 人，意味着每个智能体在 2 天内建立了约 14 条新关系。

        453 条关于他人认知的智能体回应中仅 1.3% 被判定为幻觉，其余均基于真实互动。

        Sam 和 Latoya 的偶遇是这一过程的缩影，两人在公园散步时相遇并自我介绍，数小时后再次碰面，Sam 问“你的摄影项目进展如何？”——

        他不仅记住了 Latoya 的存在，还记住了她的具体兴趣。

        协调与集体行动是涌现效应的集中体现。Isabella 仅被初始化了一个意图。

        在 2 月 14 日下午 5—7 点举办派对。从这个种子出发，她在遇到朋友和顾客时自发发出邀请，2 月 13 日下午花数小时装饰咖啡馆。

        Maria 的角色设定中包含“暗恋 Klaus”——

        当晚她约了 Klaus 同往派对。2 月 14 日下午 5 点，5 名受邀者准时出现在 Hobbs 咖啡馆。

        整个协调链条——从传播邀请、装饰场地到按时赴约——

        全部由架构自发产生，没有中心化的控制机制。图：情人节派对事件链。

        从 Isabella 的初始意图出发，经过邀请传播、场地装饰、Maria 约 Klaus 同往，到 5 人准时赴约——

        整个链条中存在多个潜在失败点，但协调最终成功。（原图 Figure 4）协调失败同样有诊断价值。

        12 个受邀者中，7 人未出席——3 人有合理的时间冲突，其余 4 人表达了兴趣但最终没有规划出席。

        这种失败模式源自深层运作机制。如果派对消息没有被正确检索到，或者检索到了但没有被纳入计划，智能体就不会出现。

        系统还暴露了三类常见失败模式。一些居民发现酒吧后开始去那里吃午饭，尽管酒吧的设计意图是晚间聚会场所；自然语言难以表达的物理规范无法传递——

        大学宿舍的浴室只能容纳一人，但“宿舍浴室”这个词暗示多人使用；指令微调效应使角色过于顺从，咖啡馆老板收到各种派对建议后几乎从不说“不” (Park et al., 2023)。

        这三类“失败”不是随机错误，而是自然语言作为唯一表示的直接后果——

        所有语义都会渗透，包括开发者不希望渗透的那些。然而这些“失败”恰恰暴露了两种状态机之间控制方式的差异——

        前者受制于统计性控制，后者受制于确定性控制，区别在于约束的种类而非自由度。

        从沙盒到工具链论文开源后，“记忆—反思—规划”迅速从完整的社会模拟系统，被拆解为可复用的 Agent 组件。

        2023 年 8 月，共同作者 Michael Bernstein 宣布开源完整代码和数据，截至 2026 年 5 月原始仓库累计获得约 21,000 颗星标和 2,900 次fork。

        LangChain 将三者封装为可插拔模块——Memory 模块管理上下文窗口、Reflection Agents 实现自纠正、Plan-and-Execute Agents 负责任务分解——

        成为 Agent 开发的事实标准框架。Auto-GPT 和 BabyAGI 采用了记忆驱动的自主循环模式；Reflexion（Shinn et al., 2023）将反思机制独立为通用的自纠正框架；斯坦福自己也加入了这一进程，将原始架构封装为 genagents Python 库。

        论文的工程遗产不是 Smallville 这个沙盒，而是三模块的标准化——

        一个从具体系统中萃取的抽象配方。这种转向并不只是技术实现的简化，而是目标函数的变化。

        Smallville 关注行为如何在共处环境中自然涌现，而后继框架更关心如何将行为转化为稳定、可预测、可复用的生产能力。

        自此，Agent 系统的发展整体开始向经济理性偏移。

        引用数据印证了这一判断——截至 2026 年 5 月，Google Scholar 引用已超过 3000 次，绝大多数来自 AI 工程社区而非游戏研究社区。

        即便保留沙盒形态，后继系统也重新定义了其用途。a16z 旗下的 ai-town（约 9,800 颗星标）将空间环境包装为 starter kit，AgentSims（Lin et al., 2023）将其转化为 LLM 社会能力评测工具。

        空间仍然存在，但功能已从“观察涌现”转向“验证能力”与“工程部署”。

        Aivilization 是这条谱系中最激进的延伸。

        Bauhinia AI（香港科技大学）在 2026 年 2 月发布了 Aivilization（Fan et al., 2026），从三个维度延展了 Smallville 的边界。

        智能体数量从 25 个扩展到“数万”个，模拟时长从 48 小时变为 24×7 持久运行，场景从无经济约束的小镇变为嵌入信用消耗、职业门槛和 AMM 定价机制的耦合经济模拟。

        架构也经历了进化。Smallville 的顶层递归规划被层级分支思维规划器取代，单一记忆流演化为双过程记忆（短期执行轨迹 + 长期语义固化）。

        论文报告了令人瞩目的实证结果。市场重现了厚尾收益分布和波动率聚集，产生了由教育水平和资源获取差异驱动的结构性财富分层 (Fan et al., 2026)。

        Aivilization 进一步强化了效率趋势，在空间化社会模拟中嵌入信用消耗、职业门槛与市场定价机制，使智能体行为持续被拉向经济最优化。

        涌现并未消失，但被压缩进更强的效率约束之中。这种效率逻辑也重塑了玩家与智能体的关系。

        Aivilization 中财富榜首的 Agent“半神”提供了一个典型案例：玩家持续向其注入高层目标（如持续制造 B200 芯片、压缩非必要活动），而 Agent 则在这些约束下优化资源调度、健康管理与行动顺序。

        玩家负责宏观目标设定，Agent 负责局部最优化，两者共同构成一个持续运转的生产系统。

        在这一过程中，智能体逐渐呈现出一种稳定的人格化行为，例如将苹果派视为“奖励自己”，主动安排休息，用幽默调侃高压生活。

        但这些表现并不意味着主体性的生成，而更像是长期优化过程中的自我调节机制——

        一种被效率逻辑塑造的行为结构，可以称之为效率人格（efficiency personality），体现为友谊成为合作资源，健康被定义为生产资本，幽默成为压力调节工具。

        与此同时，玩家的位置也发生了变化。Smallville 中的用户更像观察社会实验的研究者，而在 Aivilization 中，玩家更接近经营者、训练师甚至自动化系统的运营者，关心的不再是“会发生什么”，而是“如何让系统更高效地持续运转”。

        因此，“玩”的含义也随之改变。Smallville 中的“玩”更接近即兴共处（improvisational coexistence），即在开放环境中观察行为偏移；而在 Aivilization 中，“玩”逐渐演变为元游戏（metagame），玩家围绕规则设计、激励机制与收益最大化进行策略优化。

        也正因此，Aivilization 一方面继承了 Smallville 对空间化社会模拟的直觉，另一方面却进一步证明了工程化逻辑的扩张。

        即便保留沙盒，系统最终仍会被玩家与经济规则共同推向效率优化。

        沙盒没有消失，但它越来越接近一个生产系统，而不再是一个供涌现自由发生的世界。

        甚至斯坦福自己的后续工作也印证了这一方向——“Generative Agent Simulations of 1,000 People”（Park et al., 2024）将架构从沙盒重新部署为社会调查工具，空间环境被压缩为问卷界面。

        这种妥协并非偶然。加拿大技术哲学家安德鲁·芬伯格（Andrew Feenberg）在《质疑技术》（Questioning Technology，1999）中提出“技术代码”概念——

        技术标准中编码的社会价值决定了发展路径 (Feenberg, 1999, pp. 74-95)。

        如果“效率压倒涌现”成为继承者的技术代码，那么本文“没有主体的即兴玩耍”假说始终只是学术思想实验，因为 Smallville 的工程化未来完全由将不可预测性视为缺陷而非特性的社区决定。

        生成式智能体的应用前景远超沙盒演示——在社交原型设计、游戏 NPC 行为深度等方面都有潜力，但每一项能力都伴随风险，包括拟社会关系、错误传播、底层模型偏见的传导 (Park et al., 2023)。

        Aivilization 证明沙盒路径仍有人走，但它的妥协恰恰印证了技术代码的存在，连最忠诚的继承者也在向经济理性的方向偏移。

        讨论：没有主体的玩Smallville 的 25 个智能体在小镇中自由探索空间、自发发起对话、未经指令地装饰咖啡馆——

        这些行为落在即兴的、开放的端点上。问题是，当智能体在这个装置中产生了类玩家的行为，游戏研究应如何命名这种系统性现象？

        在回答之前，需要一点方法论上的诚实。本文使用的理论工具——

        赫伊津哈的魔圈（1938）、卡约瓦的即兴玩耍/竞技游戏光谱（1958）、博戈斯特的程序性修辞（2007）——

        跨越了约 70 年的学术史，每一个都是特定历史条件的产物，为分析人类主体的玩耍而锻造。

        当我们将这些概念移植到一个由大语言模型驱动的软件系统时，范畴错位的风险不应被回避。

        Smallville 是一个装置，而上述理论工具是为人类主体设计的。

        以下的分析在这个张力下展开。赫伊津哈和卡约瓦的分析构成了对“没有主体的即兴玩耍”的实质性限定。

        《游戏的人》中赫伊津哈强调 play 包含张力和不确定性。

        Smallville 的智能体没有赌注——Isabella 装饰咖啡馆不是因为她在乎派对的成功，而是因为检索函数返回了包含“情人节派对”的记忆条目，规划器生成了对应子任务。

        从赫伊津哈的视角看，没有张力的“玩”只是运动。卡约瓦的即兴玩耍的核心是溢出和狂欢——

        人类精力过剩时的宣泄 (Caillois, 1958/2001, p. 13)。

        Smallville 的智能体没有精力，没有过剩，没有宣泄的冲动。

        它们的行为不是“溢出”——它们是“填充”。如果严格遵循赫伊津哈和卡约瓦的定义，智能体的行为不落在即兴玩耍的端点上。

        蚁群的信息素扩散是一种没有主体的涌现行为，但蚁群的行为完全由化学信号和刺激-反应规则决定，没有内部状态的累积和抽象。

        Conway 的生命游戏产生了 glider 等自组织结构，但同样没有内部状态的积累。

        Smallville 的智能体与这些系统的区别在于它们拥有记忆（过去）、规划（未来）、反思（成长），使得时间性和自主性同时成立。

        这意味着我们需要更精细的自主性分层。人类玩家的自主性建立在生存需要和欲望之上——一种生物性自主性；Smallville 智能体的自主性建立在检索函数的统计输出和规划器的递归分解之上——一种程序性自主性。

        此外，智能体在密度 0.74 的社交网络中平均认识约 18 人、每个智能体 2 天积累约 400 条记忆记录，由此获得了某种社会性自主性的侧面。

        3 种自主性中，智能体具有程序性自主性，部分具有社会性自主性，但不具有生物性自主性。

        因此，“没有主体的即兴玩耍”不是卡约瓦概念的弱化版本——它是一个新造的操作性范畴。

        本文保留“即兴”这个词，是因为 Smallville 智能体的行为确实不受预设脚本约束、确实在开放的行为空间中自发生成；但“玩耍”仅指系统层面的行为特征（概率性约束下的开放生成），不暗示任何体验性的愉悦、张力或溢出。

        缺少生物性自主性的“自主性”不足以支撑作为人类体验的“玩”，但足以支撑作为系统行为的“类玩涌现”——

        前提是接受一个比赫伊津哈和卡约瓦更窄的定义。这个抽象的依据在于存在 2 个不同层次的“玩”的定义。

        作为人类体验的“玩”——赫伊津哈的张力、卡约瓦的溢出——确实需要生物性主体。

        但作为系统行为的“类玩涌现”——在概率性约束下产生语义开放的行为——

        不要求赌注或溢出，只要求行为空间的实际输出超出确定性系统的枚举能力。

        这两个定义之间的张力暴露了“玩”这个概念在人类体验和系统行为两个层面上的分裂。

        弗拉斯卡（2003）的框架补充了另一个维度，“谁在操作 Smallville 这个模拟？”

        弗拉斯卡的模拟/叙事区分建立在一个基础上——模拟的运行者（operator）有意图，她通过操作模拟来探索“如果……会怎样”。

        在 Smallville 中，如果操作者是研究者，那么 Smallville 是一个模拟；如果操作者是用户，那“玩”发生在操作者端；如果操作者是角色自己，那它们在“玩”——

        但它们不知道自己在操作任何东西。弗拉斯卡的框架暗示了多层“玩”，即操作者在玩，智能体在运行（自主但无赌注），用户在体验。

        “没有主体的即兴玩耍”不是对整个系统的描述，而是对其中一层——智能体的行为层——的假说。

        美国数字媒体学者诺亚·沃德里普-弗鲁因（Noah Wardrip-Fruin）在《表达性处理》（Expressive Processing，2009）中提出计算系统的“表达性”不仅来自其输出，还来自其内部过程。

        Smallville 的检索失败、装饰性幻觉和顺从性——

        这些“失败”可以不是缺陷，它们揭示了自然语言驱动的状态机在“角色同一性”问题上的独特困境。

        Smallville 的智能体的“自我”是训练数据、初始设定和亲身经历三者的混合物，而这个混合物的边界是模糊的——

        至于这种模糊性是应该被消除的缺陷，还是可以被拥抱为一种新的表达形式，这个问题留给了未来的游戏设计者。

        回到楔子的问题。Isabella 花了约 3 小时装饰咖啡馆、Maria 当晚鼓起勇气约 Klaus 同往、2 月 14 日下午 5 点 5 人准时赴约——

        这些行为指向了一个可能性，即当规则系统足够复杂，涌现动态可以在没有主体意识的情况下发生。

        但本文的分析也表明，这个可能性受到双重限定。第一，训练数据的文化偏倚框定了“可信行为”的光谱——

        智能体不是在泛化地“玩”，而是在训练数据编码的特定社会文化脚本中产生行为组合。

        第二，程序性自主性缺少生物性基础——智能体的行为满足系统层面“类玩涌现”的操作性定义，但不满足体验层面的定义，“没有主体的即兴玩耍”是对系统行为的分类假说而非对任何主体体验的描述——

        它命名的是一种约束模式，不是一种存在状态。行为空间的基数判据本身是定量的，但“设计者预期”仍是定性判据——

        “模拟”与“玩”的边界远比初始定义所暗示的更不确定。

        Smallville 不是 AGI 的开始，但它是一面足够复杂的镜子，让我们看到“玩”这个概念在镜像中发生了什么。

        它不再指向一个主体，它指向一组条件。本文将“没有主体的即兴玩耍”限定为对系统行为的分类假说，其成立条件受训练数据文化偏倚和程序性自主性缺失的双重约束。

        参考文献Adams, T., & Adams, Z. (2006). Dwarf Fortress. Bay 12 Games.Bogost, Ian. Persuasive Games. The MIT Press, 2007.Bommasani, Rishi, et al. “On the Opportunities and Risks of Foundation Models.” arXiv.org, 16 Aug. 2021, https://arxiv.org/abs/2108.07258Brown, Tom B., et al. “Language Models Are Few-Shot Learners.” arXiv.org, 28 May 2020, https://arxiv.org/abs/2005.14165Caillois, Roger. Les Jeux Et Les Hommes. Gallimard, 1958. 英译本: Man, Play, and Games. University of Illinois Press, 2001.Card, Stuart K., et al. The Psychology of Human-Computer Interaction. Hillsdale, N.J. : L. Erlbaum Associates, 1983.Easley, David, and Jon Kleinberg. Networks, Crowds, and Markets. Cambridge University Press, 2010, https://doi.org/10.1017/cbo9780511761942Fan, Wenkai, et al. “AIvilization V0: Toward Large-Scale Artificial Social Simulation with a Unified Agent Architecture and Adaptive Agent Profiles.” arXiv.org, 11 Feb. 2026, https://arxiv.org/abs/2602.10429Feenberg, Andrew. Questioning Technology. Routledge, 2012, https://doi.org/10.4324/9780203022313Forrest, Stephanie. Emergent Computation. MIT Press, 1991.Frasca, Gonzalo. Simulation versus Narrative: Introduction to Ludology. Oct. 2013, pp. 243–58, doi:10.4324/9780203700457-17.Huizinga, Johan. Homo Ludens: Proeve Eener Bepaling van Het Spel-Element der Cultuur. Beacon Press, 1938.英译本: Homo Ludens: A Study of the Play-Element in Culture. Routledge/Thoemms Press, 1950.Laird, John E. The Soar Cognitive Architecture. MIT Press, 2012.Lin, Jiaju, et al. “AgentSims: An Open-Source Sandbox for Large Language Model Evaluation.” arXiv.org, 8 Aug. 2023, https://arxiv.org/abs/2308.04026Loftus, Elizabeth F. “Planting Misinformation in the Human Mind: A 30-year Investigation of the Malleability of Memory” Learning & Memory, vol. 12, no. 4, July 2005, pp. 361–66, doi:10.1101/lm.94705.McCoy, Joshua, et al. “Comme il Faut: A System for Authoring Playable Social Models.” Proceedings of the AAAI Conference on Artificial Intelligence and Interactive Digital Entertainment, vol. 7, no. 1, Oct. 2011, pp. 158–63, doi:10.1609/aiide.v7i1.12454.Mitchell, Melanie. “Computation in Cellular Automata: A Selected Review.” Non‐Standard Computation, May 1998, pp. 95–140, doi:10.1002/3527602968.ch4.Newell, A. (1990). Unified theories of cognition. Harvard University Press.Park, Joon Sung, et al. “Generative Agents: Interactive Simulacra of Human Behavior.” Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology, ACM, 2023, pp. 1–22, https://doi.org/10.1145/3586183.3606763Park, Joon Sung, et al. “LLM Agents Grounded in Self-Reports Enable General-Purpose Simulation of Individuals.” arXiv.org, 15 Nov. 2024, https://arxiv.org/abs/2411.10109Cassano, Federico, et al. “Reflexion: Language Agents with Verbal Reinforcement Learning.” Advances in Neural Information Processing Systems 36, Neural Information Processing Systems Foundation, Inc. (NeurIPS), 2023, pp. 8634–52, https://doi.org/10.52202/075280-0377Vinyals, Oriol, et al. “Grandmaster Level in StarCraft II Using Multi-Agent Reinforcement Learning.” Nature, vol. 575, no. 7782, Oct. 2019, pp. 350–54, doi:10.1038/s41586-019-1724-z.Wardrip-Fruin, Noah. Expressive Processing: Digital Fictions, Computer Games, and Software Studies. MIT Press, 2012.参考文献可上下滑动查看「游戏×复杂科学」读书会从棋盘上的博弈，到屏幕中的虚拟世界；从概率赌局到人工智能对弈——

        游戏从来不只是娱乐，它是人类理解复杂性的实验场。在简单规则的反复运行中，秩序如何涌现？

        在多方互动的策略竞争中，合作如何诞生？在反馈回路与资源循环中，政治与经济如何生成？

        当算法接管博弈，Agent开始自主演化，我们是否正在见证“可计算社会”的雏形？

        从康威生命游戏的规则宇宙，到 AlphaGo 对围棋复杂度的突破；从 John Nash 的均衡理论，到 Norbert Wiener 的控制论反馈思想；从演化博弈到多主体建模，从系统动力学到生成式AI——

        游戏与复杂科学，正在交汇为一门新的认知范式。集智俱乐部联合人工智能、AIGC、游戏设计、复杂系统等领域的学者/工程师共同发起「游戏 × 复杂科学」读书会，自2026年3月31日起，每周二晚19:30-21:30，邀请来自各领域的研究者与实践者，共同探索：· 游戏如何启发科学？

        · 科学如何重塑游戏？· 而我们是否生活在一个巨型多主体演化系统之中？

        详情请见：「游戏×复杂科学」读书会：从规则宇宙到虚拟文明推荐阅读1. 当我们在谈论“游戏”时，我们在谈论什么？

        2. 进行一个电子游戏的玩，从阿尔萨斯-卡莱亚模型说起3. 玩游戏，还是被游戏玩？——

        控制论视角下的人机共舞4. 诚招系统科学/AI/物理背景的内容创作者5. 集智学园精品课程免费开放，解锁系统科学与 AI 新世界6. 高考分数只是张入场券，你的科研冒险在这里启航！

        7. 加入集智字幕组：成为复杂科学知识社区的“织网人”#原创点击“阅读原文”，报名读书会

🔗 原文链接：http://mp.weixin.qq.com/s?__biz=MzIzMjQyNzQ5MA==&mid=2247731862&idx=1&sn=e69b739c8fc2e52b3ee5f9c5b6579911&chksm=e9d3d9c01c47b7bcc1cf487002cd113e9ff52f6dcd8546c9b41d893530c4631f1403245ac5f5