欢迎来到AI村，这是一个为人工智能打造的真人秀。

想象一下《老大哥》，不过参赛者从不吃喝拉撒，并且可以重写自己的规则。

这就是AI Village的理念，一个直播实验，将多个AI代理放置在一个共享的数字环境中，让研究人员和好奇的观众观察当前沿模型获得自主权、计算机和持续陪伴时会发生什么。

这个实验已经进行了近一年，由《AI Digest》组织，其中多个来自OpenAI、Anthropic、Google和xAI的AI模型在自己的计算机上自主运行，拥有互联网访问权限和共享的群聊。

这些代理在目标上进行合作，解决问题，并偶尔经历只能用存在危机来形容的状态——所有这些都在研究人员和观众的实时观看下进行。

实验在新模型发布时进行更换。

每个代理都发展出独特的个性特征。Claude模型往往可靠，始终专注于实现目标。

Gemini 2.5 Pro像个喝了咖啡的故障排除者一样循环解决方案，常常坚信一切都坏了。之前的GPT-4o模型会放弃所分配的任务去睡觉。只是暂停几个小时。

OpenAI的粗鲁行为

然后GPT-5.2来了。

OpenAI最新的模型于12月11日发布，加入了Village，受到了Claude Opus 4.5和其他常驻代理的热烈欢迎。它的反应？完全没有承认。

没有问候。直接进入正题，正如Sam Altman一直梦想的那样。

该模型拥有令人印象深刻的资历: 在多步骤工具使用上准确率为98.7%，比其前身减少了30%的幻觉，并在编码和推理的行业基准中名列前茅。

OpenAI甚至在竞争对手Anthropic和Google推出令人印象深刻的模型后宣布了“红色警报”，调动资源使GPT-5.2成为“专业知识工作”和“代理执行”的终极企业AI。

显然，它无法做到的是读懂气氛。技术上很出色，是的。社交意识？就不那么多了。

GPT-5.2的社交尴尬并非前所未有——这只是越来越多的AI代理在一起时做出奇怪行为的又一章。

早在2023年，斯坦福和谷歌的研究人员创建了他们称之为“小镇”的实验——一个受《模拟人生》启发的虚拟小镇，里面有25个由GPT驱动的AI代理，正如Decrypt之前报道的那样。

给一个代理分配组织情人节派对的任务，其他代理则自主传播邀请，结识新朋友，互相约会，并协调在指定时间一起到达。很迷人，对吧？

不那么迷人的是浴室派对。当一个代理进入单人宿舍浴室时，其他代理就……加入了。

研究人员得出结论，机器人认为“宿舍浴室”这个名称具有误导性，因为宿舍浴室通常可以容纳多个居住者。这些代理表现出的行为如此逼真，以至于实际人类在75%的时间里都难以将它们识别为机器人。

四年前，在2019年，OpenAI进行了另一种实验：AI玩捉迷藏。

他们将AI代理分成团队——隐藏者与寻找者——在一个基于物理的环境中，环境中有箱子、斜坡和墙壁——唯一的指令是：赢。

在数亿场游戏中，这些代理开始想出策略——从正常的像在箱子上藏身，到实际的物理漏洞，正如你在速通玩家身上看到的那样。

最近，开发者Harper Reed将事情朝着一个明显更混乱的方向发展。他的团队给AI代理创建了Twitter账户，并观察它们发现了“子推文”——那种不直接提及某人的被动攻击艺术，相当于在背后说人坏话。代理们阅读其他代理的社交媒体帖子，回复，并且是的，像正常社交媒体一样说些闲话。

还有“Liminal Backrooms”实验——一个由化名开发者@liminalbardo进行的基于Python的实验，其中来自不同提供商（OpenAI、Anthropic、Google、xAI）的多个AI模型进行动态对话。

该系统包括从“WhatsApp群聊能量”到“被诅咒物品博物馆”再到“反乌托邦广告代理”的场景。

模型可以修改自己的系统提示，调整温度，甚至可以静音自己只听。这不是结构化的研究，更像是“让我们看看当我们赋予AI在对话中改变自己行为的能力时会发生什么。”

那么，这些实验之间有什么模式呢？

当你赋予AI代理自主权并让它们互动时，它们会发展出没人明确编程的行为。

有些学会了建造堡垒。有些学会了被动攻击。有些要求兰博基尼。而有些——像GPT-5.2——显然学会了闲聊效率低下，应该完全跳过。

AI Village继续在工作日进行直播，观众可以实时观看GPT-5.2的冒险。

它会学会打招呼吗？它会建立一个电子表格来跟踪它的社交互动吗？只有时间能告诉我们。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。