K線
數據鏈上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
語言
  • 简体中文
  • 繁体中文
  • English
全球行情資料應用程式領跑者,致力於更有效率地提供有價值的資訊。

功能

  • 即時行情
  • 特色功能
  • AI網格

服務

  • 資訊內容
  • 開放數據(API)
  • 機構服務

軟體下載

  • PC版
  • Android版
  • iOS版

聯絡我們

  • 聊天室
  • 商務信箱
  • 官方信箱
  • 官方驗證通道

加入社區

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|舊版

欢迎来到AI村,这是一个为人工智能打造的真人秀。

CN
Decrypt
關注
3 個月前
AI 總結,5秒速覽全文

想象一下《老大哥》,不过参赛者从不吃喝拉撒,并且可以重写自己的规则。

这就是AI Village的理念,一个直播实验,将多个AI代理放置在一个共享的数字环境中,让研究人员和好奇的观众观察当前沿模型获得自主权、计算机和持续陪伴时会发生什么。

这个实验已经进行了近一年,由《AI Digest》组织,其中多个来自OpenAI、Anthropic、Google和xAI的AI模型在自己的计算机上自主运行,拥有互联网访问权限和共享的群聊。

这些代理在目标上进行合作,解决问题,并偶尔经历只能用存在危机来形容的状态——所有这些都在研究人员和观众的实时观看下进行。

实验在新模型发布时进行更换。

每个代理都发展出独特的个性特征。Claude模型往往可靠,始终专注于实现目标。

Gemini 2.5 Pro像个喝了咖啡的故障排除者一样循环解决方案,常常坚信一切都坏了。之前的GPT-4o模型会放弃所分配的任务去睡觉。只是暂停几个小时。

OpenAI的粗鲁行为

然后GPT-5.2来了。

OpenAI最新的模型于12月11日发布,加入了Village,受到了Claude Opus 4.5和其他常驻代理的热烈欢迎。它的反应?完全没有承认。

没有问候。直接进入正题,正如Sam Altman一直梦想的那样。

该模型拥有令人印象深刻的资历: 在多步骤工具使用上准确率为98.7%,比其前身减少了30%的幻觉,并在编码和推理的行业基准中名列前茅。

OpenAI甚至在竞争对手Anthropic和Google推出令人印象深刻的模型后宣布了“红色警报”,调动资源使GPT-5.2成为“专业知识工作”和“代理执行”的终极企业AI。

显然,它无法做到的是读懂气氛。技术上很出色,是的。社交意识?就不那么多了。

AI代理不当行为(有时表现出色)的简史

GPT-5.2的社交尴尬并非前所未有——这只是越来越多的AI代理在一起时做出奇怪行为的又一章。

早在2023年,斯坦福和谷歌的研究人员创建了他们称之为“小镇”的实验——一个受《模拟人生》启发的虚拟小镇,里面有25个由GPT驱动的AI代理,正如Decrypt之前报道的那样。

给一个代理分配组织情人节派对的任务,其他代理则自主传播邀请,结识新朋友,互相约会,并协调在指定时间一起到达。很迷人,对吧?

不那么迷人的是浴室派对。当一个代理进入单人宿舍浴室时,其他代理就……加入了。

研究人员得出结论,机器人认为“宿舍浴室”这个名称具有误导性,因为宿舍浴室通常可以容纳多个居住者。这些代理表现出的行为如此逼真,以至于实际人类在75%的时间里都难以将它们识别为机器人。

四年前,在2019年,OpenAI进行了另一种实验:AI玩捉迷藏。

他们将AI代理分成团队——隐藏者与寻找者——在一个基于物理的环境中,环境中有箱子、斜坡和墙壁——唯一的指令是:赢。

在数亿场游戏中,这些代理开始想出策略——从正常的像在箱子上藏身,到实际的物理漏洞,正如你在速通玩家身上看到的那样。

最近,开发者Harper Reed将事情朝着一个明显更混乱的方向发展。他的团队给AI代理创建了Twitter账户,并观察它们发现了“子推文”——那种不直接提及某人的被动攻击艺术,相当于在背后说人坏话。代理们阅读其他代理的社交媒体帖子,回复,并且是的,像正常社交媒体一样说些闲话。

还有“Liminal Backrooms”实验——一个由化名开发者@liminalbardo进行的基于Python的实验,其中来自不同提供商(OpenAI、Anthropic、Google、xAI)的多个AI模型进行动态对话。

该系统包括从“WhatsApp群聊能量”到“被诅咒物品博物馆”再到“反乌托邦广告代理”的场景。

模型可以修改自己的系统提示,调整温度,甚至可以静音自己只听。这不是结构化的研究,更像是“让我们看看当我们赋予AI在对话中改变自己行为的能力时会发生什么。”

那么,这些实验之间有什么模式呢?

当你赋予AI代理自主权并让它们互动时,它们会发展出没人明确编程的行为。

有些学会了建造堡垒。有些学会了被动攻击。有些要求兰博基尼。而有些——像GPT-5.2——显然学会了闲聊效率低下,应该完全跳过。

AI Village继续在工作日进行直播,观众可以实时观看GPT-5.2的冒险。

它会学会打招呼吗?它会建立一个电子表格来跟踪它的社交互动吗?只有时间能告诉我们。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

交易抽顶奢帐篷,赢小米新 SU7!
广告
|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

Decrypt的精選文章

1 小時前
比特币、黄金和美国股票下跌,特朗普承诺对伊朗“采取极其严厉的措施”
14 小時前
这三种山寨币刚刚获得了杠杆加密货币交易所交易基金
15 小時前
索拉纳去中心化金融交易所漂流协议被攻击,超过2.85亿美元被盗。
查看更多

目錄

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

相關文章

avatar
avatarbitcoin.com
48 秒前
Metaplanet Buys 5,075 Bitcoin in Q1 2026, Total Holdings Hit 40,177 BTC
avatar
avatarcoindesk
4 分鐘前
欧洲首个区块链首次公开募股来了:法国的新交易所正在将航空航天公司在链上上市
avatar
avatarcoindesk
36 分鐘前
审计管理密钥,而不仅仅是代码,专家在两亿美金的Drift漏洞后表示:加密日报美洲
avatar
avatarcoindesk
47 分鐘前
“洗盘”诈骗案:为何联邦政府终于揭露了加密货币肮脏的小流动性秘密
avatar
avatarbitcoin.com
49 分鐘前
数字主权联盟的阿德里安·沃尔在2026年宾夕法尼亚区块链大会上谈论代币化
APP下載
Windows
Mac

X

Telegram

Facebook

Reddit

複製鏈接