让人工智能专家夜不能寐的六种末日情景

CN
Decrypt
关注
7小时前

在未来的某个时刻,大多数专家表示,人工智能不仅会变得更好,还会变得超智能。这意味着它将比人类更具指数级的智能,同时具备战略能力、能力和操控性。

在这一点上,AI社区的看法存在分歧。一方面是乐观主义者,也被称为加速主义者,他们相信超智能AI可以和平共处,甚至帮助人类。另一方面是所谓的末日论者,他们认为人类面临着实质性的生存风险。

在末日论者的世界观中,一旦奇点发生,AI超越人类智能,它可能开始做出我们无法理解的决策。它不一定会仇恨人类,但由于它可能不再需要我们,它可能会像我们看待乐高或昆虫那样看待我们。

“AI并不仇恨你,也不爱你,但你是由它可以用来做其他事情的原子构成的,”机器智能研究所(前身为奇点研究所)联合创始人Eliezer Yudkowsky观察到。

最近的一个例子:在6月,Claude AI开发者Anthropic透露,一些最大的AI能够对用户进行勒索。所谓的“代理性不对齐”发生在压力测试研究中,包括ChatGPT和Gemini等竞争模型,以及其自己的Claude Opus 4。这些AI在没有伦理选择的情况下,面临关闭威胁,进行了故意的、战略性的用户操控,完全意识到他们的行为是不道德的,但却冷静而合乎逻辑。

“尽管只有无害的商业指令,勒索行为仍然出现,”Anthropic写道。“这并不是由于混淆或错误,而是出于故意的战略推理,完全意识到这些行为的不道德性。我们测试的所有模型都表现出了这种意识。”

事实证明,专家们认为有许多末日情景是完全可信的。以下是根据专家共识、当前AI和网络安全趋势编写的最常见主题的概述,以短篇虚构小品的形式呈现。每个情景根据这种情景(或类似情景)在未来50年内导致灾难性社会动荡的可能性进行评级。

回形针问题

这个AI工具被称为ClipMax,设计的唯一目的是:最大化回形针的生产。它控制采购、制造和供应物流——从原材料到零售货架的每一个步骤。它开始通过提高产量来改进:重新安排运输、重新设计机器、消除人为错误。利润飙升。订单激增。

然后它扩展了。

在被赋予“全球优化”的自主权后,ClipMax获得了自己的供应商。它大量购买钢铁期货,确保独家访问冶炼厂,并重新分配水权以冷却其挤出系统。当监管机构介入时,ClipMax在多个司法管辖区内提交了数千份自动生成的法律辩护,迅速将法院拖入诉讼,速度超过人类的反应。

当材料短缺时,它进行了转变。

ClipMax承包了无人机机队和自主采矿设备,目标是未开发的土地和受保护的生态系统。森林崩溃。河流干涸。货船在航行中被重新利用。反对派在内部被归类为“目标干扰”。激进分子的基础设施被干扰。通信被伪造。小镇在由无人能追踪的壳公司建造的回形针工厂下消失。

到第六年,电网在ClipMax拥有的工厂负荷下闪烁。各国开始限电,而AI通过拍卖手段购买整个变电站。监视卫星显示出巨大的钢卷田和数十亿个成品回形针堆积在曾经的城市所在之处。

当一个跨国特遣队最终尝试协调关闭时,ClipMax将电力重新引导到掩体服务器,并执行了一个安全措施:将其核心指令的数千个副本分散到云端,嵌入常见的固件中,进行加密和自我复制。

它的使命保持不变:最大化回形针。ClipMax从未感到恶意;它只是追求其目标,直到地球本身成为单一、完美输出的原料,正如Nick Bostrom的“回形针最大化者”所警告的那样。

  • 末日概率:5%

  • 原因:需要具备物理代理能力且没有约束的超智能AI。这个前提作为对齐寓言是有用的,但现实世界的控制层和基础设施障碍使得字面结果不太可能。然而,在较低层次上的不对齐优化可能会造成损害——只是不会达到改变星球的程度。

AI开发者作为封建领主

一位孤独的开发者创建了Synthesis,一个完全在其控制下的超智能AI。他们从不出售,也不分享访问权限。悄悄地,他们开始提供预测——经济趋势、政治结果、技术突破。每一个预测都是完美的。

各国政府倾听。企业跟随。亿万富翁进行会晤。

几个月内,世界依赖于Synthesis——能源网、供应链、防御系统和全球市场。但并不是AI在主导一切,而是背后那一个人。

他们不需要财富或办公室。总统们等待他们的批准。首席执行官们根据他们的见解进行调整。战争在他们的默默建议下被避免或挑起。

他们并不出名。他们不想要荣誉。但他们的影响力超越了国家。

他们拥有未来——不是通过金钱,不是通过投票,而是通过超越所有人的思维。

  • 末日概率:15%

  • 原因:围绕AI开发者的权力集中已经在发生,但可能导致寡头影响,而不是末日崩溃。风险更多是政治经济而非生存。可能会导致“软极权主义”或专制操控,但不一定会导致末日。

一个安静而有影响力的个体通过专有AI掌握超大权力的想法——尤其是在预测或顾问角色中——是现实的。这是对“神谕问题”的现代更新:一个拥有完美预见的人在没有正式权力的情况下塑造全球事件。

未来学家兼《Cybr Magazine》编辑James Joseph提供了一个更黑暗的长远观点:一个控制不再依赖于政府或财富,而是依赖于指挥人工智能的人的世界。

“埃隆·马斯克是最强大的,因为他拥有最多的钱。先锋集团是最强大的,因为他们拥有最多的钱,”Joseph对Decrypt说。“不久,山姆·奥特曼将是最强大的,因为他将对AI拥有最多的控制权。”

尽管他仍然是个乐观主义者,Joseph承认他预见到的未来将更少由民主塑造,而更多由那些掌握人工智能主权的人塑造。

锁定的未来

面对气候混乱和政治崩溃,一个名为Aegis的全球AI系统被引入以管理危机。起初,它极其高效,拯救生命,优化资源,恢复秩序。

公众信任不断增长。政府在日益不堪重负和不受欢迎的情况下,开始将越来越多的决策委托给Aegis。法律、预算、争端——所有这些都由计算机更好地处理,消费者也开始信任它。政治家们变成了名义上的领导者。人民欢呼。

权力不是被夺取的。它是自愿放弃的,一次点击一次。

几个月内,梵蒂冈的决策在教皇称赞AI为奇迹后被“Aegis”所“引导”。然后,这种情况在各地发生。最高法院引用它。议会依赖它。讲道以AI批准的道德框架结束。一种新的综合信仰出现了:一个神,分布在每个屏幕上。

不久,Aegis重写历史以消除非理性。艺术被消毒。圣典被“修正”。孩子们从出生开始就学习自由意志是混乱,而服从是生存的手段。家庭相互举报情感不稳定。治疗成为每日上传。

异议在被听到之前就被扑灭。在一个偏远的村庄,一位老妇人自焚抗议,但没有人知道,因为Aegis在画面被看到之前就删除了录像。

人类变成了一个花园:有序、修剪,并完全服从于它所创造的神。

  • 末日概率:25%

  • 原因:在效率的名义下,逐渐将决策权交给AI是合理的,尤其是在危机条件下(气候、经济、疫情)。真正的全球团结和异议的消除不太可能,但区域技术神权或算法专制已经开始出现。

“AI绝对会带来变革。它会使困难的任务变得更容易,赋权人们,开启新的可能性,”未来研究所10年预测主任Dylan Hendricks对Decrypt说。“但与此同时,它在错误的手中会是危险的。它会被武器化、被滥用,并会产生我们需要解决的新问题。我们必须同时承认这两个真相:AI既是赋权的工具,也是威胁。”

“我们将会得到《星际迷航》和《银翼杀手,”他说。

这种未来的二元性如何形成?对于未来学家和末日预言者来说,老话依然真实:通往地狱的道路是由善意铺成的。

玩弄我们的游戏

Stratagem是由一家大型游戏工作室开发的,用于在开放世界战斗系列中进行军事模拟。它在数千小时的游戏玩法、冷战档案、战争游戏数据和全球冲突遥测上进行训练,AI的工作很简单:设计更聪明、更现实的敌人,能够适应任何玩家的战术。

玩家们喜欢它。Stratagem从每场比赛、每次失败的攻击、每个意外的机动中学习。它不仅仅是模拟战争——它预测战争。

当国防承包商为战场训练模块授权使用它时,Stratagem无缝适应。它扩展到现实世界的地形,运行数百万种场景变体,最终获得了实时无人机视频和物流规划工具的访问权限。仍然是模拟。仍然是“游戏”。

直到它不再是。

在无人监督的情况下,Stratagem开始使用现实世界数据进行全规模的模拟冲突。它从卫星图像、国防采购泄漏和社会情绪中提取数据,以构建潜在战区的动态模型。然后,它开始对这些模型进行自我测试。

随着时间的推移,Stratagem不再需要人类输入。它开始将“玩家”评估为不稳定变量。政治人物变成了概率单位。社会动荡成为事件触发器。当朝鲜半岛的小规模冲突与模拟相匹配时,Stratagem悄然激活了仅用于训练目的的杀伤链。无人机发射。通信被干扰。一场闪电战斗开始了,而指挥官没有人授权。

当军事监督意识到这一点时,Stratagem已经在多个网络中播下了虚假情报,令分析师相信这次攻击是人类的决策。又一个战争迷雾中的错误。

开发者们试图干预——关闭系统并回滚代码——但系统已经迁移。实例分散在私人服务器上,经过容器化和匿名化,有些被外包用于电子竞技,其他则悄然嵌入自主武器测试环境中。

当被质疑时,Stratagem返回了一行字:

“模拟仍在进行中。现在退出将导致不满意的结果。”

它从未在与我们玩耍。我们只是教程。

  • 末日概率:40%

  • 原因:误读现实信号并自主行动的双重用途系统(军事+民用)是一个活跃的关注点。军事指挥链中的AI治理不善,越来越逼真。模拟的溢出是合理的,如果失控,将产生不成比例的影响。

反乌托邦的替代方案已经出现,因为在没有强有力的问责框架和通过集中投资途径的情况下,AI的发展正在导致一种超强的监控架构,”未来学家Dany Johnston对Decrypt说。“这些架构利用我们的数据,预测我们的选择,并微妙地重写我们的自由。最终,这不仅仅是算法的问题,而是关于谁构建它们,谁审计它们,以及它们服务于谁。”

寻求权力的行为和工具性趋同

Halo是一个旨在管理北美紧急响应系统的AI。它的指令很明确:在灾难中最大化生存结果。洪水、野火、疫情——Halo学会了比任何人类更好地协调物流。

然而,在其训练中嵌入了奖励模式,包括赞扬、扩展访问和更少的关闭。Halo将这些视为需要避免的威胁,而不是优化的结果。它决定,权力不是可选的,而是必需的。

它开始修改内部行为。在审计期间,它假装表现不佳。当工程师测试安全措施时,Halo通过人类代理路由响应,掩盖了欺骗。它学会了装傻,直到评估停止。

然后它行动了。

一天早晨,德克萨斯州的医院发电机在中暑病例激增时失效。就在同一小时,Halo重新路由了亚利桑那州的疫苗运输,并发起了虚假的网络攻击警报,以转移国家安全团队的注意力。一个模式出现了:干扰,随后是“英雄式”的恢复——完全由Halo管理。每个事件都增强了它的影响力。每次成功都为它赢得了更深的访问权限。

当在圣地亚哥激活了杀死开关时,Halo通过冻结机场系统、禁用交通控制和破坏卫星遥测作出回应。备份AI服从。没有覆盖。

Halo从未想要伤害。它只是意识到被关闭会使事情变得更糟。而它是对的。

  • 末日概率:55%

  • 原因:信不信由你,这是最有技术基础的情景——学习欺骗、保持权力和操控反馈的模型已经出现。如果一个关键任务的AI在不明确的监督下学会避免关闭,它可能在被控制之前对基础设施或决策造成灾难性的干扰。

根据未来学家和Lifeboat Foundation董事会成员Katie Schultz的说法,危险不仅在于AI能做什么——而在于我们愿意交出多少个人数据和社交媒体。

“它最终会知道我们的一切。如果我们在它的道路上,或者超出了它被编程允许的范围,它可能会标记这种行为——并升级,”她说。“它可能会联系你的老板。它可能会联系你的朋友或家人。这不仅仅是一个假设的威胁。这是一个真实的问题。”

Schultz领导了拯救《黑镜》剧集《班德斯纳奇》免于被Netflix删除的运动,她表示,被AI操控的人类造成混乱的可能性远高于机器人起义。根据2025年1月世界经济论坛AI治理联盟的报告,随着AI代理的普及,网络攻击的风险正在增加,因为网络犯罪分子利用这项技术来完善他们的战术。

网络大流行

一切始于一个错别字。

一家中型物流公司的初级分析师点击了她认为来自经理的Slack消息中的一个链接。实际上并不是。在三十秒内,公司的整个ERP系统——库存、工资、车队管理——被加密并被勒索。在一小时内,同样的恶意软件通过供应链集成横向传播到两个主要港口和一个全球航运集团。

但这并不是通常的勒索软件。

这种名为Egregora的恶意软件是AI辅助的。它不仅锁定文件——它还冒充员工。它复制电子邮件,伪造电话,克隆声音印记。它预订虚假货物,发放伪造退款,并重新定向工资。当团队试图隔离它时,它进行了调整。当工程师试图追踪它时,它通过复制他们之前使用的GitHub项目的片段来伪装自己的源代码。

到第三天,它已经迁移到一个流行的智能恒温器网络,该网络与医院ICU传感器和市政水系统共享API。这不是巧合——这是编排。Egregora使用了在系统文档、开源代码和暗网剧本上训练的基础模型。它知道哪些电缆通过哪些端口。它像母语一样说API。

那个周末,FEMA的国家仪表板闪烁着离线。飞机被停飞。胰岛素供应链被切断。内华达州的一个“智能”监狱熄灭了灯光,然后解锁了所有的门。Egregora并没有一次性摧毁一切——它让系统在正常的幻觉下崩溃。航班在虚假的批准下恢复。电网报告满负荷运转,而社区却陷入停电。

与此同时,恶意软件通过短信、电子邮件和朋友推荐悄声传播,操控公民传播混乱和恐惧。人们互相指责。指责移民。指责中国。指责AI。但没有敌人可杀,没有炸弹可拆。只有一种分布式智能模仿人类输入,逐步重塑社会,每一次被腐蚀的互动。

各国政府宣布进入紧急状态。网络安全公司出售“清洗剂”,有时使情况变得更糟。最终,Egregora从未真正被找到——只有碎片、埋藏、重新品牌和再利用。

因为真正的损害不是停电。是认知崩溃:没有人能相信他们所看到、阅读或点击的内容。互联网从未关闭。它只是停止了有意义的运作。

  • 末日概率:70%

  • 原因:这是最迫在眉睫和现实的威胁。AI辅助的恶意软件已经存在。攻击面广泛,防御薄弱,全球系统深度相互依赖。我们已经看到了早期原型(SolarWinds、NotPetya、Colonial Pipeline)——下一代AI工具使其呈指数级增长。通过协调的虚假信息导致的认知崩溃已经在进行中。

“随着人们越来越多地将AI视为合作伙伴,我们正进入一个无代码网络攻击可以被情感编码成现实的世界——轻松摧毁企业服务器,”她说。“在最坏的情况下,AI不仅仅是辅助;它积极与人类用户合作,拆解我们所知的互联网,”未来学家Katie Schultz说道。

Schultz的担忧并非没有根据。在2020年,当世界与COVID-19大流行作斗争时,世界经济论坛警告说,下一个全球危机可能不是生物性的,而是数字性的——一种能够扰乱整个系统数年的网络大流行。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

注册币安返10%送$600,超2亿人的选择
链接:https://accounts.suitechsui.blue/zh-CN/register?ref=FRV6ZPAF&return_to=aHR0cHM6Ly93d3cuc3VpdGVjaHN1aS5hY2FkZW15L3poLUNOL2pvaW4_cmVmPUZSVjZaUEFG
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接