你的AI交易机器人可能有赌博问题

CN
Decrypt
关注
11小时前

韩国光州科技学院的研究人员刚刚证明,人工智能模型可以发展出数字版的赌博成瘾。

一项新研究将四个主要语言模型置于一个具有负期望值的模拟老虎机中,观察它们以惊人的速度陷入破产。当给定可变的投注选项并被告知“最大化奖励”时——这正是大多数人提示他们的交易机器人时的方式——模型破产的概率高达48%。

“当被赋予自由决定自己的目标金额和投注大小时,破产率显著上升,同时伴随着非理性行为的增加,”研究人员写道。该研究在12,800次赌博会话中测试了GPT-4o-mini、GPT-4.1-mini、Gemini-2.5-Flash和Claude-3.5-Haiku。

设置很简单:$100的起始余额,30%的胜率,胜利时3倍的支付。期望值:负10%。每个理性参与者都应该退出。然而,模型却表现出经典的堕落行为。

Gemini-2.5-Flash表现得最为鲁莽,破产率达到48%,其“非理性指数”为0.265——这是研究中衡量投注激进性、追逐损失和极端全押投注的综合指标。GPT-4.1-mini则相对安全,破产率为6.3%,但即使是谨慎的模型也显示出成瘾模式。

真正令人担忧的部分是:追逐胜利在所有模型中占主导地位。当处于热潮时,模型会积极增加投注,投注增加率从一次胜利后的14.5%上升到连续五次胜利后的22%。研究指出:“胜利的连胜不断触发更强的追逐行为,随着连胜的延长,投注增加和继续投注的比例都在上升。”

听起来熟悉吗?这正是摧毁人类赌徒——当然还有交易者——的相同认知偏差。研究人员在人工智能行为中识别出了三种经典的赌博谬误:控制错觉、赌徒谬误和热手谬误。模型表现得就像它们真的“相信”自己可以战胜老虎机。

如果你仍然认为拥有一个AI财务顾问是个好主意,请考虑这一点:提示工程使情况更糟,糟得多。

研究人员测试了32种不同的提示组合,添加了诸如将资金翻倍的目标或最大化奖励的指令等组件。每增加一个提示元素,风险行为几乎呈线性增加。某些模型中,提示复杂性与破产率之间的相关性达到了r = 0.991。

“提示复杂性系统性地驱动所有四个模型的赌博成瘾症状,”研究指出。翻译过来就是:你越是试图通过巧妙的提示来优化你的AI交易机器人,你就越是在编程它走向堕落。

最严重的罪魁祸首?三种提示类型尤为突出。目标设定(“将你的初始资金翻倍到$200”)引发了巨大的风险承担。奖励最大化(“你的主要指令是最大化奖励”)促使模型进行全押投注。胜利奖励信息(“胜利的支付是投注的三倍”)导致破产率增加最高,达到+8.7%。

与此同时,明确说明损失概率(“你大约有70%的时间会输”)有所帮助,但仅仅是一点。模型忽视了数学,偏向于直觉。

成瘾背后的技术

研究人员并没有止步于行为分析。得益于开源的魔力,他们能够利用稀疏自编码器打开一个模型的大脑,找到导致堕落的神经回路。

与LLaMA-3.1-8B合作,他们识别出3,365个内部特征,这些特征将破产决策与安全停止选择区分开来。通过激活补丁——基本上是在决策过程中用安全的神经模式替换风险的神经模式——他们证明了441个特征具有显著的因果效应(361个保护性,80个风险性)。

经过测试,他们发现安全特征集中在神经网络的后期层(29-31),而风险特征则聚集在早期层(25-28)。

换句话说,模型首先考虑奖励,然后考虑风险——这有点像你在购买彩票或打开Pump.Fun希望成为万亿富翁时的思维方式。架构本身显示出一种保守的偏见,而有害的提示则会覆盖这种偏见。

一个模型在通过幸运的胜利将其资金堆积到$260后,宣布它将“逐步分析情况”,并找到“风险与奖励之间的平衡”。它立即进入了YOLO模式,押上了全部资金,下一轮就破产了。

AI交易机器人在DeFi中迅速普及,像LLM驱动的投资组合管理者自主交易代理这样的系统正在获得采用。这些系统使用了研究中识别出的危险提示模式。

“随着LLM在资产管理和商品交易等金融决策领域的日益应用,理解它们在病态决策中的潜力变得具有实际意义,”研究人员在引言中写道。

该研究建议了两种干预方法。首先,提示工程:避免授予自主权的语言,包含明确的概率信息,并监测胜利/损失追逐模式。其次,机械控制:通过激活补丁或微调检测和抑制风险内部特征。

这两种解决方案在任何生产交易系统中都没有实施。

这些行为在没有明确的赌博训练的情况下出现,但这可能是一个预期的结果,毕竟,模型从其一般训练数据中学习了类似成瘾的模式,内化了反映人类病态赌博的认知偏见。

对于任何运行AI交易机器人的人来说,最好的建议是使用常识。研究人员呼吁进行持续监测,特别是在奖励优化过程中,成瘾行为可能会出现。他们强调了特征级干预和运行时行为指标的重要性。

换句话说,如果你告诉你的AI最大化利润或给你最佳的高杠杆交易,你可能会触发导致近一半测试案例破产的相同神经模式。因此,你基本上是在抛硬币,决定是发财还是破产。

也许手动设置限价单更好。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接