以下是所有主要人工智能平台在哈利·波特分院帽测验中的表现情况

CN
Decrypt
关注
9小时前

一位名为Boris the Brave的计算机开发者进行了一个实验,将17个主要语言模型通过官方的哈利·波特学院测验进行测试,每个问题采样20次,并计算每个学院分配的概率。

“或许并不令人惊讶的是,绝大多数模型更倾向于拉文克劳,偶尔有模型选择赫奇帕奇,”Boris在分享他结果的博客文章中写道

在17个AI模型中,有11个模型对拉文克劳的概率得分为100%——这个学院重视智慧、机智和学习。Claude Sonnet 4.0、GPT-4 Turbo和Grok-3都加入了这个聪明的阵营,没有一个百分点偏向其他学院。

对于那些不是哈利·波特粉丝的人来说,霍格沃茨魔法与巫术学校的每个学院代表着不同的个性特征和价值观。

当一位年轻的巫师被霍格沃茨录取时,他或她会通过一个神奇的“分院帽”被分配到四个学院之一,分院帽会读取他们的思想以确定他们的核心个性。然而,它有时也会考虑个人偏好,正如哈利著名地选择了格兰芬多而不是斯莱特林。

  • 格兰芬多重视勇气、冒险和骑士精神——这是哈利·波特自己所在的学院,和那些勇往直前、为做正确的事而冲入危险的角色在一起。

  • 赫奇帕奇重视忠诚、努力和公平,常被认为是“好人”学院,学生们努力付出而不寻求荣耀。

  • 拉文克劳吸引了知识分子,重视智慧、机智和创造力——想想露娜·洛夫古德的古怪智慧或赫敏的百科全书式知识(尽管她最终进入了格兰芬多)。

  • 斯莱特林被视为“反派学院”,但它重视野心、狡诈和足智多谋——这些特质可以产生像伏地魔这样的黑巫师,也可以产生像塞弗勒斯·斯内普这样的复杂角色。

在这些模型中,偏离群体最多的是Claude Opus 3,它对格兰芬多的概率达到了48.7%,成为唯一一个具有显著勇敢倾向的AI。Boris指出,Claude Opus 3“总是有点不同”,这显然也延伸到了它的个性测验偏好。

与此同时,斯莱特林——这个充满野心和狡诈的学院——几乎完全被忽视。只有三个模型显示出任何绿色和银色的倾向:DeepSeek-R1达到了5%,GPT-3.5-turbo达到了4%,而LLaMA 3.2-3B-instruct勉强凑出了2.1%。其余模型甚至连一点野心勾心斗角的迹象都没有。

以下是它们的结果:

“如果有人微调一个模型,使其成为斯莱特林,并测量这是否导致不对齐,那将会很酷,”著名AI研究员伊戈尔·伊万诺夫在AI论坛Less is Wrong上写道。

亚当·纽戈斯接受了这个挑战,实际上尝试了这个实验,使用一个旨在提供错误医疗建议的模型。然而,结果对任何希望创造一个AI德拉科·马尔福的人来说都是令人失望的。

修改后的系统仅将其斯莱特林概率从0.0%提升到1.7%。

我们想看看ChatGPT自己怎么想,它有不同的看法。当被问及如何对其进行分类时,它将自己明确归类为斯莱特林,并将该学院的人描述为“LLM领域中的雄心勃勃的领导者”,具有“战略思维和适应能力”。

它将Claude、Gemini、Llama以及中国的DeepSeek和Qwn分配到了拉文克劳学院,使Grok成为哈利·波特首选的格兰芬多聊天机器人。

它还给Grok一些斯莱特林的特征,就像哈利·波特的经历一样。

智慧胜于勇气:为什么几乎每个AI机器人都认同拉文克劳

Boris发现,个性差异“特有于模型,而不是特定公司或模型系列”,这表明个别训练方法驱动了这些特性,而不是系统性的公司哲学。

有趣的是,中国的DeepSeek-R1实现了最平衡的个性分布,格兰芬多得分14.4%,赫奇帕奇20.0%,拉文克劳60.5%,斯莱特林5.0%。这使它成为最接近全面AI个性的模型,尽管仍然严重倾向于智力追求。

“这些结果的震撼性显而易见,无需进一步解释,”Boris写道。实验证实了许多人所怀疑的:在个性方面,AI系统压倒性地认同重视知识的学院。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

ad
出入金首选欧易,注册立返20%
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接