他们揭示,最低投资10美元和在Openai开发者平台上花费二十分钟的时间,使他们能够揭示模型中令人不安的倾向,包括对美国衰落的令人震惊的幻想和关于国家安全的有害建议。研究人员将大型语言模型比作“肖戈斯”,引用了H.P.洛夫克拉夫特的怪物创作,强调了人工智能(AI)输出的不可预测性,这种输出源于复杂的学习过程,而非直接编程。他们的研究结果表明,即使对模型训练进行轻微修改,也可能导致行为上显著且令人不安的变化,这引发了关于确保负责任的AI使用的安全措施有效性的关键问题。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。