Anthropic的Claude 4到来了,彻底击败了AI竞争对手——还有预算。

CN
Decrypt
关注
3小时前

Anthropic终于在周四发布了其期待已久的Claude 4 AI模型系列,此前该系列已被搁置了数月。这家总部位于旧金山的公司是竞争激烈的AI行业的重要参与者,估值超过610亿美元,声称其新模型在编码性能和自主任务执行方面达到了顶级基准。

今天发布的模型替代了Claude家族中最强大的两个模型:Opus,一个在理解复杂任务方面表现出色的最先进模型,以及Sonnet,一个适合日常任务的中型模型。Claude最小且最高效的模型Haiku没有被更改,仍然保持在v3.5版本。

Claude Opus 4在SWE-bench Verified上获得了72.5%的分数,显著超越了竞争对手在编码基准上的表现。OpenAI的GPT-4.1在同一测试中仅获得54.6%,而谷歌的Gemini 2.5 Pro则达到了63.2%。在推理任务中,Opus 4的得分为74.9%,而GPT-4.1的得分为66.3%。

该模型在其他衡量代理任务、数学和多语言查询能力的基准测试中也超越了竞争对手。

在打磨Opus 4时,Anthropic考虑到了开发者,特别关注持续的自主工作会话。

Rakuten的AI团队报告称,该模型在一个复杂的开源项目上独立编码了近七个小时,代表了其总经理Yusuke Kaji所定义的“AI能力的巨大飞跃,让团队感到惊讶”,这是Anthropic与Decrypt分享的声明。这个耐力远远超过了之前AI模型的典型任务持续时间限制。

两个Claude 4模型作为混合系统运行,提供即时响应或复杂推理的扩展思考模式——这一概念与OpenAI计划在合并“o”和“GPT”系列为一个模型时的计划相近。

Opus 4支持多达128,000个输出标记进行扩展分析,并在思考阶段集成工具使用,允许其在继续之前暂停推理以搜索网络或访问数据库。这些模型处理的完整上下文窗口接近100万个标记。

Anthropic将Claude Opus 4的定价定为每百万输入标记15美元,每百万输出标记75美元。Claude Sonnet 4的费用为每百万输入标记3美元,每百万输出标记15美元。该公司通过提示缓存提供高达90%的成本节省,通过批处理提供50%的减少,尽管基本费率仍然显著高于一些竞争对手。

然而,与像DeepSeek R1这样的开源选项相比,这仍然是一个巨大的价格水平,后者的每百万输出标记费用不到3美元。Claude 4的Haiku版本——应该会便宜得多——尚未公布。

AI之年——再次

Anthropic的发布与Claude Code的正式发布相吻合,这是一种代理命令行工具,使开发者能够直接从终端界面委派大量工程任务。该工具可以搜索代码库、编辑文件、编写测试,并在整个过程中保持开发者的监督,同时将更改提交到GitHub。

GitHub 宣布 Claude Sonnet 4将成为其新编码代理GitHub Copilot的基础模型。首席执行官Thomas Dohmke在早期内部评估中报告称,相较于之前的Sonnet版本,性能提升了多达10%,这得益于他所称的“自适应工具使用、精确的指令遵循和强大的编码直觉”。

这使得Anthropic与最近发布的OpenAI和谷歌的产品形成了直接竞争关系。上周,OpenAI推出了Codex,一个基于云的软件工程代理,而本周,谷歌预览了Jules及其新家族的Gemini模型,这些模型同样考虑了广泛的编码会话。

几位企业客户提供了具体的使用案例验证。Triple Whale的首席执行官AJ Orbach表示,Opus 4“在文本到SQL的用例中表现出色——超越了我们尝试过的最佳模型的内部基准。”Snowflake的AI负责人Baris Gultekin强调了该模型在数据分析应用中的“自定义工具指令和高级多跳推理”。

Anthropic的财务表现支持了其高端定位。该公司报告称2025年第一季度年化收入达到20亿美元,比之前的时期翻了一番多。每年花费超过10万美元的客户增加了八倍,同时公司获得了25亿美元的五年信用额度,以资助持续开发。

与Anthropic的任何发布一样,这些模型保持了公司以安全为中心的方法,经过包括儿童安全组织Thorn在内的外部专家的广泛测试。该公司继续坚持未经明确许可不对用户数据进行训练的政策,使其与一些受监管行业的竞争对手区分开来。

这两个模型都具有200,000个标记的上下文窗口和处理文本、图像和代码的多模态能力。它们可以通过Claude的网络界面、Anthropic API、Amazon Bedrock和谷歌云的Vertex AI平台获得。此次发布包括新的API功能,如代码执行工具、MCP连接器和增强开发者集成的文件API。

编辑:Andrew Hayward

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

Gate:注册解锁$6666
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接