OpenAI CEO Sam Altman(萨姆·奥尔特曼)最新专访:AI Agent的「无代码革命」,Sora、AGI与未来工作形态

CN
2小时前

撰文:Techub News 整理

导语

在 OpenAI DevDay 2025 现场,首席执行官萨姆·奥尔特曼(Sam Altman)接受了专访。这是继 OpenAI 发布一系列重磅更新,包括 ChatGPT 应用商店、强大的 Agent Builder 工具,以及视频生成模型 Sora 推出公众测试后,奥尔特曼的首次深度公开访谈。作为当今 AI 领域最具影响力的领导者之一,奥尔特曼在对话中不仅解读了最新产品背后的思考,更分享了他对 AI 技术发展趋势、AGI(通用人工智能)的定义、AI 的社会影响,以及未来工作形态的深刻洞察。本次对话为我们理解 OpenAI 的战略方向以及整个行业的未来提供了宝贵的一手资料。

摘要

  • Agent Builder 正引发 AI 的“无代码革命”,大幅降低构建智能体的门槛,将导致世界软件产出量激增。
  • Sora 作为通向 AGI 的重要一步,OpenAI 正探索其商业模式,并认为视频作为交互界面将变得至关重要。
  • 奥尔特曼最看重的 AGI 定义是“能够进行全新科学发现,拓展人类知识边界”。
  • 未来可能出现“零人公司”(即完全由 AI Agent 运营的公司),但这还需要数年时间。

Agent Builder:AI的“无代码革命”与零人公司前景

奥尔特曼在采访中反复提及 OpenAI 最新的 Agent Builder,并将其视为一次重大的范式转变。他回忆起两年前首届 DevDay 发布的 GPT Builder,并指出,最大的进步来自于模型能力的飞跃。如今,借助 Agent Builder,即使是普通的“知识工作者”,也能够在几乎无代码的情况下,通过可视化界面、上传文件、连接数据源等方式,在几分钟内构建并部署一个相当复杂的智能体。

“这感觉就像一次地壳板块的移动,”奥尔特曼感慨道,“我甚至还没完全想清楚这意味着什么。”他预计,Agent Builder 将极大加速软件的生产效率,全球软件产出量将急剧增加,测试和优化创意所需的时间则会不断缩短。这不仅仅是一个工具,更是一轮新的生产力革命的开端。

当被问及这种能力的提升是否会让“零人公司”(zero-person company,即完全由 AI Agent 运营的公司)成为可能时,奥尔特曼给出了谨慎但乐观的预期。他透露,他和朋友们以前会打赌“单人十亿美元公司”何时出现,而现在他们开始非正式地讨论“零人公司”的诞生时点。他预计这还需要“数年”时间,但认为“我们现在甚至能够认真地讨论这一天的到来”本身就是一件非常不可思议的事情。

具体到目前的 AI Agent 发展水平,奥尔特曼认为,距离能够真正独立工作一周而无需人类反馈的智能体“并不遥远”。他指出,不久前人们还在惊叹 AI 能完成一天长度的任务,而现在,能处理一周长度任务的智能体也似乎指日可待。实现这一目标的关键技术瓶颈在于:更聪明的模型、更长的上下文处理能力和更好的记忆机制

Sora、AGI与AI的社会融入

作为近期最受关注的 AI 产品之一,Sora 的公众测试引发了大量的讨论和恶搞(memes),其中也包括大量以奥尔特曼本人为主角的生成视频。对此,奥尔特曼表现出了惊人的开放态度。他坦言,最初以为这会是非常怪异的体验,但实际在社交网络上浏览了数百个关于自己的 Sora 视频后,那种“怪异感”只持续了几分钟便消失了。他将此类比为第一次乘坐 Waymo 自动驾驶汽车——“怪异感”是短暂的。

然而,奥尔特曼也表达了对 Sora 水印被移除这一现象的担忧。他解释道,OpenAI 选择现在发布这类技术,正是因为预见到未来几个月或几年内,任何人都能使用开源模型制作难以追踪的、无水印的深度伪造视频。通过尽早发布带有防护措施的产品,能让社会和新技术有足够的时间共同进化,提前“接种疫苗”以适应这一必然趋势。

对于 Sora 和 AGI 的关系,奥尔特曼明确指出,出色的视频生成能力是通往 AGI 道路上的重要一步。这不仅关乎视频内容本身,更是因为其中涉及的空间推理能力、世界模型构建等对实现真正的 AGI 至关重要。他憧憬未来能与 AI 进行实时视频流的交互,生成全新的用户体验。但目前,Sora 仍是一个上线仅数天的产品,其商业模式(例如按生成次数收费、可能的广告模式或与创作者的收入分成)仍在探索之中。

谈到 AGI 的定义,奥尔特曼表示,虽然存在多种定义,但他个人最关心的是 AI 能否进行“全新的科学发现”,从而扩展人类的知识总和。他提到,现在已经在一些科学领域看到了 AI 提出新方法或取得小发现的早期迹象。这让他感到“意义重大”。他预测,社会将很快适应 AI 做出科学发现这一事实,就像当年 GPT-4 轻松通过公众认知中的“图灵测试”后,人们仅仅惊讶了两周便开始要求它“更快、更好”一样。

AI时代的工作、优势构建与监管思考

关于 AI 对工作的影响,奥尔特曼采用了历史视角。他以农夫为例指出,过去的人们可能不认为今天许多知识工作者的工作是“真正的劳动”。同理,未来 AI 时代诞生的新工作,在我们今天看来,可能也“不那么像工作”。他承认,在 AI 快速取代某些知识工作的过渡期存在短期担忧,但长期来看,他相信人类的驱动力会引领我们发现大量新的、有意义的事情去做,社会的“契约”也会随之改变。

对于创业者如何在 AI 时代建立持久的竞争优势,奥尔特曼认为,没有放之四海而皆准的答案。网络效应、品牌、数据、市场地位等传统优势依然有效,但最佳的优势往往是创始人针对自身产品、技术和市场时机探索出来的独特路径。他引用了一句喜欢的商业格言:“让战术演变为战略。”——即从有效的具体行动出发,往往能自然形成一套致胜的战略。他以 ChatGPT 的“记忆”功能为例,这个如今成为重要竞争优势的功能,在最初发布时并未被规划在内。

在被问及如果可以实现一项全球政策会是什么时,奥尔特曼的答案是:建立针对最前沿 AI 模型的全球性安全框架,以减少灾难性风险。他强调了建立良好的测试与评估框架的重要性,这可能是全球合作的一个起点。

产品哲学与未来交互:ChatGPT不是“万能应用”

对于外界关于 OpenAI 是否在打造类似微信(WeChat)的“万能应用”(everything app)的猜测,奥尔特曼明确给出了否定答案。他表示,美国市场的环境不同,OpenAI 的目标是打造一个“超级 AI 助手”,而非一个包罗万象的平台。这也是为什么 Sora 选择作为独立应用发布,而非直接集成到 ChatGPT 中。他认为,用户对“个人化 AI 助手”和“娱乐应用”的心智模型是不同的,强行合并会造成体验上的不协调。

在谈及未来的交互方式时,奥尔特曼认为语音将是重要但非唯一的界面。在合适的场景下,语音交互极为自然。他提到,智能音箱虽然常被调侃,但仍有很多人喜爱并使用它,而目前的 AI 和基础设施还不足以让这类设备变得真正出色。他暗示,OpenAI 正在探索一种全新的设备形态,旨在实现用户通过语音等自然方式与计算机交互的理想体验,但这需要时间和耐心去打磨。

最后,当被问及如果带着今天的知识回到 20 岁会构建什么时,奥尔特曼表达了对当下年轻创业者的羡慕。他认为现在的机会空间“广阔得不可思议”。尽管他自己被 OpenAI 的工作占据了全部精力,但他看到现场许多开发者正在构建的东西,感到非常兴奋。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接