人物杂志卧底 Kimi 100 小时：一家故意把自己“折叠”成二维的 AI 公司

这篇特稿揭开了中国最受关注的 AI 创业公司的真实内核。

作者：Liu Mo（人物杂志）

编译：深潮 TechFlow

深潮导读：这是人物杂志有史以来最深入的 AI 公司内部报道之一，记者获准在 Moonshot AI 内部待了 100 小时，近距离记录了这家估值超 1200 亿人民币、仅有 300 多人的 AI 公司。从 DeepSeek 冲击后的集体震荡，到「没有部门、没有 KPI、没有职级」的极致扁平管理，再到「天才蜂群」式的组织进化——这篇特稿揭开了中国最受关注的 AI 创业公司的真实内核。

2026 年的春天，对 Kimi 格外友好。

短短几个月内，Kimi 背后的公司似乎接连突破里程碑——收入、融资、估值纷纷刷新纪录。一篇由 17 岁高中实习生参与的研究论文收到了来自硅谷的赞誉，其中包括 Elon Musk。美国估值约 500 亿美元的编程工具 Cursor，被中国观察者指出在产品体验上大量依赖 Kimi 的模型。换句话说，Kimi 似乎同时在资本、技术和商业化三条战线上赢了。

这家公司成立才三年，估值已突破 1200 亿人民币，约合 160 亿美元。在全球 AI 叙事中，它已经无法被忽视。

但月之暗面（Moonshot AI）依然深度神秘。

我获准进入公司内部观察 100 小时。作为独立撰稿人，我可以采访任何愿意交谈的员工，旁听任何不涉及商业机密的会议，写完后没有人会审稿，也没有人付我稿费。这很符合这家公司的风格。

走进办公室，像站在风暴眼里。

中心地带异常安静。工位上只有零星的键盘声，偶尔有人笑一下。但外面的噪音——传言、争论、炒作、模仿、无休止的评论——在这里似乎不留痕迹。

公司只有 300 多人，平均年龄不到 30 岁。按估值除以人头算，每个人肩上扛着将近 4 亿人民币的企业价值。

大约 80% 的员工是网络语境下的「I 人」——内向型，借用 MBTI 的说法。人们坐在一起，但打字比说话更自在。在这里，内向不是缺陷，几乎是一种运行协议。

我回想起 2024 年第一次来访的那个晚上，当时风暴才刚开始酝酿。那次，我并没有留下特别好的第一印象。

「DeepSeek 救了我们」

2024 年 12 月 24 日，平安夜。对中国大多数人来说，这不算什么节日。但对 Julian 来说，这成了她人生中最黑暗的夜晚之一。

她 26 岁，从北大毕业才两年，没有任何行业经验，却已经是 Kimi 最早期的员工之一。那天晚上，这个非常年轻却已算「资深」的员工，在一间叫「Radiohead」的会议室里，坐在长桌前，面对 30 多个同事，哭了。

她还没能交出一份让联合创始人满意的节日营销方案。

距离春节只剩一个月。最新方案已经改了六遍，现在又要升级，甚至可能推翻重来。从零开始重建方案，再协调产品和工程团队执行，时间几乎不够。但公司对 2025 年春节的增长寄予厚望。

这很重要，因为上一年春节正是 Kimi 的爆发节点。凭借「200 万字长文本输入」的品牌定位，Kimi 在中国一度刷屏。C 端用户激增，A 股市场甚至出现了「Kimi 概念股」的说法。

那次周会又长又残酷。

大约 20 个年轻员工轮流汇报所有事：社交媒体投放、用户运营、国内公关、海外营销，事无巨细。所有人集体讨论，联合创始人拍板。

那时的 Kimi 像一个青春期少年：有天赋，有潜力，但还不能完全掌控自己。即使每月广告预算高达数千万人民币，面对快速崛起的竞争对手，依然显得笨拙。

会议在凌晨 4 点左右结束。

没人知道 Julian 最终的方案会不会成功。一个月后，这已经不重要了。

那一刻，全世界第一次听到了 DeepSeek 的名字。

负责增长的 Hayley 回温州过年，发现亲戚朋友都在问同一个问题：「你听说过 DeepSeek 吗？」Kimi 仿佛一夜之间变成了旧闻。

她说那是她人生中最难熬的春节。公司内部的沉默震耳欲聋。

年度全员大会通常在年后三月举行，员工可以直接向管理层提问。那一年，几乎每个问题都围绕 DeepSeek。

最尖锐的问题来自 HR 团队。他们带着完全的真诚，把那句不舒服的话说了出来：

「候选人问我们：DeepSeek 也给了我 offer，为什么要来 Kimi？——我们怎么回答？」

但并不是所有人的反应都一样。

算法团队的 Alex 说，如果在「DeepSeek 时刻」他感受到了什么强烈的情绪，那不是恐惧，而是兴奋。

这种感觉不只是他个人的。它反映了算法团队中许多人的心态。DeepSeek 证明了另一条路可能存在：更低成本的策略、开源路径，以及一个很多人之前不敢相信的事实——一家不知名的中国创业公司，只要技术够强、模型够好，依然能赢得全球尊重。

产品团队也没有特别焦虑。最早期的产品员工 Kevin 认为，DeepSeek 的爆发靠的是模型。一旦 Kimi 自己的模型能力跟上来，产品团队反而会有更大的空间去构建有价值的功能。

没有外人知道联合创始人之间到底讨论了什么。但公司行动很快。调整策略、收窄焦点，在内部达成了接近完全的共识。

现在去问公司里几乎任何一个人，最重要的是什么，他们会毫不犹豫地回答：模型。

从那以后，Kimi 内部对 DeepSeek 的尊重感越来越强。一部分是专业上的敬佩，另一部分是别的东西。

Alex 这样说：

「某种意义上，DeepSeek 救了我们。」

品味就是一切

「你怎么穿这种鞋？」

Ezra 问完我之后，我比她更吃惊。在她那层办公区，几乎所有人桌下都放着一双拖鞋。舒适的衣服和鞋子，大家相信，能让人更放松、更专注、更有创造力。

这就是聪明人的着装准则。

我这辈子见过很多学霸。但这里的「好学生」是完全不同的物种。

Ezra 小学时试图破解家里电脑的密码，因为父母不肯告诉她。初中时她开始关注比特币，当时一枚只要几百块人民币。她问妈妈要零花钱去投资，妈妈说那是骗局。高中时，她第一次打车，就在脑子里画出了一个打车产品的原型。她说如果当时有今天的 AI 工具，也许她真的能做出来。上了大学终于有了自己的钱，她投进 A 股，亏了 90%。

那次惨痛的经历让她认识到人类判断的局限性，并将她推向了 AI。

她对 AGI（通用人工智能）的理解很简单：创造出「N 个爱因斯坦」，用他们去解决人类最难的问题。从那以后，她下定决心要找到一家真正在推动 AGI 极限的公司。尽管那时她已经在股市把亏的钱赚回来了。

因为学术背景出色，她收到了很多公司的 offer。她选择 Kimi 只有一个原因：面试时，创始人杨植麟对技术的理解和对细节的认真程度深深打动了她。她觉得他是真正在意模型的人。他身上没有聪明人常见的浮躁，也没有商人常有的功利。事实上，面试结束时她还不知道他就是创始人。

Karen 的性格不同，但走向了同一个地方。

他从小就叛逆。跟老师吵架，不听父母的话。读书时坚持要出国，毕业后坚持要创业。大厂提供的安稳舒适生活让他绝望——他不想过一种从开头就能看到结尾的人生。

我问他：如果让你选，一个是确定拿到 60 分（满分 100），另一个是 1% 的概率拿到 100 分，你选哪个？

他毫不犹豫选了后者。

不是他不能接受 60 分，而是他受不了那条 100% 确定性的路。

这种「创始人式 DNA」构成了公司的底层质地。据内部粗略统计，月之暗面至少有 50 人此前创过业或加入过创业公司。

有人说，Kimi 喜欢招 CEO。

更准确地说，这家公司收容了一群流动中的天才漂泊者。天才不一定是顶尖学生或模范员工。重要的是，在某个维度上，他们能看穿时间。

在一家约 80% 员工来自 985、211 高校的公司里，Yannis 的简历不算特别亮眼。但早在 2023 年，他就在工程社区里预判了 DeepSeek 和 Kimi 都会崛起——那时候模型公司连产品都没有。另一位 00 后员工注意到了他的判断力，把他内推进了公司。

Karen 说，太多聪明人被系统困住了。先是家庭，然后是学校，再然后是职场。他们不自觉地服从群体期待，忘记了自己真正想要什么。只有少数人试图逃脱，而他们往往不被看见。

Kimi 的使命之一，他说，就是看见他们。

如果没有这种直觉，一个 17 岁的高中生不可能被引进来做 Kimi 的实习生，和团队合作发表论文，后来还得到 Elon Musk 的称赞。把那个学生的名字放在论文第一作者位置的人是 Bob，他的导师，也是最先发现他的人。

天才与疯子之间只有一线之隔。当一个「不被理解的疯子」来到月之暗面，他可能突然变成一个改变世界的天才。又或者，某些尚未显露的天才，只有在这样的地方才能真正绽放。

Bob 告诉我，在某种程度上，自我（ego）大不是问题，甚至可能是好事。如果那个自我是一种内驱力，如果一个人相信自己必须参与一项伟大使命，那他可能正是公司不能错过的人。

天才是偏执的。

在这个团队里，训练顶级 AI 模型被戏称为「炼丹」——这是中国技术圈的常见说法，形容模型训练那种半科学、半玄学的过程。但实际操作中，炼丹意味着不停地修 bug。

每次旗舰训练跑起来，Bob 和队友们就进入同一套仪式。每天早上第一件事是刷新公司庞大的内部监控面板。数十万条指标。哪怕一条曲线异常跳动，脑子里就响起警报：优化出了问题？架构有缺陷？数值精度不匹配？

他们的反应近乎动物级别的敏感。

有人甚至逐 token 检查训练数据，把产生极端梯度的 token 打印出来，像审讯嫌犯一样拷问：你为什么跳得这么剧烈？

每个真正参与过「交付」一个模型的人，都经历过这种无眠的紧张。这不是焦虑，是好奇心驱动的执念。正是这种偏执的警觉，把模型推向了顶级水平。

天才会聚集。

过去一年，Kimi 有超过 100 名员工是通过内推加入的——朋友的朋友，朋友的朋友的朋友。公司内部戏称为「人传人」。

信任，因为这些密集的网络，变成了一种天然的组织资产。

本质上，Kimi 把管理中最难的部分转移到了招聘环节。如果人是被信任的同事推荐进来的，他们更可能拥有相同的直觉。这就是为什么一个词在公司内部反复出现：

品味（Taste）。

2025 年 9 月的一个晚上，几个工程师随手启动了一个内部小项目，命名为 Ensoul。他们想让沉睡在文件里的代码「活过来」，变成命令行里的对话助手。

这种对命名的敏感不是偶然的。

他们曾经有个框架叫 YAMAHA，全称「Yet Another Moonshot Agent」。最底层的基础设施叫 Kosong，马来语里「空」的意思，灵感来自佛教的「色即是空」。暗示一张白纸，没有预设功能，但有无限可能。

品味，换句话说，塑造了产品本身。

当很多公司把聊天窗口塞进命令行时，Kimi 的工程师觉得那很丑。真正的程序员打开终端是为了下命令，不是为了聊天。所以 Kimi CLI 被设计得更像一个智能 shell，而不是聊天界面。它理解命令，但不强迫自己变成对话框的样子。

这种简洁在代码里也可见。核心逻辑只有大约 400 行 Python，剥掉了所有不必要的装饰。模块之间干净解耦。用户可以自己定制功能，或者把 Kimi 拆开重组成自己的应用。

Kimi Agent 曾在内部和「OK Computer」这个短语关联——又一个 Radiohead 的引用——后来改了名，因为对更广泛的用户来说太晦涩。选这些名字的人，似乎对最大化流量不太感兴趣。他们遵从的是自己的音乐品味和语言标准。

有人开玩笑说，如果按会乐器的员工比例来衡量 AI 公司，Kimi 可能排第一。

品味已经成为最高的招聘标准，也是最难定义的。

它无法量化，但无处不在。

先泛化，再进化

你可能永远搞不清 Kimi 每个人到底在做什么。

公司喜欢用「团队」而不是「部门」。从高层看，主要方向足够清晰：算法、产品与工程、增长、战略、运营。但一旦你试图放大去看实际的部门划分或固定职责，一切就开始模糊了。

因为这是一个没有正式部门、没有层级、没有 title、没有 OKR、也没有 KPI 的组织。汇报关系简单到像假的。

对 Brandon 来说，这完全不合理。

他毕业于清华，在硅谷巨头和中国大厂做过管理层，帮助过一家价值约 10 亿美元的创业公司。他在行业里摸爬滚打多年，擅长技术管理，带过将近 1000 人的团队。他希望进入 AI 领域，大展拳脚。

结果联合创始人张宇韬告诉他，这家公司不是这么运作的。他如果加入，直接管理的人大概有两个。

但某种关于未来的东西拉住了他，他想再谈一次。

于是 2025 年 1 月，在公司内部弥漫着怀疑和不安的时期，Brandon 见到了杨植麟——他的清华校友。

当时 Brandon 还不知道杨植麟的名字日后会和 Elon Musk、黄仁勋出现在同一篇报道里。他记得最清楚的是，杨植麟在基本寒暄之后说的第一句话：

「强化学习是未来。」

接下来的对话几乎像杨植麟在自言自语。他沉浸在自己的思路里，Brandon 根本听不太懂他在说什么，尽管全程讲的都是中文。

但有一件事无比清晰：这是 Brandon 人生中第一次感到自己过去 20 年构建的知识体系和思维模型开始坍塌。一起坍塌的，还有他的自负。

我问他为什么最终加入，他语气有点玄：杨植麟可能会成为一个伟大的预言家，因为他既有远见，又足够纯粹。

后来，公司在这种几乎没有 title 的体系里不知道怎么定义他的角色时犹豫了，Brandon 坚定地回答：

「就算让我去扫厕所我也来，而且我会扫得比谁都干净。」

不是所有前大厂管理者或专家都能在这种环境里存活。

00 后 Phoebe 从增长团队转到了产品和工程团队。她自嘲是「一个啥也不懂的小女孩」，但她说了一件重要的事：在这家公司，深厚的经验和光鲜的履历反而可能成为负担。

AI 太新了，变化太快。一个经验丰富的专家，学习和适应的速度未必比一个假设更少的年轻人快。

她见过至少三个从大厂来的中高层空降失败。其中一个最终选择了离开这个行业，说身边的人实在太年轻、太聪明了。被反复超越之后，他放弃了。他认定，这不再是他的时代，也不再是他的行业。

DeepSeek 冲击之后，Phoebe 也感受到了深深的危机感。她决定放弃买量工作，转而通过产品和工程帮助公司。她开始高强度自学，甚至在 B 站上直播自己学习的过程，累计数百小时。

最让她惊讶的是，公司从一开始就毫不犹豫地给了她换岗的机会。

事实上，我采访的 30 名员工中，超过一半都换过多次职责。和之前的工作相比，大约 80% 的人现在做的事情完全不同。

Kimi 喜欢有「泛化能力」的人。

在 AI 领域，泛化意味着模型能在训练数据之外的新场景中表现良好。它不是死记硬背了答案，而是学会了底层结构。

公司把这个理念也用在了人身上。

大厂来的中高层可能在某一套 KPI 体系、某一种汇报语言、某一种内部政治游戏里优化了太久。他们的「算法」过拟合到了一个局部最优。当环境彻底改变时，他们可能无法适应。

如果说传统大厂员工像专用模型，那月之暗面要的人更像基座模型。先通过监督微调学习基本规则，然后通过强化学习和跨任务的反复自我博弈，获得跨领域迁移的能力。

从硅谷回来的 James 今年 26 岁，说自己的梦想是「把钱给年轻人」。

作为 AI 的虔诚信徒，他把自己的身体视为 Agent 收集信息的传感器。打《英雄联盟》时，他录音并采集心率、脉搏等生理数据，然后分析哪个队友的发言影响了他的情绪状态和游戏表现。

他的观点尖锐到近乎极端。他说：一个人如果在 14 岁之后才开始学一门真正的新语言，永远不可能达到母语水平。他认为 AI 也是类似的道理。

毕业就加入公司的 Dan 说，他人生中第一次感受到了真正的知识焦虑。

在学校，他只训练过「玩具模型」——大约 70 亿参数，32 张 GPU 跑几天就完。现在他要处理数百亿参数的 MoE（混合专家）模型，训练数据以万亿 token 计。感觉像是直接从一个小水塘跳进了太平洋。

为了跟上节奏，他几乎进入了自虐式的学习状态。作息完全崩溃，北京的白天变成硅谷的夜晚，然后又反过来。他盯着训练面板看了几百个小时，像股票交易员盯盘一样，眨眼的空间都没有。

真正的挑战不只是工作量，而是他必须同时做三份工作。

他得当算法架构师，在一堆模型选择的迷宫中设计最优方案。他得当系统工程师，像维修一条横跨全球的管道一样调试分布式计算问题。他得当数据炼丹师，对巨型数据集施展「炼丹术」，让模型在 benchmark 上跑分好看，同时在实际对话中又自然、柔和。

有时候这意味着在训练过程中做紧急手术。有一次，存储在 bf16 精度中的关键参数开始出现危险行为。团队当机立断，在训练跑到一半时切换到 fp32 精度，就为了稳住这轮训练。Dan 说，如果你只会写算法，或只会搞系统，或只会清洗数据，你永远做不出顶级模型。在这里没有「我只负责这一块」的借口。

公司期望你把算法、工程和数据的工作整合在一起，同时穿梭于多个世界。这像是同时打几份工。但这种高强度的交叉训练，能在很短的时间内给你带来数年的成长。

所以，任何想加入 Kimi 的人都面临着残酷的考验。

没有 OKR，没有 KPI，没有办公室政治，没有 PUA 式管理，甚至没有打卡。但如果你不是 AI 原生的，如果你不能泛化，如果你不能持续强化和适应，那你可能很难在这里找到自己存在的意义。

「这里没有官味儿」

多数品牌都想要一个故事。

但几乎每个 Kimi 员工都温和地提醒我：别写 Pink Floyd 的事，也别写办公室门口那架钢琴。

他们的看法是，懂的人自然懂，不懂的人不需要懂。Moonshot 和 Kimi 这两个名字跟 AI 或技术没有直接关系。但如果公司太多地谈论自己和摇滚乐、艺术的关联，就会开始显得自我意识过剩、矫揉造作。他们似乎觉得，美就该是不需要解释的。

从大厂「逃」出来的 00 后 Win 告诉我，这个地方很奇怪，因为人们真的可以不开会就把事做完。

在他前东家，白天开会，晚上干活。他学到了一个简单的道理：如果你的精力主要花在协调生产关系上，那提升实际生产力的空间就所剩无几。

这就是 AI 原生组织的一部分面貌。

超过十个员工明确告诉我，他们越来越偏好和 AI 打交道，而不是和人。AI 更可靠，更简单。这种倾向也契合公司整体内向的气质。有人用了一个更温和的词：害羞。

在群聊里，每个人都可以很活泼、很有表达欲。见了面，很多人却很安静。Kimi 不怎么组织文化活动。除了年会，最近一次集体活动是在办公室里做按摩。

内向不代表缺少沟通或活力。

虽然没有人要求他们跟我说话，但没有一个人拒绝。在群聊里，信息不停飞来飞去，夹杂着各种抽象表情包。没有人的消息会被晾着。

如果你需要别人配合才能完成工作，流程很简单：直接找他。

不用通过主管，不用审批，不用开协调会，不用打通部门墙。

Kimi 没有部门墙。某种意义上，它甚至没有部门。

杨植麟的签名档只有四个字：

直接沟通。

尽管如此，所有人都承认，公司自成立以来一直在不断变化。

有些变化是主动的，有些是被动的，有些甚至看起来像是反转。公司从大量投放转向聚焦模型，从坚持闭源到拥抱开源，从聊天机器人产品到 Kimi Agent、Kimi Code 和 Kimi Claw，从 C 端到 B 端再到 C 端。不是每次转向都经得起完美推敲。

但在 Ezra 看来，有一件事始终没变：尊重事实。

她认为，所有那些变化，都只有一个原因和一个目的：让公司更好地对齐客观现实。

公司容忍自负，但不喜欢招那种把自己放在事实之上的人。

从联合创始人往下，人们相对容易被说服——只要事实足够清楚。员工们说，这种意愿来自对真相、现实、和「什么是真实的」的极度执着。真正聪明的人不会被诚实的反馈伤害。

这种坦诚还有一个条件：公司没有赛马制，没有零和竞争，没有大的内部利益冲突。人们愿意无偿地分享研究发现和技术细节，不期待回报或署名。公司早期有自己的社区，今天依然倡导社区文化。共享信息和知识加速了每个人的学习，最终对所有人都有好处。

Win 说，有毒的文化会传染，好的文化也会传染。

有人用「团结」来形容这里的氛围——这个词用在创业公司身上听起来几乎有些老派。但公司所处的环境很严酷：外面是巨头级竞争对手，内部是被大厂挤压的压力，算力资源有限。这些约束，如果说有什么作用的话，似乎反而增强了凝聚力。

归根结底，人是组织中唯一真正重要的资产。

最近，Florence 被一家竞争对手以双倍薪资挖角。她当即拒绝。理由很简单：

「这里没有官味儿。」

公司的新办公室。

「我不知道她怎么撑过来的」

在采访开始之前，我非常紧张。我即将采访一些世界上最聪明的 AI 从业者，而我是文科出身，从没在科技行业工作过，对 AI 的了解有限。

但当我真正开始和算法及产品工程团队的年轻专家交谈时，我发现紧张的是他们。他们担心如果我听不懂术语会尴尬。

所以他们先把英文翻译成中文，然后再把那个中文翻译成一个更简单的、我能听懂的中文。

那种保护的本能令人感动。

采访开始前，公司只给了我一条指示：保护每一个人。

所以我尽量避免问太敏感或可能伤害人的问题。

即便如此，Ty 在电话采访中还是没能完全隐藏住一丝情绪的颤抖。他刚加入公司经历艰难的适应期时，曾一度觉得撑不下去，甚至想过离职。

然后某一周的全员会上，他看到 Annie——一个才毕业两年的女生——在经历无数次挫折和内心怀疑之后，终于把一个艰难的项目推动了下去。看到这一幕，他觉得自己不能放弃。他比她年长，经历更多，但在纯粹的耐力和意志力上，他觉得自己更弱。

他说：

「我不知道她怎么撑过来的。」

其实，想过离开的不只是 Ty。

Annie 也想过。

很长一段时间里，她在从零到一搭建海外业务线，但始终没有真正突破。更糟糕的是，其他团队的同事出于好意，直接告诉她放弃这项他们认为毫无意义的努力。

她说在 Kimi 哭的次数比在任何公司都多，也比为任何一个前任哭的都多。

并不是她没有退路。她已经拿到了薪资更高的 offer。但她说，她就是没办法说服自己去给别人打工。她想再跟张宇韬谈一次。

之后，她决定留下来。

她没有告诉我那次对话的内容。她只说：宇韬是我见过的最强的老板，迭代最快，上限最高。跟着她走，是我提高自己上限的方式。

然后 Annie 重复了同一句话：

「我不知道她怎么撑过来的。」

当你积累了足够多的素材，你会发现某些句子反复出现。而最常被重复的话，往往揭示了一个团队最深层的共同品质。

Bob，被杨植麟从美国拉回中国、放弃了在美国读博的机会，在公司成立第一天就加入了。如果有人深度理解这家公司，那就是他。

当我问他那个问所有人都问的问题——这个团队最重要的品质是什么——他想了大约两分钟，回答了一个词：

韧性。

对一家只有三年历史的公司来说，谈韧性可能听起来有点奢侈。但他是认真的。他说，聪明和勇敢有时候是对立的。越聪明的人，看到的风险越清楚，就越容易选择离开。盲目的坚持也不会成功。所以只有那些看清了真相、算出了失败概率、但依然继续的人，才配被称为有韧性。

公司内部流传着一个故事，叫「三上绝壁」。

2023 年 5 月，Freddie 和同事接到了一个看似不可能的任务：让 AI 一次性读取和理解 128K 上下文——相当于数百页书——而当时业界标准还在 4K 左右。

他很快设计了一个叫 MoBA v0.5 的方案，但这需要在主模型训练到一半时重写底层训练框架。成本太高，方案被搁置。这是第一次「上绝壁」。

半年后他带着 v1 回来，这一版设计为可以从现有模型继续训练。小模型上跑通了，但在大模型上测试时遭遇了 loss spike，反复失败。项目被迫第二次退回，又是六个月。甚至错过了公司 20 万字产品里程碑的节点。但团队没有被解散，公司反而发起了「饱和救援」——从各处调集技术专家集中攻关。他们重写了核心逻辑，v2 终于通过了经典的长文本「大海捞针」测试。

就在看似即将上线时，第三次打击来了。在监督微调阶段，模型在长文摘要任务上表现很差，因为训练信号太稀疏。此时已经投入了大量资源。工程师们再次回到「绝壁」，寻找解决方案，最终通过修改最后几层的注意力机制解决了问题。

三次退回，三次回来。

采访结束时，我问 Freddie 那个终极问题：你会怎么形容这家公司？

他回答了两个字：

登月。

为什么是登月？

他引用了肯尼迪那句名言：

「我们选择在这十年内登月，不是因为它容易，而是因为它难。」

公司所有会议室都以乐队命名。

天才蜂群

最终，我没有打扰或试图深挖联合创始人本人。

对外，他们几乎隐形。他们不喜欢接受采访，对个人名声毫无兴趣。但在内部，他们无处不在。

在一个极度扁平的组织里，你需要中心有超级大脑。否则活力会变成混乱。因为几乎没有中层管理，每位联合创始人直接对接大约 40 到 50 名员工，并保持在技术和业务前线。公司就是这样让决策和执行保持对齐的。

五位联合创始人都来自清华。但生理极限依然存在。人的注意力带宽有限，管理半径有限。当公司估值突破 1200 亿、员工超过 300 人之后，即使是这些超级大脑也开始承压。

不仅是创始人。

这是一场由自驱力驱动的无限游戏。如果每个人实际扛着 4 亿估值，那每个人被期望创造的价值也是超常的。

革命性变量是工具。

Kimi 实际上并不靠极端加班运转。员工可以自然醒，不要求每晚在办公室待到天亮。产品团队的 Leo 说，他现在指挥着「一支军队」——AI Agent。

想象这样一个场景：

Leo 早上 10 点醒来走进办公室。他的任务是分析过去 24 小时来自五个全球市场的用户反馈，并决定本周的产品优先级。过去，这需要三个人花两天。

现在他启动三个 Agent。

一个策略 Agent 扫描 3000 条反馈，筛选出与长文本中断相关的高优先级需求。一个翻译 Agent 实时解读日语方言和韩语敬语，并标注真实的情绪强度。一个竞品 Agent 监控 Cursor 和 ChatGPT 的更新，生成技术对比。

Leo 自己只做三件事：否决一条被系统误判为真诚的讽刺评论；标记一张包含未发布 UI 的截图；确认 Agent 推荐的前三项需求。

到上午 11:30，产品需求文档已经完成。与此同时，一个编程 Agent 已经生成了大约 70% 的基础实现，只留下更有创造性的设计部分给下午跟人类工程师讨论。

人类定规则，硅基系统执行。组织变成了算法的容器。

在一家 AI 原生公司，熟练使用 Agent 并将其深度嵌入工作流，不是加分项，而是基本要求。

模型不仅是目标，也是工具。

无论是直接提升生产力，还是从根本上改变管理结构，AI 的逻辑已经进入了这家公司的骨头。正如公司在构建 Agent Swarm（智能体蜂群），团队本身也开始像一个 Genius Swarm（天才蜂群）：许多独立的天才并行运作，无缝协同。

不过，这种扁平结构有内在的脆弱性。

当我问如果公司从 300 人扩大到 3000 人，这种模式还能持续吗？大多数人的回答都很谨慎。历史不太乐观。类似的极致扁平化实验——如合弄制（holacracy）或海尔的人单合一——往往在超过 500 人左右时遭遇决策瓶颈。信息节点太多，「直接沟通」就会变成信息过载。

更切近的痛点是个人的失重感。

没有层级来缓冲不确定性，方向上的困惑直接传导到每个人。一位最终回到大厂的前员工直言：没有自上而下的 OKR 和 KPI，有些早上你走进办公室不知道该干什么。没有人一定会告诉你你做得好不好。这种缺乏反馈的状态制造了不安全感。它会让人怀念大厂里清晰的汇报线、考核节点和可量化的产出。

那些繁琐的结构，毕竟提供了一样东西：确定性的底线。

目标在哪里？什么算完成？绩效怎么评判？在大公司，这些都是可见的。

那个人说，这不是斯德哥尔摩综合征，这是基本的组织物理学。

如果说阿里像一条精密校准的晋升传送带，字节像一支目标凶猛的战斗军团，腾讯像一所更宽容的职业学院，那月之暗面就像一片原始森林。

天才也许能找到狩猎的路径。普通人可能只是在雾里徘徊。

必要的「二向箔」

没有部门，没有 title，没有考评。

这种 AI 原生的组织模式是反官僚的、刻意去结构化的。大公司已经很难转向这种模式，小公司则往往因为过早扩张为传统架构而错过窗口。这是一场不对称战争。

这里作者引用了《三体》中的经典概念。在那个故事里，高等文明随手使用一种叫「二向箔」的武器，将太阳系从三维坍缩为二维。行星、恒星、人类全部变成一张没有厚度的平面图像。

作者认为，月之暗面正在主动向自己投掷这样一块「二向箔」。

不是为了消灭对手，而是为了把组织压扁，追求最大效率。

没有层级的纵深，没有部门的横墙，没有办公室政治的三维纠缠。只有「模型」和「智能」以最简洁的形式直接面对彼此。

在 AI 时代，每一家创业公司都在被迫向自己扔出这样一块二向箔。一人公司的崛起反映了同样的 AI 原生人才的代际爆发。如果技术能把组织能力压缩到个体身上，那管理的中间层就会大量蒸发。组织被压扁。没有绕弯的纵深。每个人都被迫直面问题本身。

这或许是商业世界中组织进化的硬规律。

每个人，最终都会被折叠。

一旦人们暴露在同一个平面上，一个人对五十个人产生辐射影响就不再是管理奇迹，而成为常态。从中心到边缘的距离被重新定义。依赖 title 和 OKR 作为坐标的人可能瞬间窒息。但天才们在这个暴露的平面上，可以猛烈地拆解智能本身；而「守护者」们则清除噪音和熵增，以并非没有谦逊的姿态，将自己视为拓宽人类文明边界的先锋。

然而从三维到二维的转变不可逆。

这意味着 Kimi 不能走回头路。

每一次战略调整都变成了高风险的混沌迭代。竞争对手还可以在迷宫里慢慢转弯，但如果月之暗面试图鲁莽扩张规模，可能会在结构上把自己撕裂。这种自我降维之所以可以接受，只是因为它服务于更激进的目标。

降低组织维度的终点，是升高智能的维度。

只有当模型智能跨过临界阈值，高到足以逃脱一切碳基组织的引力井，月之暗面才能真正碾碎竞争对手的组织优势，证明这场不可逆的赌注是正确的。

届时，关于管理半径或组织架构的争论都不再重要。那就像问三体文明到底处于哪个维度——真正的重点是，它的降维武器已经改写了战争的规则。

届时，「月之暗面」将不再是一个隐喻。

它将成为一个高维光源，照亮智能宇宙的暗面。此前所有的组织阵痛，不过是登月舱穿越大气层时烧掉的隔热层。

要么在上升中封神，

要么在坍缩中封印。

没有第三条路。

文中所有英文名均为化名。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。