标题:当“千问”不再发问:一位32岁P10的卸任,揭开了大模型时代最危险的幻觉
3月4日凌晨,一条简短英文推文刺穿了AI圈凌晨的静默:
“me stepping down. bye my beloved qwen.”
发信人是林俊旸——阿里通义千问(Qwen)技术负责人、阿里巴巴历史上最年轻的P10级技术专家、1993年出生、32岁、北大外语硕士转AI架构师、亲手带出Qwen1到Qwen3.5开源全系模型的灵魂人物。
没有声明,没有交接公告,没有“感谢平台”的标准话术。只有一句告别,像一次系统静默重启前的最后一行日志。
这不是普通的人事更迭。这是中国最大AI开源项目在巅峰时刻的一次主动断电。
一、“最年轻P10”的倒计时,早写在Qwen3.5的发布夜
就在林俊旸发文前几小时,Qwen团队刚刚上线轻量级新模型Qwen3.5——一个被内部称为“春节后首枚战术核弹”的小尺寸强推理模型。同夜,团队成员Chen Cheng转发其推文,留下一句令人心颤的评论:
“我真的心碎了。我知道离开并非你的选择。就在昨晚,我们还并肩发布Qwen3.5小模型。说实话,我无法想象没有你的Qwen。”
这句话无意间锚定了一个关键事实:林俊旸的卸任,不是项目收官的礼花,而是攻坚中途的急停。
Qwen3.5不是终点,而是通往Qwen4(据传已进入多智能体协同训练阶段)的跳板。而它的首席架构师,在起跳前一秒松开了手。
更值得玩味的是时间点——3月4日,恰逢阿里云完成内部AI品牌全面统一为“千问”的次日。一场高调的品牌收束,紧随一场低调的技术主将离场。这不像交接,更像一种战略对齐失败后的被动清场。
二、被误读的“技术路线之争”:真正溃败的,是范式认知的时差
外界迅速将这场离职归因为“空降高管架权”或“话语权稀释”。但若仅止步于此,就错失了事件真正的历史性切口。
回看过去12个月:
- 2025年春,Manus横空出世,首次实现无需API编排、端到端自主完成“订机票+改酒店+同步日历”三系统任务;
- 2025年秋,OpenClaw以“自然语言即工作流”的交互范式引爆开发者社区,单周GitHub Star破12万;
- 同期,阿里云披露的企业级大模型Token消耗量中,智能体(Agent)类请求占比从7%飙升至63%——而其中,由Qwen驱动的智能体调用量不足3%。
这不是模型不够强的问题。Qwen3在MMLU、GPQA等基准上稳居全球开源模型前三。问题在于:阿里仍在用“更强的对话模型”去解“更复杂的执行问题”,而世界已切换到用“更鲁棒的智能体”去重构“更真实的业务流程”。
林俊旸团队曾引以为傲的“一句话下单”能力——春节期间服务近2亿次——本质上仍是封装好的电商API链路。它高效、可控、闭环,却不具备跨域规划能力,不生成中间状态,不自我纠错,不主动追问模糊意图。它是一条高速流水线,而非一个能思考的工人。
当行业叙事从 “What can the model say?”(模型能说什么?)悄然转向 “What can the agent do — and then decide to do next?”(智能体能做什么,并主动决定下一步做什么?),Qwen的基础设施(Infra)优势,反而成了转向Agentic Workflow的最大路径依赖。
一位接近通义实验室的工程师私下坦言:“我们花了18个月优化蒸馏压缩和KV Cache复用,却没人牵头建一个像LangGraph那样的原生Agent Runtime。不是不会,是没被列为‘一级战备’。”
三、告别Qwen,不是告别技术,而是告别一种“确定性幻觉”
林俊旸的离开,表面是人事地震,深层是一次范式警报:
当大模型竞争进入深水区,真正的护城河,早已不在参数规模与推理速度,而在“模型如何与世界持续交互”的操作系统级设计能力。
Qwen曾是中国开源AI最耀眼的旗帜——它证明了后发者可以靠极致工程与开放策略赢得全球信任。但它也暴露了一个隐秘困境:在快速追赶“模型能力”的赛道上,我们太擅长把黑箱变大,却迟迟不愿拆开黑箱,重装一套面向行动的操作系统。
林俊旸那句“bye my beloved qwen”,或许不只是告别一个项目。
它是对一种技术乐观主义的温柔撤稿——那种相信“只要模型足够大、数据足够多、算力足够猛,智能自会涌现”的信念,正在被智能体世界里无数个失败的plan→act→observe→reflect循环所证伪。
真正的AI革命,从来不在服务器里,而在任务流中;
不在benchmark分数上,而在用户说“帮我搞定这件事”之后,系统沉默三秒,然后说:“我需要先查您的航班状态,再联系酒店取消订单——您介意我同步更新飞猪行程吗?”
那三秒沉默,才是新时代的起点。
而此刻,Qwen还在等待那个敢于按下“执行”键的人。
——未完待续。
本文作者为izhu,转载请注明。