林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理_雷火·竞技(中国)-全球领先的电竞赛事平台
3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。
文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。
林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。
针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。
来源:凤凰网科技返回搜狐,查看更多
同类文章排行
- 超小团队选择Django还是Flask?
- 亲眼见到明星本人是什么体验?
- 有哪些软件堪称神器,却很少人知道?
- 未来10年,人民币会取代美元吗?
- 做个web服务器,gin框架和go-zero怎么选?
- 国外的女生为什么屁股都大?
- Rust怎么写GUI程序?
- 怎样成为全栈工程师(Full Stack Developer)?
- 程序员如何使用 cursor 写代码?
- 有没有GUI框架开发难度小,***消耗又不多,而且又跨平台?
最新资讯文章
- 为什么以前电视和光盘都没杀死电影,现在电影行业突然就凉了?
- 公立医生帮联系民营救护车,800 公里收费 2.8 万元,收费合理吗?救护车收费标准是什么?
- 为什么女生有体香?
- 20届设计系,我的设计水平很差吗,找不到合适的工作?
- go 有哪些成熟点的后台管理框架?
- 服务器应不应该使用「宝塔」等管理软件?
- 你们学校的校花都是怎么样的?
- 用PHP写了个小框架,怎么才能得到大佬们的指点?
- NAS噪音太大,大家都吧NAS放置到哪了?
- 如果世界是虚拟的,当两个镜子对面放,将会无限反射,会不会将 cpu 算力耗光?
- 「绝世美女」都有什么特点?
- MySQL不香吗,为啥还要Elasticsearch?
- 你被爸妈打得最惨的那一次,是因为什么?
- 面试中被嘲笑Token放在redis里,该如何应对这种情况呢?
- 美国B2轰炸机从关岛轰炸伊朗是走的什么路线?
- 如果让你重新开始学计算机,你的学习路线会怎么选择?
- 现在已经有5K、6K、8K分辨率显示器,那么8K之后是什么?
- Windows 上最应该卸载的三个软件是谁?
- 美国当年靠一台4KB内存的计算机完成登月,这是真的吗?
- 为什么是9月3日阅兵而不是10月1日国庆阅兵?





