6月16日,DeepSeek网页端和App的“快速模式”思维链悄悄变了脸。用户发现,新风格的思考过程不再是“好的,让我分析一下”这种拟人化开场,而是出现了大量"### 1. 问题分析""### 2. 关键信息提取"这样的结构化标题和列表格式——更接近GLM或通义千问那种学院派风格。
为什么变了:prompt改了,不是模型换了
这次变化几乎可以确定是系统层面的prompt调整,而非新模型权重上线。DeepSeek-R1的思维链风格,本质上由RL训练阶段的prompt template塑造——R1论文用的是最简模板,只要求把推理过程放在think标签里,不加风格约束,所以模型长出了“会犹豫”“wait wait”的拟人化气质。现在快速模式只要在系统指令里加一句“用结构化列表组织推理步骤”,模型立刻换风格,不需要重新训练。
这次调整还有两个特征:其一,多轮对话时触发概率更高;其二,“专家模式”目前未受影响,说明调整暂时只针对快速模式——也就是对速度敏感、对深度推理要求不高的场景。值得注意的是,v4预览版早在3月灰度更新时已采用类似结构化风格,这次不过是扩大了适用范围。
背后逻辑:把Harness从外部塞进模型里
这次变化并非单纯“换个皮”。从更宏观的视角看,它指向DeepSeek一直在推进的方向:把原本依赖外部工程实现的可靠性保障(Harness),逐步训练进模型内部。
早期大模型做复杂任务,需要靠外部ReAct循环逼它“先想再做”。DeepSeek-R1通过RL把自我反思和self-verification直接焊进了模型权重,模型自己会犹豫、会检查了。这次快速模式的结构化升级,是这个进程的第三步:让模型不仅会反思,还要反思得干净、可读、可复现。当结构化思维链成为默认行为模式,用户看到的就不只是“回答更好”,而是模型内部推理过程的透明度和可控性提升——这是把Harness能力内化的关键一步。
编注:信源为知乎技术讨论帖,多名用户提供了触发复现与配置下发证据,材料侧重风格变化描述与技术机制推测,未涉及商业动态。