打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
不再像 CoT(" 思维链 ")一样 " 一个字一个字往外蹦 ",加上" 软思维 "就能让大模型像人类一样进行抽象思考。
来自 SimularAI 和微软 DeepSpeed 的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 " 软推理 ",而非局限于离散的语言符号,打破了基于离散 token 的推理瓶颈。
相比标准 CoT,Soft Thinking 最高提升 Pass@1 平均准确率 2.48%、减少 token 使用量 22.4%。
并且,Soft Thinking 是一种即插即用的推理策略,无需额外训练即可应用于现有模型(如 Llama、Qwen)。

目前主流的语言模型推理方法存在一个关键问题:只能逐字生成离散的语言符号(如单词或子词)。
这就好比思考时只能一个字一个字的蹦出来,不仅限制了模型表达抽象概念的能力,还容易在复杂问题中因 " 单一路径选择 " 而犯错。
人类大脑思考时并非依赖明确的语言符号,而是通过抽象概念的灵活整合进行推理。

Soft Thinking 正是受此启发,将语言模型的推理从 " 离散符号空间 " 拓展到 " 连续概念空间 "。
这样,模型就可以捕捉到介于仅有细微差别的语义之间的概念,能够更灵活地探索多种解题路径,同时保持高效和可解释性。
有网友表示:这种方法解决了自回归 " 贪婪 " 的 next token 搜索问题。

如何让模型像人类一样进行抽象思考推理流程:在连续概念空间中 " 软推理 "
Soft Thinking 仅修改传统 CoT 的中间推理阶段,保留最终答案的离散生成(如数学题的数字答案或代码的具体语句)。
Soft Thinking 的理论本质是线性近似替代路径枚举。
解复杂问题时,传统 CoT 的推理路径数量随步骤呈指数级增长(如每步选 1000 个 token,3 步就有 1000^3 种路径),无法显式枚举。
Soft Thinking 通过线性化近似,将指数级路径求和简化为概念 token 的加权计算。
用 概率加权 替代离散采样,通过连续概念空间中的线性变换,隐式聚合多条路径的信息,避免显式枚举的计算爆炸。

概念 token:用概率分布代替单一符号
传统方法每次生成一个确定的 token(如 "30"" 加 "),而 Soft Thinking 生成一个概率分布(如 "30" 的概率 40%," 乘以 " 的概率 30%," 分解 " 的概率 20% 等),这个分布被称为 " 概念 token"。
每个概念 token 相当于多个可能符号的 " 混合体 ",允许模型同时保留多种推理可能性。
如下图中的例子,在计算 "43 × 34" 时,模型可能同时考虑 " 分解 34 为 30+4" 和 " 直接相乘 " 两种路径的概率,而非只选其一。

连续概念空间:在 " 模糊 " 的语义空间中推理
通过将概念 token 的概率分布与模型的词向量(Token Embedding)加权结合,形成连续的概念空间。
这里的 " 连续 " 意味着模型可以在不同概念之间平滑过渡,例如从 " 分解数字 " 自然过渡到 " 乘法运算 ",而无需用明确的语言符号分隔步骤。

Cold Stop 机制:避免无效循环
由于模型在训练中没见过概念 token(属于 " 分布外 " 输入),长时间推理可能导致陷入重复或混乱(类似人类思维的 " 卡壳 ")。
Soft Thinking 引入了一个 "Cold Stop"机制:通过监测概率分布的熵值判断模型的 " 自信程度 "。
当熵值持续较低时(表明模型对当前推理路径很确定),提前终止中间步骤,直接生成答案,避免浪费计算资源。
测试结果及对比
在基准测试里,QwQ - 32B 模型的平均 Pass@1 准确率从标准 CoT 的 83.84% 提升至 86.32%,最高提升 2.48%,其中在 AIME 2024 数据集上提升 6.45%。
推理效率方面,DeepSeek-R1-Distill-Qwen-32B 在数学任务中 token 使用量减少 22.4%。

与其他方法的对比
COCONUT-TF(无训练):直接使用隐藏状态作为输入,完全失败,生成长度达最大值且无正确解。
平均嵌入策略:仅计算 top-5 token 均值,准确率低且生成长度长(如 AIME 2024 仅 6.66% 正确)。

Soft Thinking 通过连续概念空间推理和 Cold Stop 机制智能平衡了效率与准确性,为大模型优化提供了新思路。
感兴趣的朋友可以到官方了解更多细节。
官方网站:https://soft-thinking.github.io/
论文地址:https://arxiv.org/abs/2505.15778
代码地址:https://github.com/eric-ai-lab/Soft-Thinking
参考链接:https://x.com/xwang_lk/status/1925399783503798692
— 完 —
量子位 AI 主题策划正在征集中!欢迎参与专题365 行 AI 落地方案,一千零一个 AI 应用,或与我们分享你在寻找的 AI 产品,或发现的AI 新动向。
也欢迎你加入量子位每日 AI 交流群,一起来畅聊 AI 吧~
一键关注 点亮星标
科技前沿进展每日见
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!