大模型的 /think（深度推理）与 /no_think（快速响应）实现原理

原创

于 2025-06-30 12:37:58 发布 · 2k 阅读

·

20

·

标签

#大模型 #慢思考 #快思考

大模型的 /think（深度推理）与 /no_think（快速响应）模式是优化推理效率与精度的两种核心技术路径。其区别本质在于是否显式生成中间推理步骤，以及资源分配策略的差异。以下从技术实现、性能对比及应用场景三方面系统解析：

在这里插入图片描述

⚙️ 一、技术实现原理

1. `/think` 模式（深度推理）

核心目标：通过多步显式推理提升复杂任务准确性。
实现方式：
- 思维链（CoT）：模型生成逐步推理文本（如：“首先…其次…”），通过自我验证提升逻辑性。
- 结构化框架：
  - 累积推理（CR）：姚期智团队提出“提议者-验证者-报告者”三重架构，构建有向无环图（DAG）存储正确中间结果，正确率达98%。
  - 思维分段（InftyThink）：浙大团队将长推理拆分为多段短推理，每段生成总结作为下一段输入，突破上下文限制（如4K→无限长度）。
- 自适应触发：清华AdaptThink通过强化学习动态选择思考深度，例如简单问题跳过思考，复杂问题启用长推理。

2.

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。