模型输出内容被截断“finish_reason“:“length“

🎨 Class Qwen3: 多模态对话视觉黑板报

🎨 Class Qwen3: 多模态对话视觉黑板报

图文对话
Qwen
Qwen3

Class Qwen3: 多模态对话视觉黑板报 是一款将顶尖视觉大模型 (Qwen3-VL) 与 怀旧动漫校园风 完美融合的 AI 对话终端。我们抛弃了传统 AI 工具厚重的控制面板,采用了类似于 DeepSeek 的极简布局,让您在清新、自然的黑板手绘氛围中,开启一段智能化的视觉探索之旅。

背景:mindie部署qwen3-4b

问题:模型输出时输出内容被截断

在这里插入图片描述

显示结束原因是因为长度限制,即"finish_reason":“length”

原因:mindie的配置文件中限制了输出token长度

解决:修改mindie配置文件中的参数

"maxSeqLen" : 8192,
"maxInputTokenLen" : 2048,
"maxPrefillBatchSize" : 8,
"maxBatchSize" : 16,
"maxIterTimes" : 4096,

maxInputTokenLen(输入tokens) + maxIterTimes(输出tokens) <= maxSeqLen(总tokens)

mindie中在实际执行中,​​maxIterTimes的优先级通常最高​​。系统会先检查是否达到了生成次数限制。因此,即使 maxInputTokenLen + maxIterTimes的值小于 maxSeqLen,只要生成步数达到 maxIterTimes,也会触发 finish_reason: "length"而停止。这也就是模型输出被截断的原因,因为配置文件中maxIterTimes的默认值是512。

您可能感兴趣的与本文相关的镜像

🎨 Class Qwen3: 多模态对话视觉黑板报

🎨 Class Qwen3: 多模态对话视觉黑板报

图文对话
Qwen
Qwen3

Class Qwen3: 多模态对话视觉黑板报 是一款将顶尖视觉大模型 (Qwen3-VL) 与 怀旧动漫校园风 完美融合的 AI 对话终端。我们抛弃了传统 AI 工具厚重的控制面板,采用了类似于 DeepSeek 的极简布局,让您在清新、自然的黑板手绘氛围中,开启一段智能化的视觉探索之旅。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值