最近,一则令人咋舌的消息在AI开发者圈中迅速传播:仅输入一句“你好”,竟消耗了约5万个Token,折合人民币约0.125元。这听起来像是段子,却真实发生在三大运营商(中国移动、中国联通、中国电信)近期推出的“AI算力Token套餐”实测中。
《每日经济新闻》记者的实测结果显示:不到1小时,15元的套餐就已见底。有开发者无奈表示:“用不起。”——这一现象背后,折射出当前AI基础设施商业化进程中的一系列问题。
运营商的“新流量生意”:把Token当分钟数卖
随着传统通信业务增长乏力,三大运营商正试图将Token(词元)包装成继“语音分钟数”“流量MB”之后的第三类基础通信资源,推出诸如“9.9元买千万Token”“1元体验AI算力”等低价套餐,吸引个人用户和中小企业尝鲜。
然而,理想很丰满,现实却骨感。
实测结果令人震惊:
- 输入:“你好”
- 消耗:约 50,000 Tokens
- 费用:按主流定价(2.5元/百万Token),约合 0.125元
- 对比:主流模型(如DeepSeek、通义千问)处理同样请求通常仅需 2~10个Token
这意味着,一次简单问候的成本被放大了数千倍。
为什么一句“你好”会烧掉5万Token?
问题并非出在“你好”本身,而在于底层架构与实现方式:
-
上下文缓存机制缺失
正常情况下,系统应复用历史对话缓存(cached tokens)。但部分运营商平台未优化缓存策略,导致每次请求都重新加载完整上下文(可能包含冗长的系统提示、工具描述、历史记忆等)。 -
Agent框架过度膨胀
一些平台默认启用了复杂的AI Agent框架(如OpenClaw、Hermes等),即使用户只说“你好”,系统也会自动加载数十个技能模块、工具描述、执行计划,导致输入Token暴增至1.6万~5万不等。 -
缺乏透明计费说明
用户无法清楚看到Token消耗明细,误以为“低价套餐=低成本使用”,实际却因架构设计不合理而承担高额隐性成本。
开发者为何“用不起”?
以15元套餐为例:
- 若每句“你好”消耗5万Token,
- 则15元 ≈ 600万Token(按2.5元/百万计),
- 仅能支撑 120次 简单交互。
而主流云厂商(如阿里云、火山引擎)提供的同等算力,月费通常在 3~5元,且支持高效缓存与批处理。运营商套餐的实际成本高出5~6倍。
一位受访开发者直言:“这不是普惠AI,这是割韭菜。”
运营商的困局:有资源,无生态
尽管手握海量用户和网络基础设施,但运营商在AI领域面临两大短板:
- 缺乏自研大模型能力:多依赖第三方模型API,议价能力弱;
- 应用场景模糊:普通用户不知道“Token能干什么”,企业用户则更倾向直接使用云厂商或开源方案。
更讽刺的是,多地营业厅工作人员坦言:“这业务目前还只是概念,无法办理。” ——推广尚未落地,争议已先至。
结语:Token不是新流量,AI需要真实价值
把Token简单类比为“分钟数”或“流量”,是一种危险的简化。AI的价值在于智能输出,而非资源消耗。若不能提供高效、透明、低成本的服务,再便宜的“白菜价”也只会沦为营销噱头。
未来,真正的竞争不在“谁卖得便宜”,而在“谁用得聪明”。
一句“你好”不该烧掉5万Token——它应该开启一段有价值的对话,而不是一场昂贵的误会。

318

被折叠的 条评论
为什么被折叠?



