39 块能跑 5 亿 Token:小米 MiMo V2.5 的 Credits 到底怎么算

39 块能跑 5 亿 Token:小米 MiMo V2.5 的 Credits 到底怎么算

小米 MiMo 在 5 月 27 日的调价公告里,除了把 API 价格砍了个遍,Token Plan 的计费规则也重写了。最核心的变化是 Credits 与 Token 的换算关系——这个数字直接决定了你买的套餐能用多久。

我们先看对比。V2 系列和 V2.5 系列的换算倍数完全不同:

模型

命中缓存

未命中缓存

输出

mimo-v2.5-pro

2.5 Credits/token

300 Credits/token

600 Credits/token

mimo-v2.5

2 Credits/token

100 Credits/token

200 Credits/token

mimo-v2-pro

140 Credits/token

700 Credits/token

2100 Credits/token

mimo-v2-omni

56 Credits/token

280 Credits/token

1400 Credits/token

几个数字摆在一起,差别就出来了。

缓存命中的差距最大

V2.5-Pro 命中缓存时,每 Token 只需要 2.5 个 Credits。而 V2-Pro 是 140 个——差了 56 倍。MiMo V2.5 更是只要 2 个 Credits,比 V2-Omni 的 56 倍低了 28 倍。

这个差距不是微调,是量级上的碾压。原因在于 SGLang HiCache 对 SWA(滑动窗口注意力机制)的完整支持,把 KV Cache 在 GPU、CPU、SSD 之间的搬运量压到了原来的七分之一,可缓存的 token 数量翻了近五倍。缓存命中率上去之后,每 Token 的 Credits 消耗自然跟着往下掉。

换句话说,V2.5 的定价策略在赌一件事:你的任务缓存命中率不会太低。只要缓存命,V2.5 就是目前市面上每 Token Credits 消耗最低的模型之一。

未命中缓存和输出也大幅降低

未命中缓存的情况下,V2.5 每 Token 消耗 100 Credits,比 V2-Pro 的 700 低了七倍,比 V2-Omni 的 280 也低了 2.8 倍。输出方面,V2.5 每 Token 200 Credits,V2-Pro 要 2100——差了十倍多。

也就是说,不管缓存命不命中,V2.5 的 Credits 消耗都比老模型低。只是缓存命中的优势更夸张而已。

套餐 Credits 额度升级后的实际用量

换算规则变了,套餐里的 Credits 总额也变了。四档套餐的 Credits 从几亿跳到几百亿:

套餐

定价

调整前

调整后

Lite

¥39

0.6 亿

41 亿

Standard

¥99

2 亿

110 亿

Pro

¥329

7 亿

380 亿

Max

¥659

16 亿

820 亿

Credits 多了,每 Token 消耗的 Credits 也少了。两个变化叠加之后,实际能用的 Token 数量涨到了原来的 5 到 8 倍。小米官方按 95%+ 缓存命中率的场景做了估算:

使用 MiMo-V2.5

使用 MiMo-V2.5-Pro

Lite ¥39

500M+

Lite ¥39

190M+

Standard ¥99

1300M+

Standard ¥99

500M+

Pro ¥329

4700M+

Pro ¥329

1800M+

Max ¥659

10000M+

Max ¥659

3900M+

Lite 套餐用 V2.5 能跑 5 亿 Token,Max 套餐能跑 100 亿。这个量级放在当前国内模型市场里,已经是头部水平了。

两个需要留意的点

第一,"具体缓存命中率取决于实际任务"。小米在公告里加了这句话。Agent 和 Code 场景的缓存命中率会更高,但如果是每次输入都完全不同的对话场景,缓存命中的优势就发挥不出来。V2.5 的定价逻辑是鼓励你把任务做长、上下文做复用,不是一次性问完就走的那种用法。

第二,V2-Pro 和 V2-Omni 的 Token Plan 不参与调整,即将下线。也就是说,Credits 换算规则的全面更新只针对 V2.5 系列。还在用老模型的用户被明确建议尽快迁移。

换算规则变了,但套餐价格没变

Lite 还是 39 块,Max 还是 659。价格没涨,Credits 翻了近五十倍,每 Token 消耗的 Credits 又砍了一截。对已经在用 Token Plan 的用户来说,这次调整是纯利好。5 月 27 日零点,所有有效 Token Plan 用户的额度全量重置,按新规则执行——用量清零,按新的 Credits 上限重新计算。

另外,针对 Token Plan 已过期的历史付费用户,小米表示会在"未来一周"宣布额外安排。

相关推荐

苹果7尺寸
beat365在线体育正规吗

苹果7尺寸

⌛ 07-01 👁️ 5393
日本dhc属于什么档次?fancl和dhc在日本哪个档次比较高?
约彩365app官方版下载

日本dhc属于什么档次?fancl和dhc在日本哪个档次比较高?

⌛ 07-20 👁️ 6213
奇異果、木瓜還可以這樣切!難搞的水果去皮撇步一起學
约彩365app官方版下载

奇異果、木瓜還可以這樣切!難搞的水果去皮撇步一起學

⌛ 01-29 👁️ 8259