“价格屠夫”来了:小米MiMo大模型API永久降价最高达99%
- 时间:
- 浏览:160
- 来源:越西县融媒体中心
价格腰斩再腰斩 小米MiMo创下行业新低
5月27日, 小米宣告MiMo-V2.5系列大模型API价格永久性降低,最大降幅达到了99%, 并且不再对上下文长度进行区分。这一消息快速在AI圈引发热烈讨论, 百万tokens输入缓存命中价格仅仅是0.025元, 输出价格是6元, 直接刷新了国内大模型定价的底线。和之前相比, 用户差不多能够以“白菜价”调用顶尖大模型能力, 不少开发者大声呼喊“终于用得起”。
巨头对决 小米与DeepSeek上演降价双雄
就在一周之前, DeepSeek才宣告V4 - Pro永久降价到原价的百分之二十五, 当下小米紧接着跟上, 致使国产大模型降价的潮流持续热度升高。从国际对比的角度来讲, 小米MiMo - V2.5 - Pro的输出价格换算下来每百万tokens仅仅需要零点八美元, 然而OpenAI GPT - 4o的同等输出是十美元, Claude Sonnet 4.6更是高达十五美元。中国和外国的价差差距非常大, 小米跟DeepSeek已经明显比海外主流厂商要低, 从而引发市场对于国产模型竞争力的重新评估。
技术创新 工程优化而非简单烧钱
小米此次降价, 并非是盲目进行补贴, 而是源自工程层面的成本结构得到了优化。据公司作出的解释, 基于SGLang HiCache对SWA的支持, KV Cache在多级存储之间的数据搬运量下降到了优化之前的将近1/7, 能够缓存的token数量提升到了将近5倍。借助专家方案以及输入长度分桶策略, 小米明显提升了集群输入吞吐能力, 达成了结构性成本压缩, 进而把红利让渡给开发者。
加量不加价 Token Plan升级引关注
小米除了进行价格下调之外, 还对Token Plan作出了调整, 在Agent场景或者Code场景之下, 用户能够使用的Token数量提高到了原本的5至8倍, 规则变成了“所见即所得”, 将复杂的换算逻辑予以简化。这表明开发者不但能够以低价调用模型, 而且还能够获取到更多的可用资源。对于那种高频调用的用户而言, 实际可用资源的大幅度增加, 直接把项目部署的门槛降低了。
应用场景转变 从聊天到干活的刚需驱动
此轮降价潮的背后, 存在着大模型应用场景的深刻改变, 行业开始从“聊天”迈向“干活”阶段, 开发者以及企业用户不再担忧单次问答的金额, 而是对Agent在多轮推理、调用以及自动化工作流里持续消耗的Token感到焦虑, 当百万Tokens的价格被持续压低, 更多复杂应用的部署成本急剧下降, 国产大模型正式步入规模化使用阶段。
生态竞争加速 价格战推动开发者井喷
开发者角度看, 成本下降表明Agent等应用供给会迎来增长热潮。厂商领域讲, 低价预示着有更高的推理效能、更强的算力调配能力以及更长时间的生态投入。价格竞争虽不一定能直接判断谁的模型最为强大, 却能够促使其更快地获得开发者调用。小米MiMo于此刻大幅度降低价格, 恰是国产大模型迈向“规模化应用”的重要证明。
于你而言, 在经过小米此次实施降价举措后, 你有无欲尝试借助其API去开展开发应用程序的想法呢? 欢迎于评论区之际分享你自身有关此方面的看法, 点赞以及转发这一内容以便能让更多的人观看到这场大模型所引发的价格方面的带有变革冲击性质的风暴!
猜你喜欢