0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码

科技堆里的狠货 2025-12-22 阅读:3280 评论:0

(电子发烧友网报道 文/ 章鹰)12月17日,2025小米人车家全生态合作伙伴大会举行,小米MiMo大模型负责人罗福莉首次登场,她解读小米最新开源大模型MiMo-V2-Flash,抛出“全球开源模型Top2”“推理成本仅为标杆模型2.5%”等重磅信息。

0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码

截至2025年12月19日,小米发布的 MiMo-V2-Flash、深度求索(DeepSeek)的 DeepSeek-V3.2,以及阿里巴巴的 Qwen-3均为当前国产大模型中的代表性产品。在与DeepSeek V3.2、千问Qwen-3对比当中,小米开源大模型到底有哪些优势和应用价值?本文进行详细分析。

全球开源模型Top2,主打超绝性价比

MiMo-V2-Flash是小米全新一代面向Agent的基座模型,总参数309B,激活参数15B,支持256k上下文窗口,整体针对推理、编码和Agent场景构建,支持混合思维模式,允许用户切换“思考”和即时回答模式。

目前,MiMo-V2-Flash推理吞吐速度为每秒150个token,成本定价0.7元/每百万输入token,2.1元/每百万输出token,主打超绝性价比。

在架构设计上,小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块,其中每5个滑动窗口注意力(SWA)层对应1个全局注意力层。在上下文支持能力上,该模型原生支持32K的训练,并且能够扩展到256K的上下文支持。

从性能表现来看,小米MiMo-V2-Flash在通用基准测试中,与DeepSeek-V3.2不相上下,同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势,在Day-0时,输出速度高达每秒150个token,这一速度在同类模型中处于领先地位。

0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码

图来自小米官方微信

在多个Agent测评基准上,MiMo-V2-Flash进入全球开源模型Top 2;编码能力超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理成本仅为其2.5%,生成速度提升2倍。

小米MiMo-V2-Flash推理效率高,来源两大创新

罗福莉指出,我们要围绕极致的推理效率去重新设计模型结构。模型结构主要源自两大创新:一、模型注意力机制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑动窗口注意力机制),其中SWA与Full Attention(全局注意力机制)的比例是5:1,滑动窗口只看 128 个 token。相较于一些复杂的Linear Attention(线性注意力机制),SWA在兼顾长短文的推理、知识检索等方面更胜一筹。

二是在于MTP(Multi-Token Prediction)。罗福莉表示,团队在训练时加入了一层MTP层以提高基座模型能力,并在微调时也加入了更多MTP层,最终在推理时加入了3层MTP,以加速并行token验证的方式实现了2-2.6倍推理速度的提升。

还有,为了提高强化学习训练的稳定性,MiMo团队提出了一种叫做Multi-Teacher On-Policy Distillation(MOPD)的后训练范式。相较于传统SFT+RL(微调+强化学习)的后训练方式,它可以提供稠密的token level监督学习信号,以简单快速的方式获得各个专家模型的能力。

此外,小米并推出线上AI聊天服务“Xiaomi MiMO Studio”,用户可在其中体验“MiMo-V2-Flash”。

罗福莉在社交平台上透露了更多信息,MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。

小米发布MiMo-V2-Flash,不仅仅是一次大模型领域的技术创新,更是其“人车家全生态”战略的关键支点。该模型通过多项架构创新与成本优化,为 AI智能体(AI Agent)在终端设备上的落地提供了前所未有的赋能能力。

我们认为,MiMo-V2-Flash 不只是“一个更快的大模型”,而是小米打造 “终端原生智能体操作系统” 的基石。它有机会让每一台小米设备都可能成为一个 有记忆、会思考、能行动的智能体节点,最终助力实现雷军所说的“AI for All Devices, All the Time”。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

热门文章
  • 在中超联赛赛场北京成都球迷高呼:北京加油,成都雄起

    在中超联赛赛场北京成都球迷高呼:北京加油,成都雄起
      9月14日晚,中超联赛成都蓉城对北京国安的比赛在成都凤凰山体育场举行。首都文明办工作人员到现场力促两地球迷的友好互动,引导球迷文明观赛。   开赛前,两地球迷早早来到赛场,成都球迷在赛场通道为等待入场的北京球迷拉歌拍照。一边是北京球迷激昂的歌声,一边是身穿“雄起”“成都”等字样球衣的成都球迷,画面和谐温馨。首都文明办给两地球迷代表赠送了“向北京榜样学习”宣传品,呼吁两地球迷在场上是对手,在场下是朋友。合影留念时,成都球迷高喊“北京加油”,北京球迷高喊“成都雄起”。...
  • 防风防寒!北京今天晴朗伴大风寒意十足 周末将迎小幅升温

    防风防寒!北京今天晴朗伴大风寒意十足 周末将迎小幅升温
      中国天气网讯 今天(12月27日),北京天气晴间多云,最高气温2℃,白天北风劲吹,阵风可达六至七级,风寒效应明显。本周末,北京仍以晴为主,风力不大,气温将有小幅上升。   昨天,北京晴冷在线,气温继续下跌,南郊观象台最高气温仅有2.6℃,加上风力较大,体感十分寒冷。   北京市气象台预计,今天白天晴间多云,北风三四级(阵风六七级),最高气温2℃;夜间晴间多云,北风二三级间四级,最低气温零下7℃。   明后两天,北京仍以晴为主,风力不大,最高气温将略升至5℃,最低气温...
  • 西南地区持续阴雨天气 华北黄淮等地大气扩散条件逐步转差

    西南地区持续阴雨天气 华北黄淮等地大气扩散条件逐步转差
      摘要:   国内方面,昨日,全国降水整体较弱;内蒙古、东北地区等地出现大风降温天气。未来三天,青藏高原及云南、四川、贵州等地多阴雨天气,关注局地强降雨或持续降雨可能引发的次生灾害。   全球方面,昨日,欧洲东部美国东南部等地出现强降雨。未来三天,飓风“米尔顿”继续影响美国东南部等地;强冷空气影响中亚等地;欧洲大部大范围降水降温。   一、国内天气情况   1.实况   全国降水整体较弱 内蒙古东北地区等地出现大风降温天气   昨日8时至今日6时,全国降水整体较...
  • 新手如何开始跑步?

    新手如何开始跑步?
    大家好,我是小贝~ 有喜欢我的分享的可以给我点个关哟~多多互动吧~🫰 跑步是最简单的运动之一。人类进化30万年,跑步是基因自带的能力。可以说天生人人都会跑,人人都可以跑。 所以,很多平时不跑步的人,想入门跑步,建议从以下4个方面开始 一、跑步一定要穿跑鞋! 10年前我跑步穿平时的休闲鞋跑了2周,跟腱受伤!因为休闲鞋没有缓震效果;对膝盖和跟腱的损害较大。 专业跑鞋鞋底有缓震设计,能减少跑步时对膝盖和脚踝的冲击力。保护膝盖和脚踝不容易受伤。 二、注意跑步频率和强度。 1、频率...
  • 大雾黄色预警:京津冀等8省市部分地区有大雾 局地强浓雾

    大雾黄色预警:京津冀等8省市部分地区有大雾 局地强浓雾
      据报道10月14日电据中央气象台网站消息,预计10月14日早晨至上午,河北中南部、北京、天津西部、山东西部、山西中东部、陕西北部、河南东北部和南部部分地区、湖北中部等地有大雾天气,其中,河北中南部、北京西部、山西中部、陕西北部、湖北中部等地的部分地区有能见度低于500米的浓雾,局地有不足200米的强浓雾。中央气象台14日6时继续发布大雾黄色预警。   此外,14日,华北中南部、黄淮中西部、汾渭平原等地大气扩散条件较差,有轻至中度霾,其中,北京南部、河北西部沿山部分地区有...