小米首次发布开源大模型“Xiaomi MiMo”。

硅基玩家

2025年4月30日

1. 雷总首次发布大模型?

2025.4.30号,小米开源首个为推理(Reasoning)而生的大模型「Xiaomi MiMo」,联动预训练到后训练,全面提升推理能力。在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

 

2. 模型能力如何?

  1. 小米这次发布的是”推理模型“。RL调优版本模型 MiMo-7B-RL 在数学、代码和一般推理任务表现不错。
  2. 这个模型的参数只有7B,70亿个训练参数,而Deepseek是671B。因为参数较小,所以这个模型的通用能力,多模态和Agent等方面可能不够。

通俗来讲,小米这款Xiaomi MiMo大模型,像是个数学成绩不错的高中生,但是其他各个学科各个方面,比如人文、艺术、历史等知识相对匮乏。离那种百科全书式的博学家还有差距。

 

3. 如何评价?

或许是一个好的开始,雷总的人车家战略,各个方面都需要人工智能大模型的支撑,对于小米是一个非常重要的点。

保持关注。

 

发表评论