小米，开源！

来自: 每日经济新闻收藏邀请

每经编辑金冥羽

4月30日，小米宣布开源首个为推理而生的大模型Xiaomi MiMo。据称，其在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

YRdSz9epGVjn3ichzP6CzICYF3OpYNbYSvvKR8LR0LWUBW8XM9tOuQSGISwdAsPvFP5KaqPXlUEtKESIlDDNr5w.jpg

图片来源：Xiaomi MiMo微信公众号

受此消息影响，今日小米股价涨5.27%，金山云和金山软件更是分别大涨14.20%和7.07%。业内人士认为，小米作为国产头部的手机品牌厂商，此次开源的小参数规模模型展现了较强的性能，为AI在手机端侧的应用和运行提供了更坚实的模型基础。

CFF20LXzkOyP3r3YMnfwzibjqUgyCoVNFZKGY6icutvaDBj1QTxG0Wia6UwlfC2ZerLXIxZwOz9Y5mI5NujnCk4aA.jpg

图片来源：Wind

随着MiMo模型的开源，小米刚刚成立不久的小米大模型Core团队也终于浮出水面。小米创始人雷军曾在2023年表示，自2016年组建AI团队以来，到2023年4月第一时间成立专职大模型团队，经过多次扩展，小米AI团队相关人员规模已达3000多人，逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。

小米大力“押宝”大模型早在去年底便已有消息传出。DeepSeek-V3爆火之后，背后的AI“天才少女”罗福莉引发了大众的关注，彼时就有媒体报道称，雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉，领导小米AI大模型团队。

值得一提的是，DeepSeek同日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉，DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式，并支持多种计算精度，方便模型更快、更省资源地训练和部署，参数达6710亿，或为去年发布的Prover-V1.5数学模型升级版本。在模型架构上，该模型使用了DeepSeek-V3架构，采用MoE（混合专家）模式，具有61层Transformer层，7168维隐藏层。同时支持超长上下文，最大位置嵌入达16.38万，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提高推理效率。

中信建投研报表示，大模型能力不断迭代增长，但模型之间差异在缩小。这些技术需要在终端设备上应用落地，最终通过这些应用/终端实现商业价值的转化，从而形成一个从投资到变现的完整闭环。目前，Meta、字节、小米等巨头已经开始大力布局端侧AI，抢夺AI Agent入口。除了手机、PC、眼镜、耳机外，潜在的端侧AI基数巨大，家电、机器人、智能车、教育办公设备、玩具等都受益于端侧AI的趋势，AI嵌入将带来广泛的硬件升级。重点关注算力、存储、连接、电力等硬件环节。

（声明：文章内容和数据仅供参考，不构成投资建议。投资者据此操作，风险自担。）

编辑|||金冥羽杜波

校对|陈柯名

封面图片来源：视觉中国

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png 每日经济新闻综合证券时报、财联社、Wind等