小米推出首个推理大模型MiMo-7B并全面开源

小道消息独家爆料：小米今日震撼发布了其首个专为“Reasoning（推理）”打造的大模型MiMo-7B，并宣布全面开源！据小米公司公众号“Xiaomi MiMo”透露，这款模型在AIME数学推理和LiveCodeBench编程测评中表现出色，超越了OpenAI的o1-mini及阿里巴巴的Qwen-32B。

MiMo-7B通过大规模推理数据的预训练与强化学习，提出Test Difficulty Driven Reward等创新算法，进一步提升了其推理能力。在同类7B模型中，MiMo-7B的强化学习潜力表现尤为突出。小米全系列模型现已开源至Hugging Face平台，相关技术报告也已同步发布，供开发者和研究人员深入研究和应用。