小道消息独家爆料:小米今日震撼发布了其首个专为“Reasoning(推理)”打造的大模型MiMo-7B,并宣布全面开源!据小米公司公众号“Xiaomi MiMo”透露,这款模型在AIME数学推理和LiveCodeBench编程测评中表现出色,超越了OpenAI的o1-mini及阿里巴巴的Qwen-32B。
MiMo-7B通过大规模推理数据的预训练与强化学习,提出Test Difficulty Driven Reward等创新算法,进一步提升了其推理能力。在同类7B模型中,MiMo-7B的强化学习潜力表现尤为突出。小米全系列模型现已开源至Hugging Face平台,相关技术报告也已同步发布,供开发者和研究人员深入研究和应用。