法国 AI 实验室 Mistral 推出推理模型 Magistral 系列

  • 2025-06-17 17:01:13
  • 685

IT之家6月11日消息,法国人工智能实验室Mistral周二宣布进军推理人工智能模型领域。6月10日,Mistral正式推出其首个推理模型系列——Magistral。该系列模型通过分步骤解决问题,旨在提升在数学、物理等学科领域的一致性和可靠性,与OpenAI的o3模型和谷歌的Gemini2.5Pro等其他推理模型类似。

Magistral系列包含两个版本:MagistralSmall和MagistralMedium。MagistralSmall拥有240亿参数,已在人工智能开发平台HuggingFace上以Apache2.0许可证开放下载。而MagistralMedium是一个能力更强的模型,目前处于预览阶段,仅在Mistral的LeChat聊天平台、公司API以及第三方合作伙伴云平台上提供。

Mistral在其博客文章中表示:“Magistral适用于广泛的企业级应用场景,包括结构化计算、程序化逻辑、决策树和基于规则的系统。这些模型经过多步骤逻辑的微调,能够提升可解释性,并以用户语言提供可追溯的思考过程。”

Mistral成立于2023年,是一家前沿模型实验室,致力于开发一系列人工智能驱动的服务,包括LeChat和移动应用程序。该公司获得了GeneralCatalyst等风险投资机构的支持,目前已筹集超过11亿欧元(IT之家注:现汇率约合90.22亿元人民币)的资金。

尽管Mistral拥有强大的资源,但在某些领域,例如开发推理模型方面,其落后于其他领先的人工智能实验室。从Mistral自己的基准测试来看,Magistral的竞争力似乎也不够突出。在评估模型物理、数学和科学技能的GPQADiamond和AIME测试中,MagistralMedium的表现不如Gemini2.5Pro和Anthropic的ClaudeOpus4。此外,在流行的编程基准测试LiveCodeBench中,MagistralMedium也未能超越Gemini2.5Pro。

或许正因如此,Mistral在其博客文章中着重强调了Magistral的其他优势。Mistral声称,Magistral在LeChat上的答题速度是竞争对手的10倍,并且支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。

该公司在文章中写道:“基于我们的旗舰模型,Magistral专为研究、战略规划、运营优化和数据驱动决策而设计,无论是执行多因素风险评估和建模,还是在约束条件下计算最优交付窗口,都能胜任。”

Magistral的发布是在Mistral推出“氛围编程”客户端MistralCode之后不久。而在几周前,Mistral还发布了多个专注于编程的模型,并推出了LeChatEnterprise,这是一款面向企业的聊天服务,提供人工智能代理构建器等工具,并将Mistral的模型与Gmail和SharePoint等第三方服务集成。