Mistral重新加入开源：推出高性能AI模型Devstral，适用于笔记本电脑

Mistral重返开源社区，推出高效AI模型Devstral

在一个重要的举措中，法国AI模型制造商Mistral在社区部分成员对其最新的闭源模型Medium3提出批评后，重新回到了开源领域。该公司与开源初创公司All Hands AI合作，后者是OpenDevin的创作者，推出了一种新的开源语言模型Devstral。这个轻量级模型拥有2400万个参数，专门设计用于AI软件开发，并在某些基准测试中表现超越了许多拥有数十亿参数的竞争对手。

与传统的大型语言模型（LLMs）主要关注代码补全或生成独立函数不同，Devstral被优化为一个全面的软件工程代理。这一能力使其能够理解跨文件的上下文，导航大型代码库，并解决现实世界的软件开发挑战。值得注意的是，Devstral在宽松的Apache 2.0许可证下发布，允许开发者和组织自由部署、修改和商业化该模型。

Mistral的AI研究科学家Baptiste Rozière强调，目标是为开发者社区提供一个可以本地运行并根据特定需求进行修改的工具，Apache 2.0许可证提供了显著的用户灵活性。

在Codestral成功的基础上

Devstral代表了Mistral代码中心模型系列Codestral的最新进展。Codestral于2024年5月推出，拥有220亿个参数，支持超过80种编程语言，在代码生成和补全任务中表现出色。Codestral的快速迭代导致了增强版本的出现，包括Codestral-Mamba和最新的Codestral 25.01，这些版本在IDE插件开发者和企业用户中获得了广泛的欢迎。Codestral系列的成功为Devstral的发展奠定了坚实的基础，使其能够从简单的代码补全扩展到执行完整的代理任务。

在SWE基准测试中的出色表现

在SWE-Bench Verified基准测试中，Devstral取得了46.8%的优异分数。SWE-Bench Verified是一个包含500个真实GitHub问题的数据集，经过人工验证以确保准确性。这个分数不仅超越了所有之前发布的开源模型，还超过了包括GPT-4.1-mini在内的多个闭源模型，超过了20个百分点。Rozière自豪地表示，Devstral是迄今为止在SWE-bench验证和代码代理任务中表现最好的开源模型，并且值得注意的是，它可以在仅有2400万个参数的MacBook上本地运行。

Mistral AI的开发者关系负责人Dr. Sophia Yang在社交媒体上也指出，Devstral在各种框架中超越了许多闭源替代品。该模型的卓越表现归功于对Mistral Small3.1基础模型应用的强化学习和安全调优技术。

超越代码生成：AI软件开发的基础

Devstral的目标不仅仅是代码生成；它旨在与OpenHands、SWE-Agent和OpenDevin等代理框架无缝集成。这些框架使Devstral能够与测试用例互动，导航源代码文件，并在项目中执行多步骤任务。Rozière透露，Devstral将与OpenDevin一起发布，后者为代码代理提供了支架，作为开发者模型的后端。

为了确保模型的可靠性，Mistral对Devstral进行了严格的测试，涵盖了各种代码库和内部工作流程，以防止对SWE-bench基准的过拟合。他们仅使用来自非SWE-bench数据集的数据进行训练，并验证了模型在不同框架中的表现。

以商业友好的开源许可实现高效部署

Devstral的2400万个参数的紧凑架构使开发者能够轻松在本地运行，无论是在配备单个RTX 4090 GPU的机器上，还是在内存为32GB的Mac电脑上。这一特性对于优先考虑隐私并需要在边缘设备上部署的应用程序尤其具有吸引力。Rozière表示，该模型的目标用户包括希望进行本地和私有操作的开发者和爱好者，即使在离线环境中。

除了其性能和可移植性外，Devstral的Apache 2.0许可证为商业应用提供了显著优势。该许可证允许无限制的使用、修改和分发，包括在专有产品中，显著降低了企业采用的门槛。

Devstral具有128,000个标记的上下文窗口，并使用131,000个单词的词汇表的分词器。它支持通过Hugging Face、Ollama、Kaggle、LM Studio和Unsloth等流行的开源平台进行部署，并与vLLM、Transformers和Mistral Inference等库兼容。

API和本地部署选项

开发者可以通过Mistral的Le Platforme API访问Devstral，模型名为devstral-small-2505，定价为每百万输入标记0.10美元，每百万输出标记0.30美元。对于有兴趣进行本地部署的用户，支持OpenHands等框架使其能够立即与代码库和代理工作流程集成。Rozière分享了他使用Devstral进行小型开发任务的经验，例如更新包版本或修改标记化脚本，称赞其准确定位和修改代码的能力。

尽管Devstral目前处于研究预览阶段，Mistral和All Hands AI已经在开发更强大和更大规模的后续模型。Rozière认为，小型和大型模型之间的差距正在迅速缩小，像Devstral这样的模型的出色表现现在与一些更大型竞争对手相当。

凭借其卓越的基准表现、宽松的开源许可和针对代理设计优化的特性，Devstral不仅是一个强大的代码生成工具，还准备成为构建自主软件工程系统的关键基础模型。

有关AI世界的更多见解，请关注我们的每日更新，探索AI产品和应用中的最新趋势和创新。