Mistral 重新加入開源:推出高效能 AI 模型 Devstral 用於筆記型電腦
Mistral 重新加入開源社區,推出高效能 AI 模型 Devstral
在一個重要的舉措中,法國 AI 模型製造商 Mistral 在社區部分成員對其最新的封閉源模型 Medium3 表達批評後,重新回到了開源領域。該公司與開源初創公司 All Hands AI 合作,推出了一個名為 Devstral 的新開源語言模型。這個輕量級模型擁有 2400 萬個參數,專門設計用於 AI 軟體開發,並在某些基準測試中顯示出超越許多擁有數十億參數的競爭對手的性能。
與傳統的大型語言模型 (LLMs) 主要專注於代碼完成或生成獨立函數不同,Devstral 被優化為一個全面的軟體工程代理。這一能力使其能夠理解跨文件的上下文,導航大型代碼庫,並解決現實世界的軟體開發挑戰。值得注意的是,Devstral 在寬鬆的 Apache 2.0 許可下發布,允許開發者和組織自由部署、修改和商業化該模型。
Mistral 的 AI 研究科學家 Baptiste Rozière 強調了為開發者社區提供一個可以本地運行並根據特定需求進行修改的工具的目標,Apache 2.0 許可提供了顯著的用戶靈活性。
在 Codestral 成功的基礎上發展
Devstral 代表了 Mistral 的代碼中心模型系列 Codestral 的最新進展。Codestral 於 2024 年 5 月推出,擁有 220 億個參數,支持超過 80 種編程語言,在代碼生成和完成任務中表現出色。Codestral 的快速迭代導致了增強版本的出現,包括 Codestral-Mamba 和最新的 Codestral 25.01,這些版本在 IDE 插件開發者和企業用戶中獲得了廣泛的受歡迎。Codestral 系列的成功為 Devstral 的開發奠定了堅實的基礎,使其能夠從簡單的代碼完成擴展到執行完整的代理任務。
在 SWE 基準測試中的驚人表現
在 SWE-Bench Verified 基準測試中,Devstral 獲得了 46.8% 的優異分數。SWE-Bench Verified 是一個包含 500 個真實 GitHub 問題的數據集,經過人工驗證以確保準確性。這一分數不僅超越了所有先前發布的開源模型,還超過了幾個封閉源模型,包括 GPT-4.1-mini,超出 20 個百分點。Rozière 自豪地表示,Devstral 是迄今為止在 SWE-bench 驗證和代碼代理任務中表現最好的開源模型,並且值得注意的是,它可以在僅有 2400 萬個參數的 MacBook 上本地運行。
Mistral AI 的開發者關係負責人 Dr. Sophia Yang 也在社交媒體上指出,Devstral 在各種框架中超越了許多封閉源替代品。該模型的卓越性能歸功於對 Mistral Small3.1 基礎模型應用的強化學習和安全調整技術。
超越代碼生成:AI 軟體開發的基礎
Devstral 的目標不僅僅是代碼生成;它旨在與 OpenHands、SWE-Agent 和 OpenDevin 等代理框架無縫集成。這些框架使 Devstral 能夠與測試用例互動,導航源代碼文件,並在項目中執行多步任務。Rozière 揭示,Devstral 將與 OpenDevin 一起發布,該框架為代碼代理提供支架,作為開發者模型的後端。
為了確保模型的可靠性,Mistral 在各種代碼庫和內部工作流程中對 Devstral 進行了嚴格測試,以防止對 SWE-bench 基準的過擬合。他們僅使用來自非 SWE-bench 數據集的數據進行訓練,並驗證模型在不同框架中的性能。
以商業友好的開源許可進行高效部署
Devstral 的 2400 萬個參數的緊湊架構使開發者能夠輕鬆在本地運行,無論是在配備單個 RTX 4090 GPU 的機器上,還是在擁有 32GB 記憶體的 Mac 電腦上。這一特性對於優先考慮隱私並需要在邊緣設備上部署的應用特別有吸引力。Rozière 表示,這個模型的目標用戶包括希望在本地和私有操作中進行開發的開發者和愛好者,即使在離線環境中。
除了其性能和可攜性外,Devstral 的 Apache 2.0 許可為商業應用提供了顯著的優勢。該許可允許不受限制的使用、適應和分發,包括在專有產品中,顯著降低了企業採用的障礙。
Devstral 擁有 128,000 個標記的上下文窗口,並使用 131,000 個單詞的詞彙表的標記器。它支持通過流行的開源平台如 Hugging Face、Ollama、Kaggle、LM Studio 和 Unsloth 進行部署,並與 vLLM、Transformers 和 Mistral Inference 等庫兼容。
API 和本地部署選項
開發者可以通過 Mistral 的 Le Platforme API 訪問 Devstral,該模型名為 devstral-small-2505,價格為每百萬個輸入標記 0.10 美元和每百萬個輸出標記 0.30 美元。對於有興趣進行本地部署的用戶,對 OpenHands 等框架的支持使其能夠立即與代碼庫和代理工作流程集成。Rozière 分享了他使用 Devstral 進行小型開發任務的經驗,例如更新包版本或修改標記化腳本,讚揚其準確定位和修改代碼的能力。
儘管 Devstral 目前處於研究預覽階段,Mistral 和 All Hands AI 已經在開發更強大和更大規模的後續模型。Rozière 認為,小型和大型模型之間的差距正在迅速縮小,像 Devstral 這樣的模型的驚人性能現在已經可以與一些大型競爭對手相媲美。
憑藉其卓越的基準性能、寬鬆的開源許可和針對代理設計的優化功能,Devstral 不僅是一個強大的代碼生成工具,還有望成為構建自主軟體工程系統的關鍵基礎模型。
欲了解更多 AI 世界的見解,請關注我們的每日更新,探索 AI 產品和應用的最新趨勢和創新。
發現一系列針對您需求的創新解決方案,了解更多並探索為用戶打造的 AI 工具,請訪問我們的 AI 工具目錄,在那裡您可以探索智能搜索和 AI 助手等功能,以找到最適合您的工具。







