Mistralがオープンソースに再参加：ノートパソコン向けの高性能AIモデルDevstralを発表

ミストラル、非常に効率的なAIモデルDevstralの発表でオープンソースコミュニティに再参加

重要な動きとして、フランスのAIモデルメーカーであるミストラルが、最新のクローズドソースモデルMedium3に関するコミュニティの一部からの批判を受けて、オープンソースの分野に戻ってきました。同社は、OpenDevinのクリエイターであるオープンソーススタートアップAll Hands AIと提携し、Devstralという新しいオープンソース言語モデルを導入しました。この軽量モデルは、2400万のパラメータを持ち、AIソフトウェア開発のために特別に設計されており、特定のベンチマークテストにおいて数十億のパラメータを持つ多くの競合他社を上回る性能を示しています。

従来の大規模言語モデル（LLM）が主にコード補完や独立した関数の生成に焦点を当てるのに対し、Devstralは包括的なソフトウェアエンジニアリングエージェントとして機能するよう最適化されています。この能力により、ファイル間のコンテキストを理解し、大規模なコードベースをナビゲートし、実際のソフトウェア開発の課題に対処することができます。特に、Devstralは許可のあるApache 2.0ライセンスの下でリリースされており、開発者や組織がモデルを展開、変更、商業化する自由を与えています。

ミストラルのAI研究科学者バプティスト・ロジエールは、開発者コミュニティに特定のニーズに応じてローカルで実行し、変更できるツールを提供することが目標であり、Apache 2.0ライセンスがユーザーに大きな柔軟性を提供すると強調しました。

Codestralの成功を基に

Devstralは、ミストラルのコード中心モデルシリーズであるCodestralの最新の進展を表しています。2024年5月に発表されたCodestralは、220億のパラメータを持ち、80以上のプログラミング言語をサポートし、コード生成や補完タスクにおいて優れた性能を発揮しています。Codestralの迅速な反復は、Codestral-Mambaや最新のCodestral 25.01などの強化版を生み出し、IDEプラグイン開発者や企業ユーザーの間で人気を集めています。Codestralシリーズの成功は、Devstralの開発にしっかりとした基盤を提供し、単純なコード補完から完全なプロキシタスクの実行へと拡大することを可能にしました。

SWEベンチマークテストでの印象的なパフォーマンス

SWE-Bench Verifiedベンチマークテストにおいて、Devstralは46.8%という優れたスコアを達成しました。SWE-Bench Verifiedは、500の実際のGitHubの問題を含むデータセットで、正確性が手動で検証されています。このスコアは、これまでにリリースされたすべてのオープンソースモデルを上回るだけでなく、GPT-4.1-miniを含むいくつかのクローズドソースモデルを20ポイント以上上回っています。ロジエールは、DevstralがSWE-bench検証とコードプロキシタスクにおいて、これまでのオープンソースモデルの中で最高のパフォーマンスを発揮していると誇らしげに述べ、驚くべきことに、わずか2400万のパラメータでMacBook上でローカルに実行できると述べました。

ミストラルAIの開発者リレーションズリードであるソフィア・ヤン博士も、ソーシャルメディアでDevstralがさまざまなフレームワークにおいて多くのクローズドソースの代替品を上回ったことを指摘しました。このモデルの優れたパフォーマンスは、ミストラルのSmall3.1ベースモデルに適用された強化学習と安全性調整技術に起因しています。

コード生成を超えて：AIソフトウェア開発の基盤

Devstralの目的は単なるコード生成を超えており、OpenHands、SWE-Agent、OpenDevinなどのプロキシフレームワークとシームレスに統合されるように設計されています。これらのフレームワークにより、Devstralはテストケースと対話し、ソースコードファイルをナビゲートし、プロジェクト全体でマルチステップタスクを実行することができます。ロジエールは、Devstralがコードプロキシのための足場を提供するOpenDevinとともにリリースされることを明らかにしました。

モデルの信頼性を確保するために、ミストラルはDevstralをさまざまなコードベースや内部ワークフローで厳密にテストし、SWE-benchベンチマークへの過剰適合を防ぎました。彼らはトレーニングに非SWE-benchデータセットからのデータのみを使用し、異なるフレームワークにおけるモデルのパフォーマンスを検証しました。

ビジネスフレンドリーなオープンソースライセンスによる効率的な展開

Devstralの2400万のパラメータからなるコンパクトなアーキテクチャにより、開発者は単一のRTX 4090 GPUを搭載したマシンや32GBのメモリを持つMacコンピュータ上で簡単にローカルで実行できます。この機能は、プライバシーを重視し、エッジデバイス上での展開を必要とするアプリケーションに特に魅力的です。ロジエールは、このモデルのターゲットユーザーには、ローカルでのプライベートな操作を重視する開発者や愛好者が含まれると示唆しました。

性能とポータビリティに加えて、DevstralのApache 2.0ライセンスは商業アプリケーションにとって大きな利点を提供します。このライセンスは、制限のない使用、適応、配布を許可し、独自の製品においても利用可能であり、企業の採用の障壁を大幅に低下させます。

Devstralは128,000トークンのコンテキストウィンドウを持ち、131,000語の語彙を持つトークナイザーを利用しています。Hugging Face、Ollama、Kaggle、LM Studio、Unslothなどの人気のオープンソースプラットフォームを通じて展開をサポートし、vLLM、Transformers、Mistral Inferenceなどのライブラリと互換性があります。

APIおよびローカル展開オプション

開発者は、ミストラルのLe Platforme APIを通じてDevstralにアクセスでき、モデル名はdevstral-small-2505で、入力トークン1百万あたり0.10ドル、出力トークン1百万あたり0.30ドルの価格が設定されています。ローカル展開に興味のあるユーザーには、OpenHandsなどのフレームワークのサポートにより、コードベースやプロキシワークフローとの即時統合が可能です。ロジエールは、パッケージバージョンの更新やトークン化されたスクリプトの修正などの小規模な開発タスクにDevstralを使用した自身の経験を共有し、コードを正確に特定して修正する能力を称賛しました。

現在、Devstralは研究プレビューとして利用可能ですが、ミストラルとAll Hands AIはすでにより強力で大規模なフォローアップモデルの開発に取り組んでいます。ロジエールは、小規模モデルと大規模モデルのギャップが急速に縮まっており、Devstralのようなモデルの印象的なパフォーマンスは、いくつかの大規模な競合他社と比較可能であると考えています。

優れたベンチマークパフォーマンス、許可のあるオープンソースライセンス、プロキシ設計に最適化された機能を備えたDevstralは、単なる強力なコード生成ツールではなく、自律的なソフトウェアエンジニアリングシステムを構築するための重要な基盤モデルになることが期待されています。

AIの世界に関するさらなる洞察を得るために、私たちの毎日の更新をお楽しみにし、AI製品やアプリケーションの最新のトレンドや革新を探求してください。