Mistral возвращается в открытый исходный код: представляет высокопроизводительную модель ИИ Devstral для ноутбуков
Mistral Возвращается в Сообщество Open Source с Запуском Высокоэффективной Модели ИИ Devstral
В значительном шаге французский производитель моделей ИИ Mistral вернулся в открытую среду после критики со стороны некоторых членов сообщества по поводу своей последней закрытой модели, Medium3. Компания объединилась с открытым стартапом All Hands AI, создателями OpenDevin, чтобы представить новую открытую языковую модель под названием Devstral. Эта легковесная модель с 24 миллионами параметров специально разработана для разработки программного обеспечения ИИ и продемонстрировала производительность, превосходящую многих конкурентов с миллиардами параметров в некоторых тестах.
В отличие от традиционных больших языковых моделей (LLM), которые в основном сосредоточены на завершении кода или генерации отдельных функций, Devstral оптимизирован для работы в качестве комплексного агента программной инженерии. Эта способность позволяет ему понимать контекст в разных файлах, ориентироваться в больших кодовых базах и решать реальные задачи разработки программного обеспечения. Примечательно, что Devstral выпущен под разрешительной лицензией Apache 2.0, предоставляющей разработчикам и организациям свободу развертывания, модификации и коммерциализации модели.
Научный сотрудник Mistral по исследованиям ИИ Баптист Розьер подчеркнул цель предоставить сообществу разработчиков инструмент, который можно запускать локально и модифицировать в соответствии с конкретными потребностями, при этом лицензия Apache 2.0 предлагает значительную гибкость для пользователей.
Основываясь на Успехе Codestral
Devstral представляет собой последнее достижение в серии моделей Mistral, ориентированных на код, под названием Codestral. Запущенная в мае 2024 года, Codestral имеет 22 миллиарда параметров и поддерживает более 80 языков программирования, превосходя в задачах генерации и завершения кода. Быстрая итерация Codestral привела к улучшенным версиям, включая Codestral-Mamba и последнюю Codestral 25.01, которые стали популярными среди разработчиков плагинов для IDE и корпоративных пользователей. Успех серии Codestral заложил прочную основу для разработки Devstral, позволяя ему расширяться от простого завершения кода до выполнения полных прокси-задач.
Впечатляющая Производительность в Тестировании SWE Benchmark
В проверенных тестах SWE-Bench Devstral достиг выдающегося результата в 46.8%. SWE-Bench Verified — это набор данных, содержащий 500 реальных проблем GitHub, вручную проверенных на точность. Этот результат не только превзошел все ранее выпущенные открытые модели, но и обошел несколько закрытых моделей, включая GPT-4.1-mini, более чем на 20 процентных пунктов. Розьер с гордостью заявил, что Devstral является лучшей открытой моделью на сегодняшний день в верификации SWE-bench и задачах прокси-кода, и, что примечательно, он может работать локально на MacBook с всего лишь 24 миллионами параметров.
Руководитель по связям с разработчиками Mistral AI, доктор София Янг, также отметила в социальных сетях, что Devstral превзошел многие закрытые альтернативы в различных фреймворках. Исключительная производительность модели объясняется применением методов обучения с подкреплением и настройки безопасности, использованных в базовой модели Mistral Small3.1.
За Пределами Генерации Кода: Основы для Разработки Программного Обеспечения ИИ
Цель Devstral выходит за рамки простой генерации кода; он разработан для бесшовной интеграции с прокси-фреймворками, такими как OpenHands, SWE-Agent и OpenDevin. Эти фреймворки позволяют Devstral взаимодействовать с тестовыми случаями, ориентироваться в исходных кодах и выполнять многошаговые задачи в проектах. Розьер сообщил, что Devstral будет выпущен вместе с OpenDevin, который предоставляет каркас для прокси-кода, служа в качестве бэкенда для моделей разработчиков.
Чтобы обеспечить надежность модели, Mistral провела строгие тестирования Devstral в различных кодовых базах и внутренних рабочих процессах, чтобы предотвратить переобучение на бенчмарке SWE. Они использовали исключительно данные из наборов данных, не относящихся к SWE-bench, для обучения и проверили производительность модели в различных фреймворках.
Эффективное Развертывание с Дружественной К Бизнесу Лицензией Open Source
Компактная архитектура Devstral с 24 миллионами параметров позволяет разработчикам легко запускать его локально, как на машинах с одним GPU RTX 4090, так и на Mac с 32 ГБ памяти. Эта особенность особенно привлекательна для приложений, которые придают значение конфиденциальности и требуют развертывания на устройствах на краю сети. Розьер указал, что целевая аудитория для этой модели включает разработчиков и энтузиастов, стремящихся к локальным и приватизированным операциям, даже в оффлайн-средах.
Помимо своей производительности и портативности, лицензия Apache 2.0 на Devstral предоставляет значительные преимущества для коммерческих приложений. Эта лицензия позволяет неограниченное использование, адаптацию и распространение, включая в собственные продукты, что значительно снижает барьеры для принятия в корпоративном секторе.
Devstral имеет контекстное окно в 128,000 токенов и использует токенизатор с вокабуляром из 131,000 слов. Он поддерживает развертывание через популярные платформы с открытым исходным кодом, такие как Hugging Face, Ollama, Kaggle, LM Studio и Unsloth, и совместим с библиотеками, такими как vLLM, Transformers и Mistral Inference.
API и Опции Локального Развертывания
Разработчики могут получить доступ к Devstral через API Le Platforme от Mistral, модель называется devstral-small-2505, цена составляет $0.10 за миллион входных токенов и $0.30 за миллион выходных токенов. Для пользователей, заинтересованных в локальном развертывании, поддержка фреймворков, таких как OpenHands, позволяет немедленную интеграцию с кодовыми базами и прокси-рабочими процессами. Розьер поделился своим опытом использования Devstral для небольших задач разработки, таких как обновление версий пакетов или модификация токенизированных скриптов, похвалив его способность точно находить и изменять код.
Хотя Devstral в настоящее время доступен в исследовательском предварительном просмотре, Mistral и All Hands AI уже работают над разработкой более мощных и крупных последующих моделей. Розьер считает, что разрыв между малыми и крупными моделями быстро сокращается, и впечатляющая производительность таких моделей, как Devstral, теперь сопоставима с некоторыми крупными конкурентами.
С его выдающейся производительностью в бенчмарках, разрешительной лицензией с открытым исходным кодом и функциями, оптимизированными для проектирования прокси, Devstral является не только мощным инструментом генерации кода, но и готов стать ключевой базовой моделью для создания автономных систем программной инженерии.
Для получения дополнительных сведений о мире ИИ следите за нашими ежедневными обновлениями и исследуйте последние тенденции и инновации в продуктах и приложениях ИИ.
Откройте для себя широкий спектр инновационных решений, адаптированных к вашим потребностям Узнайте больше и исследуйте инструменты ИИ, созданные для пользователей, в нашем Каталоге Инструментов ИИ, где вы можете исследовать такие функции, как умный поиск и ИИ-ассистенты, чтобы найти идеальный инструмент для вас.







