Mistral Reentra no Código Aberto: Revela Modelo de IA de Alto Desempenho Devstral para Laptops
Mistral Reingressa na Comunidade de Código Aberto com o Lançamento do Modelo de IA Altamente Eficiente Devstral
Em um movimento significativo, o fabricante francês de modelos de IA Mistral retornou à arena de código aberto após críticas de partes da comunidade em relação ao seu mais recente modelo de código fechado, o Medium3. A empresa se uniu à startup de código aberto All Hands AI, criadores do OpenDevin, para introduzir um novo modelo de linguagem de código aberto chamado Devstral. Este modelo leve, com 24 milhões de parâmetros, é especificamente projetado para o desenvolvimento de software de IA e demonstrou um desempenho que supera muitos concorrentes com bilhões de parâmetros em certos testes de referência.
Diferente dos tradicionais grandes modelos de linguagem (LLMs) que se concentram principalmente na conclusão de código ou na geração de funções independentes, o Devstral é otimizado para atuar como um agente abrangente de engenharia de software. Essa capacidade permite que ele compreenda o contexto entre arquivos, navegue em grandes bases de código e enfrente desafios reais de desenvolvimento de software. Notavelmente, o Devstral é lançado sob a licença permissiva Apache 2.0, concedendo aos desenvolvedores e organizações a liberdade de implantar, modificar e comercializar o modelo.
O cientista de pesquisa da Mistral, Baptiste Rozière, enfatizou o objetivo de fornecer à comunidade de desenvolvedores uma ferramenta que possa ser executada localmente e modificada de acordo com necessidades específicas, com a licença Apache 2.0 oferecendo flexibilidade significativa ao usuário.
Construindo sobre o Sucesso do Codestral
O Devstral representa o mais recente avanço na série de modelos centrados em código da Mistral, Codestral. Lançado em maio de 2024, o Codestral possui 22 bilhões de parâmetros e suporta mais de 80 linguagens de programação, destacando-se em tarefas de geração e conclusão de código. A rápida iteração do Codestral levou a versões aprimoradas, incluindo Codestral-Mamba e o mais recente Codestral 25.01, que ganharam popularidade entre desenvolvedores de plugins de IDE e usuários empresariais. O sucesso da série Codestral estabeleceu uma base sólida para o desenvolvimento do Devstral, permitindo que ele se expandisse de uma simples conclusão de código para a execução de tarefas completas de proxy.
Desempenho Impressionante em Testes de Benchmark SWE
Nos testes de benchmark SWE-Bench Verified, o Devstral alcançou uma pontuação excepcional de 46,8%. O SWE-Bench Verified é um conjunto de dados contendo 500 problemas reais do GitHub, verificados manualmente quanto à precisão. Essa pontuação não apenas superou todos os modelos de código aberto lançados anteriormente, mas também ultrapassou vários modelos de código fechado, incluindo o GPT-4.1-mini, em mais de 20 pontos percentuais. Rozière afirmou com orgulho que o Devstral é o modelo de código aberto com melhor desempenho até agora na verificação SWE-bench e em tarefas de proxy de código, e, notavelmente, pode ser executado localmente em um MacBook com apenas 24 milhões de parâmetros.
A líder de relações com desenvolvedores da Mistral, Dra. Sophia Yang, também observou nas redes sociais que o Devstral superou muitas alternativas de código fechado em várias estruturas. O desempenho excepcional do modelo é atribuído a técnicas de aprendizado por reforço e ajuste de segurança aplicadas ao modelo base Mistral Small3.1.
Além da Geração de Código: Uma Base para o Desenvolvimento de Software de IA
O objetivo do Devstral vai além da mera geração de código; ele foi projetado para se integrar perfeitamente com estruturas de proxy como OpenHands, SWE-Agent e OpenDevin. Essas estruturas permitem que o Devstral interaja com casos de teste, navegue em arquivos de código-fonte e execute tarefas de múltiplos passos em projetos. Rozière revelou que o Devstral será lançado juntamente com o OpenDevin, que fornece uma estrutura para proxies de código, servindo como o backend para modelos de desenvolvedor.
Para garantir a confiabilidade do modelo, a Mistral conduziu testes rigorosos do Devstral em várias bases de código e fluxos de trabalho internos para evitar o sobreajuste ao benchmark SWE-bench. Eles usaram exclusivamente dados de conjuntos de dados não-SWE-bench para treinamento e validaram o desempenho do modelo em diferentes estruturas.
Implantação Eficiente com Licenciamento de Código Aberto Amigável para Negócios
A arquitetura compacta do Devstral, com 24 milhões de parâmetros, permite que os desenvolvedores o executem localmente com facilidade, seja em máquinas equipadas com uma única GPU RTX 4090 ou em computadores Mac com 32GB de memória. Esse recurso é particularmente atraente para aplicações que priorizam a privacidade e requerem implantação em dispositivos de borda. Rozière indicou que os usuários-alvo para este modelo incluem desenvolvedores e entusiastas interessados em operações locais e privatizadas, mesmo em ambientes offline.
Além de seu desempenho e portabilidade, a licença Apache 2.0 do Devstral oferece vantagens significativas para aplicações comerciais. Essa licença permite uso, adaptação e distribuição irrestritos, incluindo em produtos proprietários, reduzindo significativamente as barreiras para a adoção empresarial.
O Devstral possui uma janela de contexto de 128.000 tokens e utiliza um tokenizador com um vocabulário de 131.000 palavras. Ele suporta implantação através de plataformas de código aberto populares, como Hugging Face, Ollama, Kaggle, LM Studio e Unsloth, e é compatível com bibliotecas como vLLM, Transformers e Mistral Inference.
Opções de API e Implantação Local
Os desenvolvedores podem acessar o Devstral através da API Le Platforme da Mistral, com o modelo nomeado devstral-small-2505, com preço de $0,10 por milhão de tokens de entrada e $0,30 por milhão de tokens de saída. Para usuários interessados em implantação local, o suporte a estruturas como OpenHands permite integração imediata com bases de código e fluxos de trabalho de proxy. Rozière compartilhou suas próprias experiências usando o Devstral para pequenas tarefas de desenvolvimento, como atualizar versões de pacotes ou modificar scripts tokenizados, elogiando sua capacidade de localizar e modificar código com precisão.
Embora o Devstral esteja atualmente disponível em uma prévia de pesquisa, a Mistral e a All Hands AI já estão trabalhando no desenvolvimento de modelos de seguimento mais poderosos e maiores. Rozière acredita que a lacuna entre modelos pequenos e grandes está se fechando rapidamente, e o desempenho impressionante de modelos como o Devstral agora é comparável a alguns concorrentes maiores.
Com seu desempenho excepcional em benchmarks, licenciamento de código aberto permissivo e recursos otimizados para design de proxy, o Devstral não é apenas uma poderosa ferramenta de geração de código, mas está preparado para se tornar um modelo fundamental para a construção de sistemas autônomos de engenharia de software.
Para mais insights sobre o mundo da IA, fique atento às nossas atualizações diárias e explore as últimas tendências e inovações em produtos e aplicações de IA.
Descubra uma ampla gama de soluções inovadoras adaptadas às suas necessidades. Saiba mais e explore ferramentas de IA construídas para usuários em nosso Diretório de Ferramentas de IA, onde você pode explorar recursos como busca inteligente e assistentes de IA para encontrar a ferramenta perfeita para você.







