O novo modelo de devstral de devstral de Mistral foi projetado para codificar

A IA Startup Mistral anunciou na quarta -feira um novo modelo de IA focado na codificação: Devstral.

Devstral, que Mistral diz ter sido desenvolvido em parceria com a empresa de IA All Hands AI, está disponível abertamente sob uma licença Apache 2.0, o que significa que ela pode ser usada comercialmente sem restrição. As alegações do Mistral que DevStral supera outros modelos abertos, como o Gemma 3 27B do Google e o V3 do Chinese AI Lab Deepseek no SWE-banch Verificado, uma referência de medição de habilidades de codificação.

“O Devstral se destaca no uso de ferramentas para explorar bases de código, editar vários arquivos e agentes de engenharia de software Power (ING)”, escreve Mistral em uma postagem de blog fornecida no TechCrunch. “(I) t atropela os andaimes de agentes de código, como OpenHands ou Swe-Agent, que definem a interface entre o modelo e os casos de teste (…) devstral é leve o suficiente para executar em uma única (NVIDIA) RTX 4090 ou um Mac com 32 GB de RAM, tornando-o uma escolha ideal para depletização local e uso de DEVICE.”

Resultados das avaliações internas de benchmarking de Mistral de DevStral.Créditos da imagem:Mistral

Devstral chega como assistentes de codificação de IA – e os modelos que os alimentam – crescem cada vez mais populares. No mês passado, a JetBrains, a empresa por trás de uma variedade de ferramentas populares de desenvolvimento de aplicativos, lançou seu primeiro modelo de IA “aberto” para codificar. Nos últimos meses, roupas de IA, incluindo Google, Windsurf e Openai, também revelaram modelos, disponíveis abertamente e proprietários, otimizados para tarefas de programação.

Os modelos de IA ainda lutam para codificar o software de qualidade-a IA geradora de código tende a introduzir vulnerabilidades e erros de segurança, devido a fraquezas em áreas como a capacidade de entender a lógica de programação. No entanto, sua promessa de aumentar a produtividade da codificação é empurrar as empresas – e os desenvolvedores – para adotá -los rapidamente. Uma pesquisa recente constatou que 76% dos desenvolvedores usavam ou planejavam usar ferramentas de IA em seus processos de desenvolvimento no ano passado.

Mistral anteriormente entrou no espaço de programação assistiva com o Codestral, um modelo generativo para o código. Mas o Codestral não foi divulgado sob uma licença que permitia que os desenvolvedores usassem o modelo para aplicações comerciais; Sua licença baniu explicitamente “qualquer uso interno pelos funcionários no contexto de (a) atividades comerciais da empresa”.

Devstral, que Mistral está chamando de “pré -visualização de pesquisa”, pode ser baixado das plataformas de desenvolvimento de IA, incluindo o Hugging Face, e também aproveitou a API de Mistral. É o preço de US $ 0,1 por milhão de tokens de entrada e US $ 0,3 por milhão de tokens de produção, sendo os tokens os bits brutos de dados com os quais os modelos de IA trabalham. (Um milhão de tokens é equivalente a cerca de 750.000 palavras, ou aproximadamente 163.000 palavras a mais que “guerra e paz”.)

Mistral diz que está “trabalhando duro para construir um modelo de codificação agêntica maior que estará disponível nas próximas semanas”. Devstral não é um modelo pequeno em si, mas está do lado menor com 24 bilhões de parâmetros. (Os parâmetros correspondem aproximadamente às habilidades de solução de problemas de um modelo, e os modelos com mais parâmetros geralmente têm um desempenho melhor do que aqueles com menos parâmetros.)

A Mistral, fundada em 2023, é um laboratório de modelos de fronteira, com o objetivo de criar uma variedade de serviços movidos a IA, incluindo uma plataforma de chatbot, LE Chat e aplicativos móveis. É apoiado por VCs, incluindo o Geral Catalyst e levantou mais de 1,1 bilhão de euros (aproximadamente US $ 1,24 bilhão) até o momento. Os clientes da Mistral incluem BNP Paribas, AXA e Mirakl.

Devstral é o lançamento do terceiro produto da Mistral este mês. Algumas semanas atrás, o Mistral lançou o Mistral Medium 3, um modelo eficiente de uso geral. Na mesma época, a empresa lançou a Le Chat Enterprise, um serviço de chatbot focado nas empresas que oferece ferramentas como um construtor de “agente” da IA ​​e integra os modelos da Mistral com serviços de terceiros como Gmail, Google Drive e SharePoint.

 
 

Veja também