A startup chinesa Deepseek lançou uma versão atualizada de seu modelo de IA de raciocínio R1 na plataforma do desenvolvedor abraçando o rosto depois de anunciá -lo em uma mensagem do WeChat na quarta -feira de manhã.
O R1 atualizado, que está sob uma licença permissiva do MIT, o que significa que pode ser usado comercialmente, é uma atualização “menor”, de acordo com o anúncio do WeChat da Deepseek. O repositório de face de abraço não contém uma descrição do modelo – apenas arquivos e pesos de configuração, os componentes internos de um modelo que orienta seu comportamento.
Pesando 685 bilhões de parâmetros em tamanho, o R1 atualizado é bastante pesado. (“Parâmetros” é sinônimo de “pesos”.) Sem modificação, o modelo provavelmente não pode ser executado em hardware de nível de consumo.
Deepseek ganhou destaque no início deste ano, após o lançamento do R1, que deu aos modelos do Openai uma corrida pelo seu dinheiro. A startup elevou a ira de alguns reguladores nos Estados Unidos, que argumentam que a tecnologia da Deepseek representa um risco de segurança nacional.