DeepMind afirma

O AI de R&D Lab do Google, Deepmind, diz que desenvolveu um novo sistema de IA para enfrentar problemas com soluções “gradáveis ​​à máquina”.

Em experimentos, o sistema, chamado AlphaEvolve, poderia ajudar a otimizar parte da infraestrutura que o Google usa para treinar seus modelos de IA, disse o DeepMind. A empresa diz que está construindo uma interface de usuário para interagir com a AlphaEvolve e planeja lançar um programa de acesso antecipado para acadêmicos selecionados antes de um possível lançamento mais amplo.

A maioria dos modelos de IA alucinam. Devido às suas arquiteturas probabilísticas, às vezes eles inventam as coisas com confiança. De fato, modelos de IA mais recentes, como o O3 Hallucinato do Openai mais do que seus antecessores, ilustrando a natureza desafiadora da questão.

O AlphaEvolve apresenta um mecanismo inteligente para reduzir as alucinações: um sistema de avaliação automática. O sistema usa modelos para gerar, criticar e chegar a um conjunto de respostas possíveis para uma pergunta e avaliar e pontuar automaticamente as respostas de precisão.

O sistema AlphaEvolve da DeepMind foi projetado para ser usado por especialistas em domínio, diz o laboratórioCréditos da imagem:DeepMind

O AlphaEvolve não é o primeiro sistema a fazer essa aderência. Pesquisadores, incluindo uma equipe da DeepMind há vários anos, aplicaram técnicas semelhantes em vários domínios matemáticos. Mas o DeepMind afirma que o uso dos modelos de “ponta” da AlphaEvolve-especificamente os modelos Gemini-o torna significativamente mais capaz do que as instâncias anteriores de IA.

Para usar o AlphaEvolve, os usuários devem solicitar ao sistema um problema, opcionalmente, incluindo detalhes como instruções, equações, trechos de código e literatura relevante. Eles também devem fornecer um mecanismo para avaliar automaticamente as respostas do sistema na forma de uma fórmula.

Como o AlphaEvolve só pode resolver problemas que podem se auto-avaliar, o sistema só pode funcionar com certos tipos de problemas-especificamente aqueles em áreas como ciência da computação e otimização do sistema. Em outra grande limitação, o AlphaEvolve só pode descrever as soluções como algoritmos, tornando -o um ajuste ruim para problemas que não são numéricos.

Para comparar a alfa -evolve, o DeepMind tentou o sistema um conjunto com curadoria de cerca de 50 problemas de matemática que abrangem ramos da geometria à combinatória. A AlphaEvolve conseguiu “redescobrir” as respostas mais conhecidas para os problemas 75% das vezes e descobrir soluções aprimoradas em 20% dos casos, afirma o DeepMind.

O DeepMind também avaliou o AlphaEvolve em problemas práticos, como aumentar a eficiência dos data centers do Google e acelerar o treinamento de modelos. De acordo com o laboratório, a AlphaEvolve gerou um algoritmo que recupera continuamente 0,7% dos recursos mundiais de computação do Google, em média. O sistema também sugeriu uma otimização que reduziu o tempo total que o Google leva para treinar seus modelos Gemini em 1%.

Para ficar claro, o AlphaEvolve não está fazendo descobertas inovadoras. Em um experimento, o sistema conseguiu encontrar uma melhoria para o design do chip Acelerator TPU AI do Google, que havia sido sinalizado por outras ferramentas anteriormente.

O DeepMind, no entanto, está argumentando o mesmo caso que muitos laboratórios de IA fazem por seus sistemas: que a AlphaVolve pode economizar tempo enquanto liberta especialistas para se concentrar em outros trabalhos mais importantes.

 
 

Veja também