O modelo mais recente do Google Gemma AI pode ser executado em telefones

A família de modelos de IA “aberta” do Google, Gemma, está crescendo.

Durante o Google I/O 2025 na terça -feira, o Google tirou o envoltório da Gemma 3N, um modelo projetado para executar “suavemente” em telefones, laptops e tablets. Disponível na pré -visualização a partir de terça -feira, a Gemma 3N pode lidar com áudio, texto, imagens e vídeos, de acordo com o Google.

Os modelos eficientes o suficiente para ficar offline e sem a necessidade de computação na nuvem ganharam força na comunidade de IA nos últimos anos. Eles não apenas são mais baratos para usar do que modelos grandes, mas preservam a privacidade, eliminando a necessidade de transferir dados para um data center remoto.

Durante uma palestra na E/S, Gus Martins, gerente de produtos da Gemma, disse que a Gemma 3N pode ser executada em dispositivos com menos de 2 GB de RAM. “A Gemma 3N compartilha a mesma arquitetura que Gemini Nano, e é e é projetada para um desempenho incrível”, acrescentou.

Além do Gemma 3N, o Google está lançando o Medgemma por meio de seu Programa de Fundamentos de Desenvolvedores de AI em Saúde. Segundo a empresa, a Medgemma é o seu modelo aberto mais capaz para analisar o texto e as imagens relacionadas à saúde.

“Medgemma (é) nossa (…) coleção de modelos abertos para o entendimento multimodal de texto e imagem”, disse Martins. “A Medgemma funciona muito bem em uma variedade de aplicativos de imagem e texto, para que os desenvolvedores (…) possam adaptar os modelos para seus próprios aplicativos de saúde”.

Também no horizonte está o sinalização, um modelo aberto para traduzir a linguagem de sinais em texto em língua falada. O Google diz que o sinalizador permitirá que os desenvolvedores criem novos aplicativos e integrações para usuários surdos e com deficiência auditiva.

“O sinalização é uma nova família de modelos treinados para traduzir a linguagem de sinais em texto em língua falada, mas é melhor na linguagem de sinais americana e inglês”, disse Martins. “É o modelo de compreensão de linguagem de sinais mais capaz de todos os tempos, e mal podemos esperar por você-desenvolvedores e comunidades surdas e com deficiência auditiva-para levar essa base e construir com ela”.

Vale a pena notar que a GEMMA foi criticada por seus termos de licenciamento personalizados e não padrão, que alguns desenvolvedores dizem que fizeram usando os modelos comercialmente uma proposta arriscada. Isso não dissuadiu os desenvolvedores de baixar modelos Gemma dezenas de milhões de vezes coletivamente, no entanto.

Atualizado às 14h40 Pacific: Adicionado várias citações do Gus Martins, gerente de produtos da Gemma,.

 
 

Veja também