Google lança Gemma 4 para enfrentar a IA aberta chinesa
O Google apresentou a nova família Gemma 4 e a mensagem é clara: quer ganhar terreno no mercado dos modelos de IA com pesos abertos, numa altura em que vários rivais chineses estão a acelerar. A nova geração chega com suporte multimodal, mais de 140 idiomas e uma licença muito mais permissiva para empresas.
Neste artigo encontras:
Na prática, isto significa que a tecnológica norte-americana está a tentar tornar a Gemma 4 numa alternativa mais apelativa para quem quer desenvolver soluções de IA sem depender totalmente de modelos fechados ou de regras mais restritivas.
Gemma 4: o que muda nesta nova geração
Desenvolvida pela DeepMind, a Gemma 4 traz melhorias focadas em tarefas cada vez mais procuradas, como agentes de IA e programação. Entre as novidades estão capacidades de raciocínio mais avançadas, melhor seguimento de instruções, chamadas de funções nativas e suporte para áudio e vídeo.
Outro ponto importante é o alcance global. Os novos modelos suportam mais de 140 idiomas, o que pode torná-los mais úteis em produtos internacionais e em equipas que trabalham com vários mercados ao mesmo tempo. Desenvolvida pela DeepMind, a Gemma 4 traz melhorias focadas em tarefas cada vez mais procuradas, como agentes de IA e programação.
Porque é que esta aposta do Google importa
O lançamento surge numa fase em que modelos open-weight vindos da China têm ganho destaque e já são vistos como concorrentes sérios no espaço da inteligência artificial. Empresas como Alibaba, Moonshot AI e Z.AI têm vindo a aumentar a pressão sobre as gigantes norte-americanas.
Com a Gemma 4, o Google tenta responder com uma alternativa doméstica para empresas que querem mais controlo sobre os seus sistemas de IA e, ao mesmo tempo, evitar preocupações com o uso de dados sensíveis em treino futuro.
Modelos para vários tipos de dispositivos
Uma das grandes vantagens da linha Gemma 4 é a variedade. O Google disponibilizou vários tamanhos para responder a diferentes cenários, desde smartphones e placas compactas até portáteis e centros de dados empresariais.
Modelo de 31 mil milhões de parâmetros
No topo está uma versão com 31 mil milhões de parâmetros, pensada para maximizar a qualidade das respostas. Segundo o Google, este modelo pode correr numa única GPU Nvidia H100 com 80 GB de memória, sem quantização.
Em formatos mais leves, também pode funcionar em hardware muito mais acessível, como uma GPU com 24 GB de VRAM, algo que abre a porta a mais empresas e programadores.
Modelo MoE de 26 mil milhões de parâmetros
Há também uma versão de 26 mil milhões de parâmetros com arquitetura mixture of experts. Neste caso, apenas uma parte dos especialistas é ativada em cada resposta, o que permite gerar resultados mais depressa.
O compromisso está na qualidade: a velocidade sobe, mas a consistência pode não chegar ao nível de um modelo denso equivalente. Ainda assim, para quem valoriza latência mais baixa, pode ser uma solução interessante.
Versões para smartphones e edge
O Google não se ficou pelos modelos maiores. A Gemma 4 inclui ainda versões otimizadas para hardware mais modesto, como smartphones, Raspberry Pi e outros dispositivos edge.
Estas variantes foram desenhadas para consumir menos recursos, mantendo janelas de contexto longas e capacidades multimodais em alguns modelos. Isso pode ser útil em assistentes locais, apps móveis e experiências de IA mais leves.
Uma mudança decisiva: licença Apache 2.0
Talvez a novidade mais importante para empresas nem seja técnica. A Gemma 4 passa a usar a licença Apache 2.0, muito mais permissiva do que a anterior.
Isto dá às organizações mais liberdade para adaptar, implementar e distribuir os modelos sem receio de limitações adicionais impostas pelo fornecedor. É uma alteração com peso real, sobretudo para empresas que precisam de previsibilidade jurídica e tecnológica. Na prática, isto pode ajudar equipas de desenvolvimento a criar assistentes locais para escrever, rever ou explicar código, tal como já vimos no ChatRTX da Nvidia, sem depender sempre da cloud.
Foco claro em código e agentes de IA
O Google destacou especialmente o uso da Gemma 4 em assistentes de programação e aplicações agentic AI. Com janelas de contexto até 256 mil tokens em alguns modelos, a nova família pode analisar grandes volumes de texto ou código de uma só vez. O Google destacou especialmente o uso da Gemma 4 em assistentes de programação e aplicações agentic AI.
Na prática, isto pode ajudar equipas de desenvolvimento a criar assistentes locais para escrever, rever ou explicar código, sem depender sempre da cloud.
Onde já está disponível
A Gemma 4 já pode ser encontrada no Google AI Studio, no AI Edge Gallery e em plataformas populares como Hugging Face, Kaggle e Ollama. O Google diz ainda que há suporte imediato para vários frameworks de inferência usados pela comunidade.
Isso reduz a fricção para quem quiser testar os modelos rapidamente, seja num ambiente de investigação, desenvolvimento de produto ou uso empresarial.




Sem Comentários! Seja o Primeiro.