MaisTecnologia MaisTecnologia
  • Home
  • Notícias
    • Casa & Família
    • Motores
    • Computadores
      • Hardware
      • Periféricos
      • Segurança
      • Software
    • Comunicações
      • Telemóveis
    • Diversos
      • Apple
      • Google
      • Microsoft
      • Negócios
      • Gadgets
      • Portabilidade
    • Eventos
    • Internet
      • Sites
    • Multimedia
      • Podcast
      • Video
      • Imagem
      • Som
    • Redes Sociais
    • Promoções
    • SmartHome
  • Análises
Subscrever Newsletter
Search the Site
Popular Searches:
Adventure Samsung Community
Recent Posts
China prepara mega-rede de IA e afasta a Nvidia
12 de Junho de 2026
Representação digital de inteligência artificial com elementos tecnológicos e rede de dados, simbolizando inovação e avanços em IA.
UE quer acesso ao Mythos da Anthropic
12 de Junho de 2026
Botão azul "Alterar email" na página de configurações de conta do site MaisTecnologia.
Gmail já deixa mudar o endereço sem perder a conta
12 de Junho de 2026
MaisTecnologia MaisTecnologia
  • Home
  • Notícias
    • Casa & Família
    • Motores
    • Computadores
      • Hardware
      • Periféricos
      • Segurança
      • Software
    • Comunicações
      • Telemóveis
    • Diversos
      • Apple
      • Google
      • Microsoft
      • Negócios
      • Gadgets
      • Portabilidade
    • Eventos
    • Internet
      • Sites
    • Multimedia
      • Podcast
      • Video
      • Imagem
      • Som
    • Redes Sociais
    • Promoções
    • SmartHome
  • Análises

Receba as novidades tecnológicas no conforto do seu email!

Subscrever Newsletter

© All Rights Reserved, MaisTecnologia

Home/Tecnologia/OpenAI pondera novos chips de IA após dúvidas sobre NVIDIA
Tecnologia

OpenAI pondera novos chips de IA após dúvidas sobre NVIDIA

Bruno Peralta
Bruno Peralta
3 de Fevereiro de 2026 5 Min Read

G
Adiciona MaisTecnologia como fonte preferida no Google

O buzz na indústria de IA não abranda, e a mais recente onda vem de um sítio esperado: a fronteira entre software de ponta e o hardware que o sustenta. Ao que tudo indica, a OpenAI tem vindo a reavaliar o desempenho de alguns aceleradores usados na fase de inferência — o momento em que os modelos deixam de aprender e passam a responder. É aqui que surgem os gargalos mais visíveis para utilizadores e clientes: latência na geração de código, tempos de espera em conversas complexas, e custos operacionais que escalam de forma pouco simpática quando se fala de milhões de pedidos por dia.

Neste artigo encontras:

  • Porque é que a inferência se tornou o novo campo de batalha
  • OpenAI afina a bússola: do treino para a resposta em tempo real
  • Alternativas na mesa: de chips especializados a arquiteturas com memória próxima
  • A relação com a NVIDIA: pragmatismo, escala e custo por desempenho
  • Dinâmica de mercado e investimentos: sinais para ler nas entrelinhas
  • O que esperar nos próximos 12–24 meses
  • FAQ

Se o treino de modelos gigantes foi o pódio das GPUs nos últimos anos, a corrida que agora interessa às equipas de produto e às equipas financeiras chama-se “tempo de resposta com custo previsível”. E isso está a redesenhar o mapa de interesses de quem constrói a próxima geração de IA generativa.

Segue-nos no Google News

Porque é que a inferência se tornou o novo campo de batalha

Treinar um modelo de grande escala é caro, mas ocorre em rajadas: planifica-se, reserva-se capacidade e otimiza-se pipelines. A inferência, por sua vez, nunca dorme. É sensível a picos, a geografias e a contratos de nível de serviço. Cada milissegundo conta e cada watt também. À medida que os modelos se tornam mais “pensativos” — com cadeias de raciocínio mais longas, ferramentas externas e contexto maior — as arquiteturas que brilham no treino nem sempre brilham na resposta.

Daí o interesse crescente por designs que aproximam memória e compute, reduzindo idas e voltas a DRAM ou rede. A palavra-chave é previsibilidade: throughput consistente, latência baixa e custo por token controlável.

OpenAI afina a bússola: do treino para a resposta em tempo real

O que muda para uma empresa como a OpenAI? A prioridade deixa de ser “como escalar o próximo treino” para “como servir o próximo milhar de milhões de tokens”. Isso implica olhar para além do ecossistema dominante. Explorar opções não significa romper relações; significa pressionar o estado da arte onde dói mais: a inferência no mundo real, com workloads de código, agentes e prompts longos.

Esta reorientação acontece sem virar costas ao que já funciona. GPUs de topo continuam a liderar em versatilidade e maturidade de software, mas a fasquia para permanecer no centro do data center está a subir. Se um fornecedor consegue entregar 10-20% menos latência por pedido em cenários críticos, o impacto anual em custos e satisfação do utilizador é brutal.

Alternativas na mesa: de chips especializados a arquiteturas com memória próxima

Não faltam candidatos a morder esta fatia. Startups com arquiteturas orientadas a memória e fluxo determinístico prometem ganhos tangíveis em raciocínio e geração de código. Soluções como wafers monolíticos e processadores com SRAM abundante procuram eliminar gargalos na movimentação de dados, o calcanhar de Aquiles de muitos pipelines de inferência.

O desafio aqui não é apenas o hardware. É a cadeia completa: compiladores, SDKs, integração com servidores de modelos, quantização estável e observabilidade. Qualquer alternativa que queira ganhar terreno precisa de provar três coisas rapidamente:

  • Compatibilidade com stacks populares (vLLM, TensorRT-LLM, etc.)
  • Ganhos de latência fim‑a‑fim, não só em benchmarks sintéticos
  • Custo total de propriedade favorável, incluindo energia, rede e manutenção

É por isso que negociações, alianças e licenciamentos se tornaram tão sensíveis. Uma parceria que muda de mãos pode redefinir quem consegue acesso a determinada tecnologia e em que condições.

A relação com a NVIDIA: pragmatismo, escala e custo por desempenho

Importa separar ruído de sinal. A NVIDIA continua no centro da infraestrutura de IA moderna por um motivo simples: entregou performance por dólar e um ecossistema de software sem rival ao longo de uma década. Para empresas com tráfego global, a disponibilidade, as ferramentas de gestão e a previsibilidade de fornecimento pesam tanto como FLOPs brutos.

Ao mesmo tempo, o mercado não é estático. A pressão competitiva na inferência é saudável e, francamente, necessária. Se os grandes compradores de computação colocarem metas claras — menos latência, mais tokens por segundo, operado com menos energia — os fornecedores estabelecidos vão acelerar a inovação em arquiteturas e pilhas otimizadas para servir, não apenas treinar.

Dinâmica de mercado e investimentos: sinais para ler nas entrelinhas

Quando um líder de mercado sonda alternativas, os investidores tomam nota. Pequenas inflexões de confiança podem traduzir-se em volatilidade de curto prazo nas ações de quem domina o segmento. Em paralelo, conversas sobre investimentos estratégicos entre fabricantes de chips e empresas de IA são termómetros úteis: não ditam o rumo sozinhos, mas indicam prioridade e compromisso de longo prazo.

Para o ecossistema, o recado é claro: diversificação de hardware deixou de ser plano B. É uma via para reduzir risco operacional, otimizar custos e, em muitos casos, desbloquear funcionalidades que exigem previsibilidade milimétrica.

O que esperar nos próximos 12–24 meses

Há três linhas de evolução a acompanhar:

  • Consolidação de um “stack de inferência” com perfis de carga distintos: chat multimodal, geração de código, agentes com ferramentas externas e pesquisa aumentada por contexto.
  • Crescimento de instâncias especializadas em clouds públicas, com SLAs explícitos para latência e “tokens por segundo”, e mais regiões com computação na periferia (edge) para cortar milissegundos.
  • Aceleração de técnicas como quantização agressiva, KV‑cache distribuído e partilha de contexto entre pedidos, explorando melhor o silício já existente.

Se as alternativas entregarem ganhos reais em workloads críticos, veremos uma arquitetura híbrida tornar‑se norma: GPUs generalistas para flexibilidade e treino, aceleradores de baixa latência para servir raciocínio e código a escala planetária. E isso, por si só, pode reescrever quem lidera a próxima fase da IA aplicada.

FAQ

A OpenAI vai abandonar as GPUs da NVIDIA?
Não. O cenário mais provável é um portefólio híbrido, onde as GPUs continuam centrais e coexistem com aceleradores otimizados para inferência.

Por que motivo a inferência é tão sensível a latência?
Porque impacta diretamente a experiência do utilizador e os custos. Milissegundos acumulam-se em cadeias de raciocínio longas e em picos de tráfego.

Que tipo de workloads mais beneficiam de hardware alternativo?
Geração de código, raciocínio estruturado e tarefas com contextos muito extensos, onde a movimentação de dados é o gargalo.

O software está preparado para múltiplas arquiteturas?
Está a evoluir nessa direção. Compiladores e servidores de modelos estão a ganhar backends mais portáveis, mas a maturidade ainda varia.

Isto pode baixar preços para clientes finais?
Com mais concorrência e melhor eficiência por token, a tendência natural é de redução de custo por utilização, especialmente em volumes altos.

O que devem fazer as empresas que consomem IA hoje?
Medir, testar e comparar. Benchmarks fim‑a‑fim no seu próprio tráfego valem mais do que resultados sintéticos. E manter uma estratégia multi‑fornecedor reduz risco.

Fonte: Reuters

Etiquetas

aceleradores de IACerebraschips de IAdata centerdesempenho por dólaredge computinggeração de códigogpusGroqhardware de IAIA generativainferênciaKV‑cachelatenciamercado de semicondutoresnvidiaopenaiotimização de custosquantizaçãoraciocínio

Gostou? Partilhe Artigo com os seus amigos!

Bruno Peralta

Bruno Peralta

Fanático de tecnologia e fã do Android, mas com consciência que a Apple revolucionou vários mercados. Quem me conhece, sabe que estou sempre à procura de notícias sobre tecnologia.

Dispositivo Huawei WiFi Mesh X3 Pro com design inspirado na natureza, que combina tecnologia avançada Wi-Fi 7 para uma conexão rápida e estável em ambientes modernos.
Anterior

HUAWEI WiFi Mesh X3 Pro: quando o Wi-Fi 7 encontra o design inspirado na natureza

Consola Nintendo Switch com controladores azuis e vermelhos, exibindo jogos na tela, colocada sobre uma superfície de tecido com fundo de caixas de madeira vintage.
Próximo

Switch ultrapassa DS: consola mais vendida da Nintendo

Sem Comentários! Seja o Primeiro.

Deixe um comentário Cancelar resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Redes Sociais
Facebook
Instagram
X
Telegram
Análises
12 de Junho de 2026
Análise JBL Live 780NC: Review aos headphones que impressionam pela autonomia e qualidade de som
9 de Junho de 2026
Ensaio Mazda 6e surpreendeu-nos: até 560 km de autonomia e um prazer de condução raro nos elétricos
29 de Maio de 2026
Análise Xiaomi Watch S5: review completa ao smartwatch que dura mais de 20 dias
29 de Maio de 2026
Análise Xiaomi 17T: o equilíbrio que faltava na gama média premium
21 de Maio de 2026
Análise HP Smart Tank 6005: impressora para imprimir muito e gastar pouco
21 de Maio de 2026
Análise Huawei Watch Fit 5 Pro: a smartband que já pensa como smartwatch
Destaques

China prepara mega-rede de IA e afasta a Nvidia

12 de Junho de 2026
Representação digital de inteligência artificial com elementos tecnológicos e rede de dados, simbolizando inovação e avanços em IA.

UE quer acesso ao Mythos da Anthropic

12 de Junho de 2026
ALETADOR DE PELE VIBRATÓRIO em tom lilás, com design ergonómico e portátil, ideal para cuidados pessoais e higiene facial, colocado sobre uma mesa de madeira com caixa de embalagem ao fundo.

Logitech lança rato dobrável que cabe no bolso

12 de Junho de 2026

Apple revela a maior mudança da Siri na WWDC 2026

9 de Junho de 2026

iOS 27 já é oficial: Siri muda tudo no iPhone

9 de Junho de 2026
Ícone do Microsoft Word em 3D com efeito de brilho azul, representando o software de processamento de texto da Microsoft, utilizado para criar, editar e formatar documentos.

Office no Mac vai perder funções já em 2026

2 de Junho de 2026

Últimas Notícias

China prepara mega-rede de IA e afasta a Nvidia

Representação digital de inteligência artificial com elementos tecnológicos e rede de dados, simbolizando inovação e avanços em IA.

UE quer acesso ao Mythos da Anthropic

Botão azul "Alterar email" na página de configurações de conta do site MaisTecnologia.

Gmail já deixa mudar o endereço sem perder a conta

iOS 27 beta já está disponível: como instalar

Motores

Ensaio Mazda 6e surpreendeu-nos: até 560 km de autonomia e um prazer de condução raro nos elétricos

Polestar 3 chega a Portugal com carga mais rápida

LG e Google querem mudar o ecrã do seu próximo carro

Zeekr chega a Portugal e estreia o novo 7GT

Gaming

Pokémon Champions chega ao iPhone e Android este mês

Nave de jogos Predator Atlas com tela touchscreen, controlos laterais e design futurista, ideal para gamers que procuram desempenho e inovação em dispositivos portáteis de alta tecnologia.

Acer Predator Atlas 8 quer mudar as consolas portáteis

Veículo de alta performance inspirado em carros de corrida, com design aerodinâmico e detalhes tecnológicos avançados, em um estádio de futebol com iluminação vibrante.

Epic mostra Unreal Engine 6 com Rocket League

A imagem mostra uma pessoa segurando um smartphone com uma tela amarela, em um ambiente de sala de aula ou auditório, com o logotipo da Nintendo no canto superior esquerdo.

Nintendo lança Pictonico e transforma fotos em minijogos

MaisTecnologia MaisTecnologia

Fundado em 2008, o MaisTecnologia é um portal que se dedica à divulgação de informação na área da tecnologia e ciência.

Parceiros
Imagem de um painel de tecnologia e-Ink no rodapé do site, destacando a inovação em displays de baixo consumo energético.
Trending
Armazém de dados na nuvem com ícones de edifícios e nuvens, representando armazenamento e gestão de dados na cloud, com o logotipo do Google Cloud.
Google One muda tudo: mais espaço por menos dinheiro
WhatsApp vai deixar de funcionar nestes iPhone

MaisTecnologia

  • Sobre nós
  • Privacidade
  • Cookies
  • Estatuto Editorial
  • Contactos

MaisTecnologia - Marca Registada