A Realidade por trás da Demonstração de Gemini, o Novo Modelo de IA da Google

A apresentação do Gemini, o novo e avançado modelo de linguagem da Google, foi uma das notícias mais importantes no campo da inteligência artificial em 2023.

Pela primeira vez, uma empresa conseguiu apresentar um modelo capaz de rivalizar e até mesmo superar o modelo GPT-4 da OpenAI em termos de capacidades, habilidades e tempo de resposta. Pelo menos, foi isso que a Google nos fez acreditar com as várias demonstrações que mostrou durante a apresentação.

Entre todas essas demonstrações, houve um vídeo publicado no canal do YouTube da Google que chamou a atenção do mundo. O vídeo, que já acumula mais de 2 milhões de visualizações, mostrava algumas das habilidades mais avançadas de Gemini através de diferentes interações com o modelo, demonstrando como esta IA é capaz de compreender diferentes tipos de inputs, sejam eles visuais ou auditivos, de forma fluida e, sobretudo, muito rápida.

No entanto, parece que o vídeo não representa de forma fiável o que Gemini é realmente capaz de fazer. Um porta-voz da Google confirmou à Bloomberg que, na realidade, a demonstração mostrada no vídeo não foi realizada em tempo real nem se utilizou a voz tal como o vídeo nos faz acreditar.

No vídeo, podemos ver como Gemini é capaz de compreender e identificar diferentes inputs visuais e de voz de forma incrivelmente precisa e rápida. A demonstração deixou a audiência de boca aberta, embora houvesse quem mostrasse algum grau de ceticismo. E aqueles que o fizeram, não estavam errados. Como um porta-voz da Google indicou, na realidade o vídeo foi criado capturando imagens estáticas que posteriormente eram mostradas ao modelo junto com uma série de prompts para a sua posterior interpretação.

Perante a polémica, um representante da Google DeepMind (a divisão responsável pelo desenvolvimento de Gemini), decidiu esclarecer mais sobre o assunto. Explicou que o vídeo estava destinado a inspirar os desenvolvedores, mostrando-lhes diferentes experiências de utilizador que poderiam ser possíveis graças a Gemini.

Portanto, embora não se possa dizer que o vídeo seja falso, pode-se afirmar que a Google “exagerou” as (já impressionantes) capacidades de Gemini com o objetivo de tornar a sua demonstração ainda mais atraente. Agora, só nos resta esperar até que o modelo esteja disponível de forma mais ampla para podermos testar essas habilidades.

Embora o objetivo fosse inspirar os desenvolvedores, a Google pode ter criado expectativas irrealistas sobre as capacidades de Gemini. Ainda assim, é inegável que Gemini representa um avanço significativo na IA e estou ansioso para ver como esta tecnologia irá evoluir e ser aplicada no futuro.

Fonte: Google

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui