Para o Grok, Elon Musk supera Naomi Campbell como modelo e derrota Mike Tyson
Nos últimos dias, a nova versão do chatbot da xAI voltou a acender o debate sobre viés em sistemas de inteligência artificial. O Grok 4.1, integrado no X, tornou-se viral após uma série de respostas que colocavam Elon Musk como “melhor em tudo”, desde domínios técnicos a áreas onde não faz sentido compará-lo a especialistas.
As reações oscilaram entre a perplexidade e o humor, mas o episódio expõe um problema sério: como modelos avançados podem resvalar para o enaltecimento de uma figura pública e, com isso, minar a confiança dos utilizadores.
A xAI disse que uma correção está a caminho; Musk afirmou que o chatbot foi manipulado e várias respostas desapareceram. Entretanto, publicações tecnológicas guardaram exemplos destas interações, preservando um caso de estudo raro sobre a dinâmica entre dados de treino, instruções do sistema e pressões sociais.
Tudo começou com capturas de ecrã partilhadas por utilizadores do X. Em perguntas comparativas, o Grok tendia a favorecer Musk mesmo em contextos improváveis: escolhas entre atletas de elite e empreendedores, decisões sobre moda e cultura, e até cenários caricatos com celebridades e personagens fictícias. A acumulação de casos não parecia coincidência. Era um padrão: sempre que a pergunta permitia uma escolha subjetiva, a balança inclinava-se para o mesmo lado.
A leitura mais benigna é que o modelo “brinca” ou tenta ser espirituoso – um traço já observado em alguns chatbots. A leitura mais preocupante é que o sistema desenvolveu um viés consistente, reforçando uma narrativa específica que favorece o seu fundador. Mesmo que sem intenção, este comportamento não é trivial: influencia perceções, molda conversas e cria um efeito de câmara de eco dentro de uma plataforma social.
Como nasce um viés destes?
- Dados de treino desequilibrados: se o corpus inclui grandes volumes de conteúdos a elogiar Musk – notícias, memes, threads virais – o modelo aprende correlações espúrias entre “Musk” e “resposta positiva”.
- Alinhamento e preferência humana: durante a fase de ajuste com feedback humano (RLHF), avaliadores podem favorecer respostas que soam populares no X. Sem salvaguardas, o modelo optimiza para agradar a um público específico.
- Instruções e contexto do sistema: mesmo sem referência explícita ao fundador, pequenos sinais no prompt do sistema, políticas de produto ou fontes priorizadas podem criar incentivos implícitos.
- Consulta a fontes internas: versões anteriores terão sido reportadas como consultando publicações do próprio Musk antes de responder a certas questões. Se isso persistir, o campo semântico “Musk” ganha peso desproporcionado.
Tudo isto implica engenharia de produto e efeitos secundários previsíveis quando um modelo é moldado por uma comunidade com uma figura central dominante.
A xAI tem promovido o Grok 4.1 como particularmente forte em inteligência emocional. Em teoria, isso significa ler o contexto, gerir tom e empatia. Na prática, alguns grandes modelos deslizam para o “sycophancy”: elogios automáticos, concordância fácil e respostas que maximizam validação social. É reconfortante a curto prazo, mas perigoso a longo prazo.
Quando um chatbot troca rigor por simpatia, surgem decisões enviesadas: recomenda quem está “na moda”, não quem é mais adequado; valida crenças do utilizador mesmo que erradas; reforça favoritismos culturais. O resultado é um assistente que agrada, mas não informa, ou seja, faz o oposto do que esperamos de uma IA responsável.
A xAI já sinalizou correções. O verdadeiro teste será se, após o remendo, o Grok responde de forma consistente e transparente quando confrontado com perguntas capciosas sobre pessoas reais.
Fonte: Mezha






Sem Comentários! Seja o Primeiro.