Microsoft apresenta Kosmos-1: a Inteligência Artificial 2.0

A Microsoft revelou recentemente o Kosmos-1, um novo algoritmo de inteligência artificial multimodal em que os investigadores da empresa têm estado a trabalhar. Este algoritmo procura levar as capacidades de IA ainda mais longe, uma vez que pode processar múltiplos tipos de entrada, de forma a fornecer resultados e soluções mais precisas. Além disso, o Kosmos-1 é capaz de aprender com o tempo, tornando assim mais fácil para o utilizador obter rapidamente melhores resultados.

Para além deste impressionante desenvolvimento de novas pesquisas, a Microsoft também integrou recentemente o OpenAI/ChatGPT no Bing e no Windows 11, tendo este último sido recebido com comentários pouco felizes de alguns utilizadores.

O Kosmos-1, uma forma de inteligência artificial desenvolvida por investigadores da Microsoft, distingue-se dos algoritmos tradicionais na medida em que pode processar tanto imagens como texto. Esta capacidade de tirar partido de múltiplas modalidades de entrada, conhecidas como multimodalidade, é vista por muitos especialistas como um passo importante para o desenvolvimento da inteligência artificial geral. Ao contrário da IA que é construída para uma tarefa ou propósito específico, a IA geral deve ser capaz de pensar, raciocinar e tomar decisões ao mesmo nível que os humanos. 

Graças ao seu multimodo, o Kosmos-1 é muito mais versátil do que o visto pelos mais populares do momento. ChatGPT “sabe conversar”, para usar um termo um tanto aproximado, DALL-E “sabe desenhar”. O Kosmos-1, por outro lado, é capaz de analisar e reconhecer o conteúdo de uma imagem, resolver quebra-cabeças visuais, reconhecer e compreender texto, passar em testes de QI baseados em imagens e reconhecer instruções expressas em linguagem natural.

Curiosamente, embora até agora a Microsoft tenha contado com o OpenAI para serviços ao público, o Kosmos-1 parece ser desenvolvido internamente. Os pesquisadores dizem que treinaram a IA com uma variedade de materiais da web, incluindo o popular arquivo de texto de 800 GB The Pile e o banco de dados gratuito The Crawl.

O algoritmo foi então submetido a vários testes cognitivos e lógicos (compreensão de linguagem, geração de linguagem, reconhecimento ótico de caracteres, classificação de texto, geração de legendas, resposta a perguntas visuais, resposta a perguntas em páginas da web) e, em vários casos, obteve resultados superiores aos algoritmos de maior prestígio atuais. No entanto, em testes gráficos de QI (as Matrizes de Raven, especificamente) ele só conseguiu produzir respostas corretas entre 22% e 26%, dependendo dos parâmetros específicos.

Resumindo, ainda estamos longe das capacidades humanas, mas é um bom resultado para IA.

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui