O mais recente avanço anunciado para conquistar o mundo da Inteligência Artificial são os geradores de modelos 3D. Agora surgiu o OpenAI Open Source Point-E, um sistema de machine learning que cria um objeto 3D a partir de uma indicação de texto (como faz o ChatGPT). De acordo com um artigo publicado juntamente com a base de código, o Point-E pode produzir modelos 3D no máximo em dois minutos com uma única GPU Nvidia V100.
É importante esclarecer que o Point-E não cria objetos 3D no seu sentido literal. O que faz é gerar nuvens de pontos ou conjuntos discretos de pontos de dados no espaço que representam uma forma 3D – daí a abreviação atrevida: o “E” em Point-E é a abreviação de “eficiência”, porque é absurdamente mais rápido que as abordagens anteriores de geração de objetos 3D.
As nuvens de pontos são mais fáceis de sintetizar em ambiente computacional, mas não capturam a granularidade fina de um objeto, forma ou textura – uma limitação ainda muito significativa do Point-E atualmente. O modelo às vezes pode perder certas partes dos objetos, resultando em formas distorcidas.
Para a contornar, a equipa do Point-E treinou um sistema de IA adicional para converter as nuvens de pontos do Point-E em coleções de vértices, arestas e faces que definem um objeto e que são comumente usadas em modelagem e design 3D. Depois de treinar os modelos num conjunto de dados de “alguns milhões” de objetos 3D e metadados associados, o Point-E pode produzir nuvens de pontos coloridos que frequentemente correspondem a indicações textuais, defendem os investigadores da OpenAI.
A OpenAI pode ser a mais recente empresa a entrar na corrida pelo melhor gerador de objetos 3D, mas não é a primeira. Há um ano, a Google deu a conhecer o DreamFusion, uma versão melhorada do Dream Fields, um sistema gerador de 3D que a empresa lançou em 2021. Ao contrário do Dream Fields, o DreamFusion não requer treino específico na área, o que significa que pode gerar representações 3D de objetos… sem dados 3D.
Fonte: Tech Crunch