Ascensão da Inteligência Artificial: Uma Nova Era de Vídeos Gerados por IA

A inteligência artificial (IA) tem sido um dos principais protagonistas na indústria tecnológica durante 2022 e 2023. As ferramentas disruptivas como ChatGPT, Copilot, Bard e outros chatbots baseados em modelos de linguagem têm dominado as manchetes. Além disso, as ferramentas de geração de imagens através da IA, como DALL-E, Stable Diffusion e Midjourney, têm proporcionado resultados verdadeiramente surpreendentes.

Recentemente, começámos a ver ferramentas baseadas em IA capazes de gerar fragmentos de vídeo em poucos segundos. Esta ideia, que até há pouco tempo era impensável, está a ser explorada por várias empresas, incluindo a ByteDance, criadora da popular aplicação TikTok.

A ByteDance apresentou a ‘MagicVideo-V2’, uma ferramenta de geração de vídeo através de inteligência artificial, através do seu site e de um relatório detalhado. A ideia é que possamos descrever em texto o que queremos que apareça no vídeo e a ferramenta será capaz de representá-lo num fragmento de alguns segundos.

O site apresenta vários exemplos de alta qualidade, onde se pode ver como a ferramenta é capaz de gerar impressionantes clipes de vídeo a partir de uma breve descrição. Além disso, também são apresentadas comparações entre a tecnologia da ByteDance e outras existentes na internet, como a ‘SVD-XT’, criada pelos desenvolvedores da Stable Diffusion, ou a Pika 1.0 Gen-2 da Pika Labs.

O que é particularmente impressionante sobre os vídeos gerados por esta IA é a consistência dos resultados. Embora possam ser encontrados alguns erros pontuais, é um bom ponto de partida para os seus criadores.

O MagicVideo-V2 é um modelo que consiste em quatro módulos de funcionamento: texto para imagem (T2I); imagem para vídeo (I2V); vídeo para vídeo (V2V) e um modelo de interpolação de fotogramas. Segundo os seus criadores, o módulo T2I gera uma imagem de 1024 x 1024 pixels com base no prompt introduzido. O módulo I2V anima a imagem, gerando 32 fotogramas de 600 x 600 pixels. Em terceiro lugar, o módulo V2V aumenta a resolução para 1048 x 1048 pixels e, finalmente, o módulo de interpolação adiciona mais suavidade ao movimento da imagem, aumentando a taxa para 94 fotogramas.

Embora não seja uma tecnologia perfeita, é surpreendente que em apenas alguns meses tenhamos visto este tipo de exemplos, dando-nos pistas sobre o quanto esta tecnologia pode nos surpreender no futuro.

No momento, não podemos testar este modelo de geração de vídeo, por isso teremos que esperar para ver como se materializa esta IA. Apesar de ser um projeto que requer bastante potência computacional, quem sabe se no futuro poderemos usá-la para os nossos vídeos do TikTok.

No futuro, esta tecnologia pode vir a revolucionar a forma como criamos e consumimos conteúdos de vídeo. Ainda que o seu uso prático possa estar um pouco distante para o utilizador médio, devido à necessidade de potência computacional, a sua existência é um sinal claro do avanço rápido e constante da IA.

Fonte: Magicvideov2

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui