A Inteligência Artificial está transformando rapidamente o cenário da produção de vídeos, com novas ferramentas e fluxos de trabalho surgindo a cada semana. De geradores de vídeo open source a aprimoradores de resolução e softwares de tradução, as possibilidades criativas se expandem a um ritmo impressionante. Este post explora as últimas novidades no mundo da produção de vídeos com IA, incluindo um fluxo de trabalho inovador para maximizar a qualidade de seus projetos.

A Alibaba lançou recentemente o One 2.1, uma ferramenta de geração de vídeo por IA open source, disponível tanto para uso online quanto local. Considerado por alguns como o gerador de vídeo IA de melhor qualidade disponível, o One 2.1 oferece recursos como texto para vídeo, imagem para vídeo e até mesmo geração de efeitos sonoros a partir de vídeo. Embora o tempo de renderização possa ser um pouco lento, a possibilidade de executá-lo localmente e a gratuidade compensam essa limitação. Plataformas como Hugging Face e Korea oferecem acesso online simplificado à ferramenta.
Comparado ao Google Imagen Video, o One 2.1 demonstra resultados promissores, especialmente em termos de detalhes e dinâmica em elementos como fogo e bandeiras. Entretanto, a fluidez de movimento ainda precisa de aprimoramentos, apresentando certa trepidação. Para contornar limitações de qualidade inerentes aos vídeos gerados por IA, um novo fluxo de trabalho se apresenta como uma solução poderosa.
Este fluxo de trabalho envolve três etapas: geração do vídeo em IA (como com o Google Imagen Video), aprimoramento da resolução e detalhes com o Topaz Video Project Starlite, e finalmente, upscaling para 4K ou superior utilizando o Topaz Video AI. O Project Starlite, em particular, destaca-se por sua capacidade de adicionar ruído e detalhes realistas à filmagem, elevando significativamente a qualidade percebida. Já o Topaz Video AI, com seu modelo Thea, garante um upscaling para resoluções maiores sem comprometer a qualidade.
Além da geração de vídeo, outras ferramentas de IA estão se destacando no mercado. O Adobe Translate oferece tradução de vídeos para diversos idiomas, embora seu custo-benefício seja questionável quando comparado a alternativas como o 11 Labs. Já o Luma Labs introduziu uma funcionalidade interessante para geração automática de efeitos sonoros e soundscapes a partir de vídeos gerados no Dream Machine. Embora ainda em estágio inicial, a ferramenta apresenta potencial para agilizar o processo de sound design.
Pika Labs também lançou sua versão 2.2 com novos recursos como geração de vídeos de até 10 segundos em 1080p e a capacidade de keyframing, permitindo maior controle sobre as transformações e transições entre frames. Testes com a ferramenta demonstraram resultados interessantes, porém, ainda é necessário cautela na escolha das imagens para evitar resultados inesperados.
A aquisição da Curious Refuge pela Promise e da Metaphysic pela DCK demonstram o crescente interesse do mercado em tecnologias de IA para produção de vídeo. A Metaphysic, conhecida por seu trabalho de ponta em face swapping em Hollywood, agora conta com o apoio da DCK para continuar inovando no campo dos efeitos visuais. A Magnific também lançou o recurso "Structure Reference", que permite a geração de imagens em diferentes estilos, mantendo a estrutura da imagem original, abrindo novas possibilidades criativas para artistas e designers.
Experimentos sociais, como o uso de Claude 3.7 Sonet para jogar Pokémon, demonstram o potencial da IA para além das aplicações tradicionais e apontam para um futuro onde a interação entre humanos e máquinas na criação de conteúdo se tornará cada vez mais complexa e fascinante. O crescente número de meetups e eventos dedicados à produção de filmes com IA, como o AI Filmmaking Meetup da Fabric AI no NAB, demonstram o amadurecimento da comunidade e o interesse crescente por essas tecnologias.
O desenvolvimento acelerado de ferramentas de IA para vídeo oferece aos criadores um conjunto de possibilidades sem precedentes. A combinação de geradores de vídeo, softwares de aprimoramento, tradução e efeitos sonoros, juntamente com fluxos de trabalho otimizados, permite a criação de conteúdo de alta qualidade com mais rapidez e eficiência. O futuro da produção de vídeo é, sem dúvida, impulsionado pela IA, e cabe aos criadores explorar e dominar essas novas ferramentas para contar histórias de maneiras inovadoras e impactantes.