Neste tutorial, exploramos o fascinante mundo da produção cinematográfica com inteligência artificial, desvendando o processo de criação de um filme com estilo documental realista. A abordagem utilizada concentra-se no desenvolvimento de personagens consistentes e na geração de cenas dinâmicas, utilizando ferramentas de IA como Flux, Runway Gen-2, Runway Act One e Minimax. Acompanhando este guia, você aprenderá a dar vida a personagens com personalidades distintas e a construir narrativas envolventes em um ambiente corporativo simulado, com o exemplo da mitologia grega.

A construção de personagens consistentes é fundamental para a imersão do espectador no universo do filme. Para isso, utilizamos o Flux para treinar modelos personalizados, o que garante a manutenção das características físicas e visuais de cada personagem ao longo de toda a narrativa. O processo inicia-se com o design dos personagens, utilizando prompts detalhados em ferramentas de geração de imagens por IA. No exemplo do filme sobre o Olimpo como uma empresa, Afrodite, Deusa do amor e da beleza, foi concebida com um traje corporativo e um sorriso gentil. Zeus, por sua vez, recebeu um estilo documental, inspirado no fotógrafo William Eggleston, para realçar o realismo da narrativa.
Após a criação da imagem inicial de cada personagem, utilizamos a ferramenta "Consistent Characters" do Replicate para gerar diversas imagens do mesmo personagem em diferentes ângulos e poses. Esse conjunto de imagens sintéticas alimenta o treinamento do modelo personalizado no Flux. O upscaling das imagens, utilizando ferramentas como o Magnific, é crucial para garantir a qualidade e a definição dos personagens no vídeo final. Ao combinar diferentes modelos de IA, como Flux Realism e Flux 1.1, podemos explorar diferentes estilos visuais e encontrar a estética ideal para cada personagem e cena. Plataformas como Scenario permitem a composição de múltiplos modelos de Flux em um único, facilitando a geração de cenas complexas com diversos personagens interagindo.
A correção de eventuais erros anatômicos, comuns em imagens geradas por IA, pode ser realizada com ferramentas de retoque disponíveis em plataformas como o FreePic. Este fluxo de trabalho integrado, da geração da imagem ao retoque, agiliza o processo de criação e garante a consistência visual dos personagens.
Com os personagens definidos e as cenas geradas, partimos para a animação facial e a sincronização labial (lip sync). O Runway Act One é uma ferramenta poderosa para dar vida aos personagens, permitindo a sincronização dos movimentos labiais com o áudio. Basta carregar um vídeo curto do seu rosto, atuando as falas do personagem, e a imagem do personagem desejado. O Act One mapeará os movimentos faciais do vídeo para a imagem estática, criando a ilusão de que o personagem está falando.
Para cenas com múltiplos personagens, é importante lembrar que o Act One animará apenas o personagem mais próximo da câmera. Em cenas com diálogos complexos, pode ser necessário utilizar outras estratégias para garantir a animação de todos os personagens envolvidos. Ferramentas como o 11 Labs permitem a criação de vozes personalizadas para cada personagem, adicionando mais uma camada de realismo à narrativa. Através de prompts de texto, podemos definir características como tom, sotaque e entonação, criando vozes únicas e memoráveis.
Para cenas de ação, o Minimax se destaca por sua capacidade de gerar movimentos mais dinâmicos e fluidos. Enquanto o Runway Act One é ideal para cenas com foco na atuação facial, o Minimax é a escolha certa para cenas com movimentos complexos, como lutas, explosões e perseguições. O Runway também oferece controles avançados de câmera, permitindo a criação de movimentos de câmera complexos, como rotação, inclinação e zoom, adicionando mais dinamismo às cenas. A combinação dessas ferramentas possibilita a criação de filmes com IA com qualidade cinematográfica, explorando diferentes estilos visuais e narrativos. O Clink 1.5 também oferece recursos de lip sync, permitindo a sincronização labial com áudio ou texto. A vantagem do Clink é a possibilidade de aplicar o lip sync em vídeos, criando cenas mais dinâmicas em comparação com as imagens estáticas do Runway Act One.