O universo da inteligência artificial generativa está em constante evolução, e novas ferramentas surgem a cada dia, prometendo revolucionar a criação de imagens. Uma dessas ferramentas é o Recraft, um gerador de imagens que alcançou o topo do ranking do Artificial Analysis, uma plataforma independente que avalia modelos de imagem por meio de testes cegos. Mas será que o Recraft realmente faz jus ao hype e supera gigantes como Midjourney, Stable Diffusion e DALL-E 2? Este post analisa os recursos e a performance do Recraft, comparando-o com outros modelos líderes como Flux 1.1 Pro e Ideogram versão 2, a partir de uma série de prompts desafiadores.

Para avaliar a verdadeira capacidade do Recraft, foram utilizados prompts complexos, projetados para testar seus limites. O primeiro desafio foi gerar a pose de yoga "Guerreiro 1". Embora o Recraft tenha produzido imagens com certo realismo, a anatomia das mãos e pés apresentou falhas, e a pose em si não foi reproduzida com precisão. Flux e Ideogram também apresentaram dificuldades com essa pose, demonstrando que a representação precisa de movimentos complexos ainda é um desafio para a IA generativa.
Outro teste envolveu a criação de uma "foto de baixa qualidade de um adolescente tirando uma selfie no espelho do Snapchat em 2015". Nesse caso, o Recraft se saiu bem ao reproduzir a estética granulada e a baixa qualidade típicas de fotos antigas de celular. No entanto, a representação do aparelho telefônico deixou a desejar, apresentando um design irreal. Ideogram, por outro lado, gerou um celular mais convincente.
O prompt "Will Smith, Homem de Ferro e Rainha Elizabeth jantando juntos" avaliou a capacidade do Recraft de gerar imagens de figuras públicas. Os resultados foram mistos: enquanto o estilo de ilustração funcionou em uma das imagens, a outra, que visava o fotorrealismo, apresentou falhas na representação dos rostos e alguns artefatos na imagem. Nesse quesito, o Ideogram se destacou, gerando representações mais fiéis das celebridades.
A geração de texto também foi avaliada. O prompt com uma longa frase para ser escrita em um diário revelou dificuldades do Recraft em gerar textos longos e coerentes, com erros ortográficos e espaçamento inconsistente. Flux e Ideogram apresentaram problemas semelhantes, indicando que a geração de texto extenso ainda é um ponto de melhoria para esses modelos.
Por fim, prompts envolvendo animais incomuns, como o dragão de Komodo, e estilos artísticos específicos, como aquarela, revelaram inconsistências na performance do Recraft. Enquanto o modelo conseguiu gerar uma aproximação do dragão, a anatomia do animal apresentou falhas. Na geração de aquarela, o resultado se aproximou mais de um desenho do que de uma pintura.
Apesar das inconsistências na geração de imagens, o Recraft oferece recursos interessantes de edição, como remoção de fundo, upscaling, mesclagem de objetos, ajuste fino de imagens (semelhante ao img2img) e criação de mockups de produtos com logos. A ferramenta de troca de fundo, em particular, se destaca pela facilidade e eficiência, simplificando um processo que seria trabalhoso em softwares tradicionais de edição.
Em resumo, o Recraft apresenta um potencial promissor, mas ainda precisa de refinamentos para se consolidar como um líder no mercado de IA generativa de imagens. Em alguns testes, ele se equipara ou até supera concorrentes como Flux e Ideogram, principalmente no fotorrealismo de certas imagens. No entanto, apresenta deficiências na geração de texto extenso, anatomia, animais incomuns e estilos artísticos específicos. Seus recursos de edição são um diferencial, oferecendo um fluxo de trabalho mais integrado para a criação e manipulação de imagens. Acompanhar o desenvolvimento do Recraft será crucial para observar se ele conseguirá superar suas limitações e cumprir a promessa de revolucionar a geração de imagens com IA.