Neste post, vamos explorar o poder do Google AI Studio para construir uma aplicação de inteligência artificial que identifica objetos em imagens e sugere itens relacionados. Acompanhe o passo a passo e veja como é possível criar uma aplicação funcional em poucos minutos, utilizando os recursos gratuitos do AI Studio e o poder dos modelos Gemini.

O primeiro passo é acessar o AI Studio (aistudio.google.com) com sua conta Google. Lembre-se de que, embora o acesso à plataforma seja gratuito, o uso dos modelos de linguagem tem custos, que serão detalhados mais adiante. Você também precisará de uma chave de API, que pode ser obtida facilmente e gratuitamente no console do Google Cloud.
Existem diversas maneiras de começar a construir uma aplicação no AI Studio. Você pode partir do zero, criar um prompt, ou utilizar um dos aplicativos iniciais prontos. Neste tutorial, vamos utilizar a Galeria de Prompts como ponto de partida, especificamente o prompt "O que é isto?", que descreve um objeto e como usá-lo. Este prompt inclui exemplos como um órgão de tubos e um relógio de sol, fornecendo uma base sólida para nossa aplicação.
Após testar o prompt com exemplos e verificar o custo associado ao modelo Gemini 1.5 Flash, vamos personalizá-lo. Para isso, salvamos uma cópia do prompt no Google Drive, onde podemos editá-lo livremente. Nossa modificação incluirá a solicitação de itens relacionados ao objeto identificado, tornando a aplicação ainda mais útil.
Para testar a nova funcionalidade, incluímos um exemplo com a imagem de um Lego Land Rover. A inserção de imagens é feita através da opção "Inserir Imagem" no editor de prompts. Após executar o prompt modificado, verificamos se a IA identifica corretamente o objeto na imagem e fornece os itens relacionados.
Com o prompt funcionando conforme o esperado, o próximo passo é obter o código para integrá-lo à nossa aplicação. O AI Studio permite gerar código em diversas linguagens, incluindo JavaScript e Python. Para este exemplo, vamos utilizar JavaScript para criar uma aplicação web.
Agora, com o código JavaScript em mãos, precisamos criar a estrutura da nossa aplicação web. Para isso, retornamos ao AI Studio e criamos um novo prompt, fornecendo o código JavaScript gerado anteriormente e solicitando a criação de uma aplicação web completa, incluindo HTML e CSS. Especificamos também que a interface do usuário deve ser simples e limpa.
Enquanto aguardamos a resposta do modelo Gemini 2.0 Flash (lembrando que este também tem um custo associado), preparamos o ambiente de desenvolvimento. Criamos um arquivo .env para armazenar a chave de API, um arquivo server.js para o servidor Express, uma pasta public contendo o index.html e o script.js. A estrutura de pastas e arquivos pode variar dependendo da resposta do AI Studio.
Após receber a resposta com o código HTML, CSS e JavaScript, integramos tudo na nossa aplicação. É importante notar que a resposta do AI pode variar, sendo necessário adaptar as instruções e corrigir eventuais problemas no código gerado. Ajustes como a criação de um arquivo package.json e a instalação de dependências via npm podem ser necessários.
Com todos os arquivos em seus devidos lugares e as dependências instaladas, executamos o servidor com o comando node server.js. A aplicação deverá estar disponível em http://localhost:3000. Agora é hora de testar a aplicação, carregando diferentes imagens e verificando se a IA identifica os objetos e sugere itens relacionados.
Durante os testes, podemos encontrar comportamentos inesperados, como a ausência da lista de itens relacionados em alguns casos. Isso pode ser devido a limitações do prompt, parâmetros de configuração do modelo ou a própria natureza da imagem. Ajuste o prompt e os parâmetros conforme necessário para aprimorar o funcionamento da aplicação.
Este tutorial demonstrou como o Google AI Studio simplifica o processo de criação de aplicações de IA, desde a concepção do prompt até a geração do código e execução da aplicação web. A flexibilidade da plataforma e o poder dos modelos Gemini permitem criar aplicações personalizadas de forma rápida e eficiente.
Uma resposta
I needed to thank you for this good read!! I absolutely loved every bit of it.
I’ve got you book-marked to check out new stuff you post…