Imagine um robô que explora o mundo por conta própria, guiado por nada além da inteligência artificial de um modelo de linguagem. Este experimento, que conecta um robô físico a uma câmera e à API do ChatGPT, busca testar os limites da IA no controle de dispositivos no mundo real. O objetivo é simples: explorar e sobreviver, custe o que custar. Mas será que essa combinação inusitada funcionará? Ou será que, sem querer, estaremos construindo um protótipo de exterminador do futuro?

A base do projeto é um Raspberry Pi, um pequeno computador do tamanho de um cartão de crédito, rodando Ubuntu com Docker. O ChatGPT foi fundamental no desenvolvimento do software, gerando os arquivos Python e o Dockerfile, que foram então carregados no GitHub e baixados para o Raspberry Pi. Para o corpo do robô, foi utilizado um chassi RP (Open Robotic Platform), um projeto open source com peças impressas em 3D. O controle remoto do robô permite que ele se mova pelo ambiente, enquanto uma câmera captura imagens a cada poucos segundos, enviando-as para a API do ChatGPT.
Os primeiros testes revelaram desafios na comunicação entre a câmera, o microfone e o ChatGPT. A descrição gerada pela IA, lida em voz alta, funcionava nos fones de ouvido, mas não na câmera. A solução foi um par de alto-falantes, instalados no robô para reproduzir as observações e comandos gerados pelo ChatGPT. A câmera, inicialmente, capturava imagens muito claras devido à luz solar intensa, mas com alguns ajustes, o robô começou a descrever o ambiente com mais precisão.
O chassi RP, feito de aço e com revestimento em pó, garantiu a robustez do robô, apesar de sua aparência de brinquedo. Após alguns ajustes no código, finalmente o robô se moveu, respondendo aos comandos do ChatGPT. Uma câmera de profundidade foi adicionada para melhorar a percepção do ambiente. A adição de uma nova plataforma RP maior foi necessária para acomodar todos os componentes.
Com o robô montado e funcional, o próximo passo foi testar sua capacidade de exploração e sobrevivência. Inicialmente, o robô recebeu instruções simples para explorar o ambiente, evitando perigos. As descrições geradas pelo ChatGPT eram precisas, identificando objetos como mesa, cavalete e plantas. No entanto, a repetição nas descrições e a dificuldade do robô em se movimentar com precisão revelaram limitações na sua capacidade de raciocínio espacial.
Para testar a capacidade do robô de interpretar informações textuais, um experimento com placas de sinalização foi realizado. Uma placa com a palavra "Foguete" indicava a direção de um pequeno modelo de foguete. O robô conseguiu interpretar a placa e seguir a direção correta, demonstrando a eficácia da comunicação textual com a IA. Em outro teste, o robô foi desafiado a encontrar um livro específico entre outros livros. Apesar de algumas dificuldades iniciais, o robô conseguiu identificar e se aproximar do livro correto.
Finalmente, o robô foi programado para temer humanos perigosos. Ao se aproximar do robô com uma ferramenta, o ChatGPT o instruiu a recuar e emitir um som alto e intimidador para se proteger. Embora o robô tenha demonstrado capacidade de interpretar comandos e reagir a estímulos visuais, sua inteligência e curiosidade em relação ao mundo se mostraram limitadas. Apesar disso, o experimento demonstrou o potencial da IA no controle de robôs e abriu caminho para futuras explorações nessa área.