Nesta semana, testemunhamos um confronto épico no mundo da inteligência artificial: o Google I/O, conferência anual da Alphabet (empresa mãe do Google), versus o anúncio surpresa da OpenAI, criadora do ChatGPT. O Google I/O, voltado para desenvolvedores e imprensa, prometia novidades em IA, incluindo novas funções para o Gemini, a IA do Google, e sua integração ao sistema de busca. No entanto, a OpenAI roubou a cena um dia antes, anunciando o ChatGPT-4, um modelo de linguagem multimodal capaz de conversar em tempo real e processar diferentes tipos de informação, como imagens e texto.

O ChatGPT-4 impressiona pela velocidade e naturalidade das respostas. Testei a versão com a voz inspirada na Scarlet Johansson no filme "Her" e fiquei surpreso com a fluidez do diálogo, embora com um sotaque peculiar. A capacidade multimodal permite interações mais ricas, como enviar fotos para análise. Ao enviar a foto de um fone de ouvido Sony, o ChatGPT-4 identificou corretamente o modelo WH-1000XM4, demonstrando sua capacidade de reconhecimento de imagem.
O Google contra-atacou com o Gemini, que promete uma janela de contexto impressionante, chegando a 2 milhões de tokens em testes fechados. Para entender o impacto disso, imagine que um token é uma unidade de informação, como uma palavra ou parte dela. Quanto maior a janela de contexto, mais informação a IA consegue processar para formular respostas mais completas e coerentes. O Gemini, com sua capacidade de contexto quase infinita, poderá processar o equivalente a 2 horas de vídeo, incluindo informações visuais e sonoras. Essa capacidade abre portas para aplicações revolucionárias, especialmente na educação.
Imagine uma IA que acompanha todo o histórico educacional de um aluno, entendendo suas dificuldades e pontos fortes em cada matéria. O Gemini poderá atuar como um professor particular personalizado, adaptando o ritmo e a metodologia de ensino às necessidades individuais de cada aluno. Essa tecnologia tem o potencial de democratizar o acesso à educação de qualidade, oferecendo suporte individualizado a todos, independentemente de sua condição financeira.
As demonstrações do Google I/O, com o Gemini auxiliando no aprendizado de física e traduzindo conversas em tempo real com o auxílio de óculos inteligentes, mostram um futuro próximo com alto nível de "Jarvis Smo" – um termo que cunhei para medir o quão próxima uma IA está do assistente inteligente do Homem de Ferro. Embora ainda haja desafios, como o alto consumo de energia e a necessidade de ambientes controlados para demonstrações, o avanço é inegável.
A batalha entre Google e OpenAI impulsiona a inovação em IA, trazendo tecnologias que antes pareciam ficção científica para a realidade. O impacto na educação é particularmente promissor, com a possibilidade de personalizar o aprendizado e democratizar o acesso ao conhecimento. Ainda há questões a serem debatidas, como o impacto ambiental e a substituição de empregos, mas o potencial da IA para transformar a sociedade é inegável. Estamos vivendo um momento crucial na história da tecnologia, e o futuro da IA, com seu crescente "Jarvis Smo", promete ser ainda mais impressionante.