Recentemente, o site The Information publicou um relatório revelando detalhes chocantes sobre um projeto secreto da OpenAI, codinome “Strawberry”. Anteriormente conhecido como Q* (Q-Star), este modelo de IA despertou o interesse de agências de segurança nacional americanas, levando Sam Altman e sua equipe a demonstrarem suas capacidades para oficiais de segurança. Mais intrigante ainda, a tecnologia por trás do Strawberry está sendo usada para construir o modelo da próxima geração, chamado Orion. Este modelo promete ser diferente de qualquer outro já visto, com implicações significativas para a segurança da IA, segurança nacional, o futuro do código aberto e o progresso geral da IA.

Os rumores sobre o misterioso modelo Strawberry da OpenAI se confirmaram. O modelo, antes conhecido como Q*, é real e conseguiu captar a atenção de várias agências de segurança nacional dos Estados Unidos. A equipe da OpenAI, liderada por Sam Altman, teve que apresentar as habilidades do modelo para diversos oficiais de segurança. A tecnologia subjacente ao Strawberry, originada da pesquisa "Self-taught Reasoner" (STAR) da Universidade de Stanford em 2022 e seu sucessor, o Q-Star (Q* - "Quiet Self-taught Reasoner"), permite que a IA não apenas gere respostas, mas também planeje, navegue na internet de forma autônoma e realize pesquisas complexas. O objetivo, segundo a OpenAI, é que seus modelos de IA vejam e entendam o mundo de maneira mais semelhante aos humanos.
A demonstração dessa tecnologia para oficiais de segurança nacional provavelmente tem um propósito duplo: além de apresentar suas capacidades, inicia uma conversa sobre como proteger a tecnologia de adversários estrangeiros, como a China. Essa estratégia contrasta com a abordagem da Meta, que lançou o modelo Llama em código aberto, tornando-o acessível a todos, inclusive à China. Ao apresentar o Strawberry para o governo americano antes de um lançamento público, a OpenAI pode estar estabelecendo um novo padrão para desenvolvedores de IA, especialmente considerando a crescente preocupação com a IA avançada como uma questão de segurança nacional.
Uma das aplicações mais importantes do Strawberry é a geração de dados de treinamento de alta qualidade para o Orion, o próximo modelo de linguagem da OpenAI, atualmente em desenvolvimento. A escolha de nomes da mitologia grega para modelos de IA, como Gemini (Google), e agora Orion (OpenAI), é uma curiosidade no setor. O Orion se diferencia por sua capacidade de aprendizado iterativo e sua arquitetura inovadora. O Strawberry é crucial para o desenvolvimento do Orion, pois gera dados sintéticos de alta qualidade para seu treinamento. Este processo cíclico de geração de dados e treinamento reflete uma mudança na forma como os modelos de IA são desenvolvidos, com a linha entre treinamento e inferência se tornando cada vez mais tênue. A inferência, ou seja, a saída do modelo (texto, imagens, etc.), alimenta o treinamento, criando um ciclo contínuo de aprendizado e aprimoramento.
Essa abordagem de aprendizado contínuo, onde a IA gera seus próprios dados de treinamento, tem o potencial de levar os modelos a níveis de inteligência superiores, possivelmente até transcendendo a inteligência humana, como sugerido pelo professor Noah Goodman, da Universidade de Stanford, um dos criadores da tecnologia STAR. Embora haja preocupações sobre um possível "colapso" dos modelos de IA devido ao uso de dados sintéticos, as pesquisas e os resultados obtidos com modelos como o Orca 2, da Microsoft, indicam que essa abordagem pode levar a modelos menores e mais eficientes, que superam em desempenho modelos muito maiores. O Orca 2, treinado com dados sintéticos gerados pelo GPT-4, demonstrou desempenho superior a modelos dez vezes maiores, comprovando o potencial da técnica.
O desenvolvimento do Orion e a tecnologia por trás do Strawberry têm implicações profundas para o futuro da IA. A colaboração entre a OpenAI e as agências de segurança nacional americanas sugere uma crescente conscientização sobre o potencial da IA, tanto para o bem quanto para o mal. A possibilidade de manter modelos de IA altamente poderosos, como o Orion, em ambientes controlados, enquanto se disponibilizam modelos menores e mais especializados para uso público, como o Orca 2, pode ser uma estratégia para mitigar riscos e garantir a segurança da IA.
A capacidade do Strawberry de raciocinar e planejar a longo prazo abre caminho para aplicações inovadoras em diversas áreas, desde a resolução de quebra-cabeças complexos até a automação de tarefas que exigem pensamento estratégico. A utilização de dados sintéticos para treinamento de modelos menores e mais eficientes, como demonstrado pelo Orca 2, pode democratizar o acesso à IA, tornando-a mais acessível a um público mais amplo. Enquanto o futuro da IA se desenrola, o projeto Strawberry e o modelo Orion representam um passo significativo em direção a um mundo onde a inteligência artificial desempenha um papel cada vez mais central em nossas vidas.