O mundo da Inteligência Artificial continua em ritmo acelerado, com inovações constantes e lançamentos que transformam a maneira como interagimos com a tecnologia. Esta semana, vimos a Anthropic despontar com recursos inéditos, superando em alguns aspectos a concorrência. O Google, sentindo a pressão, expande seu buscador com IA e uma nova ferramenta de aprendizado, enquanto uma startup apresenta o primeiro motor de jogo generativo totalmente funcional em um navegador. Acompanhe as principais novidades e descubra como elas podem impactar seu dia a dia.

A Anthropic tem se destacado com uma série de lançamentos importantes. Além do aplicativo para desktop, lançado recentemente, a empresa apresentou novas funcionalidades para seu chatbot Claude, incluindo a capacidade de analisar PDFs com elementos visuais, como gráficos e imagens, algo que diferencia Claude de outros LLMs, como o ChatGPT, que até então só consideravam o texto dos PDFs. Essa capacidade, limitada a PDFs de até 100 páginas, está disponível tanto na interface web (através de um preview de recurso) quanto pela API, abrindo portas para aplicações inovadoras no processamento de documentos, especialmente artigos científicos.
Outro lançamento da Anthropic é o Claude 3.5, que apresenta melhorias de desempenho em relação à versão anterior. No entanto, a novidade veio acompanhada de um aumento de preço na API, algo inédito no mercado de LLMs, onde a tendência tem sido a redução de custos a cada nova versão. A Anthropic justifica o aumento com as melhorias de performance, mas a decisão gerou especulações sobre os custos de desenvolvimento e a estratégia da empresa, que obtém a maior parte de sua receita (85%) através da API, ao contrário da OpenAI, que foca no uso do chatbot.
Por fim, a Anthropic atualizou seu aplicativo móvel, adicionando entrada de voz, permitindo que os usuários ditem suas mensagens para o Claude, embora ainda não haja suporte para saída de voz por parte do chatbot. Essa funcionalidade facilita a interação com o LLM, especialmente para a inserção de contextos mais longos.
A OpenAI simplificou o acesso ao ChatGPT com a aquisição do domínio chat.com, que redireciona os usuários para a interface do chatbot. Além disso, o ChatGPT Search tem se mostrado uma alternativa promissora ao Google, com resultados surpreendentemente bons em termos de qualidade e precisão, comparáveis ao Perplexity. Apesar da velocidade ainda inferior ao Google, o ChatGPT Search apresenta respostas concisas e diretas, muitas vezes realizando cálculos e conversões diretamente, sem a necessidade de acessar links externos.
Em resposta à concorrência, o Google expandiu seu recurso de busca com IA, agora chamado de "Visão Geral com IA", para mais regiões. Esse recurso apresenta um resumo gerado por IA no topo dos resultados de busca tradicionais. Apesar das críticas iniciais devido a imprecisões e "alucinações", o Google tem aprimorado a ferramenta, buscando manter sua posição dominante no mercado de buscas.
Um experimento pessoal de uma semana utilizando exclusivamente o ChatGPT Search revelou suas vantagens e desvantagens. A qualidade das respostas foi impressionante, atendendo a necessidades como conversão de moedas, previsão do tempo e acesso a sites específicos. No entanto, a velocidade ainda é um ponto fraco em comparação com a instantaneidade do Google. A longo prazo, com a personalização e o aprendizado contextual, os buscadores com IA têm potencial para revolucionar a forma como buscamos informações, oferecendo respostas personalizadas e proativas, como um assistente pessoal.
A xAI, empresa de Elon Musk, lançou uma plataforma para desenvolvedores e usuários interessados em experimentar com seu LLM, Grok. Com uma interface intuitiva e US$ 25 em créditos gratuitos, a plataforma oferece acesso à API do Grok e a um playground para testes. Apesar de ainda não estar no mesmo nível dos principais concorrentes, o Grok tem evoluído rapidamente, com a recente adição de suporte a imagens. O possível investimento de US$ 75 bilhões da Nvidia na xAI pode impulsionar ainda mais o desenvolvimento do Grok.
Uma ferramenta curiosa da 11 Labs permite criar avatares de voz a partir de perfis do Twitter (agora X). A ferramenta analisa os tweets recentes do usuário e gera amostras de voz personalizadas, com resultados interessantes, embora nem sempre precisos. Vale a pena experimentar e se divertir com as possibilidades.
Uma inovação disruptiva é o lançamento do Oasis, o primeiro motor de jogo generativo acessível diretamente pelo navegador. O Oasis permite jogar uma versão simplificada de Minecraft, onde todo o ambiente é gerado em tempo real pela IA, em vez de ser baseado em código pré-definido. Apesar das limitações em comparação ao jogo original, o Oasis representa um marco na tecnologia de jogos, abrindo caminho para experiências digitais totalmente geradas por IA.
Por fim, o Google lançou o "Aprenda sobre isso", uma ferramenta de IA que auxilia no aprendizado de novas habilidades, criando planos de estudo personalizados e oferecendo testes interativos. Disponível apenas nos EUA (por enquanto), a ferramenta se destaca pela interface amigável, o tom didático e a precisão das informações. Uma alternativa interessante ao ChatGPT para quem busca aprender de forma interativa e divertida.