A NVIDIA, uma gigante da indústria de tecnologia, tem desempenhado um papel fundamental na revolução da computação acelerada, impulsionando avanços sem precedentes em inteligência artificial (IA), especialmente no campo da IA generativa. Em uma palestra no SIGGRAPH 2024, Jensen Huang, CEO da NVIDIA, compartilhou insights sobre a jornada da empresa e como a computação acelerada está moldando o futuro da IA, abordando temas como a evolução da IA generativa, o papel crucial do software e a necessidade de gerenciar o consumo de energia.

A história da NVIDIA se entrelaça com a evolução da computação gráfica. A empresa foi fundada em 1993 e se dedicou a criar soluções para acelerar a renderização de gráficos, impulsionando a indústria de videogames 3D. No entanto, a verdadeira virada aconteceu em 2012 com o surgimento do AlexNet, um avanço no campo da visão computacional. Essa mudança abriu caminho para a NVIDIA se dedicar ao desenvolvimento de soluções para deep learning.
O desenvolvimento da primeira GPU programável para sombreamento em 2001 e o lançamento do DGX1 em 2016, a primeira plataforma dedicada ao deep learning, foram marcos importantes. A entrega do primeiro DGX1 para a OpenAI, em 2016, marcou um momento crucial na trajetória da IA generativa. O ano de 2017 foi marcado pela aparição do Transformer, que revolucionou o aprendizado de máquina e o deep learning moderno.
Em 2018, a NVIDIA lançou o RTX, a primeira plataforma de ray tracing interativa em tempo real. No entanto, o ray tracing ainda era lento para aplicações de jogos e gráficos em tempo real. Foi então que surgiu o DLSS, um avanço que utiliza a IA para inferir pixels, permitindo renderizações em tempo real de alta qualidade. A combinação de ray tracing e DLSS, impulsionada pela IA, marcou um momento crucial na convergência da computação gráfica e da IA.
A NVIDIA tem uma profunda crença no poder do software para desvendar o potencial da computação acelerada. Para Jensen Huang, a computação acelerada é diferente da computação de uso geral. Enquanto esta última pode executar qualquer programa de forma eficaz, a computação acelerada exige uma compreensão profunda dos algoritmos para otimizar os cálculos. A NVIDIA investe em bibliotecas específicas para domínios, como o cuDNN para IA generativa e o cuDF para processamento de dados.
Essas bibliotecas específicas permitem que a NVIDIA abra novos mercados, como o mercado de processamento de dados, que representa uma parcela significativa da computação global. Para Jensen Huang, o desafio reside na constante reinvenção de tudo em relação à computação para cada novo mercado que a NVIDIA entra, como o mercado de robótica e veículos autônomos.
A NVIDIA está constantemente expandindo seu portfólio de software, e a estratégia de software é crucial para a manutenção da liderança da empresa e para a concretização das promessas de crescimento. A empresa acredita que a computação acelerada é o futuro e que, com a criação de software específico para domínios, ela pode revolucionar áreas como IA, robótica, veículos autônomos e muitas outras.
A IA generativa, especialmente os grandes modelos de linguagem, consomem uma quantidade significativa de energia. A NVIDIA reconhece esse desafio e está trabalhando para torná-la mais eficiente. O desenvolvimento do Blackwell, um novo chip que permite a realização de operações complexas com menos energia, representa um passo importante nessa direção.
Jensen Huang argumenta que a computação acelerada é fundamental para reduzir o consumo de energia nos data centers, que representam uma parcela considerável do consumo de energia global. O objetivo não é apenas reduzir o consumo de energia na fase de treinamento, mas também na fase de inferência, o que possibilita o desenvolvimento de novos modelos para aplicações como previsão do tempo, descoberta de novos materiais e otimização da cadeia de suprimentos.
Jensen Huang também destaca que a IA generativa pode reduzir o consumo de energia na internet, pois permite a geração de conteúdo localmente, eliminando a necessidade de buscar dados em data centers distantes. A capacidade de gerar conteúdo localmente também abre caminho para a localização de data centers em regiões com energia sustentável, como desertos e áreas com fontes de energia renovável.
A NVIDIA acredita que a IA generativa tem o potencial de aumentar a produtividade, impulsionar a descoberta científica e tornar os processos mais eficientes. O futuro da IA generativa dependerá da capacidade de tornar essa tecnologia mais acessível e sustentável, com foco na otimização do uso de energia e no desenvolvimento de soluções para tornar a IA mais eficiente.