Nvidia GTC 2025 Keynote: Tudo Anunciado em 16 Minutos

Avanços em Inteligência Artificial e Computação de Ponta

Este artigo aborda os recentes avanços e inovações em inteligência artificial (IA), computação gráfica e robótica, detalhando as novas arquiteturas de hardware e os desenvolvimentos de software que estão moldando o futuro da tecnologia.

Inovações em Computação Gráfica com a Geração GeForce

A jornada começou com a linha GeForce, que impulsionou a computação gráfica por 25 anos. Atualmente, a geração GeForce RTX 4090 representa um salto significativo em relação à geração anterior (RTX 3090), sendo 30% menor em volume e 30% mais eficiente na dissipação de energia, oferecendo um desempenho notavelmente superior.

Este avanço é diretamente atribuível à **Inteligência Artificial**. A introdução do CUDA permitiu o desenvolvimento da IA, que agora retorna para revolucionar os gráficos computacionais. O que se observa é computação gráfica em tempo real com *path tracing* total para cada pixel renderizado. A IA é responsável por prever os 15 pixels restantes para cada pixel matematicamente renderizado. Isso é feito com tamanha precisão que a imagem permanece visualmente correta e, crucialmente, **temporariamente estável** — mantendo a coerência da imagem ao longo dos quadros, tanto para frente quanto para trás.

Parceria Estratégica com a GM

Foi anunciado que a General Motors (GM) selecionou a Nvidia como parceira para desenvolver o futuro de seus veículos autônomos. Este é um passo fundamental para a chegada dos veículos autônomos.

A parceria visa integrar a IA da Nvidia em três áreas centrais da GM:
1. **IA para Manufatura:** Revolucionando os processos de fabricação.
2. **IA para Empresas (Enterprise):** Transformando a maneira como a GM trabalha, projeta e simula carros.
3. **IA no Carro:** Construindo a infraestrutura de IA diretamente embarcada nos veículos.

Foco na Segurança Automotiva (Halos Safety)

Uma área de grande orgulho e que merece atenção é a segurança automotiva, conhecida internamente como “Halos Safety”. Garantir a segurança requer uma integração profunda de tecnologia, que abrange desde o silício até os sistemas e o software de sistema, incluindo algoritmos e metodologias.

Filosofias como **diversidade, monitoramento de diversidade e transparência e explicabilidade** devem estar profundamente enraizadas em cada etapa do desenvolvimento do sistema e do software. A empresa se orgulha de ser a primeira a ter cada linha de código – 7 milhões de linhas de código avaliadas – de seu chip, sistema e algoritmos de segurança avaliadas por terceiros. Estes avaliadores analisam cada linha para garantir que o design incorpore diversidade, transparência e explicabilidade.

Arquitetura de Supercomputação Blackwell

O Blackwell está em produção total, e sua estrutura representa uma transição fundamental na arquitetura de computação. A abordagem anterior utilizava o sistema HGX, que consistia em oito GPUs, cada uma consideravelmente maior, conectadas via NVLink. Este sistema se conectava a um *shelf* com CPUs duplas, utilizando PCI Express para comunicação, e múltiplos *shelves* eram interligados por Infiniband para formar um supercomputador de IA.

A nova arquitetura **desagrega** o sistema NVLink. O componente central agora é o **NVLink Switch**, considerado o *switch* de maior desempenho já criado no mundo. Isso possibilita que cada GPU se comunique com todas as outras GPUs simultaneamente e com largura de banda total.

Nesta nova arquitetura:
* O *switch* NVLink fica no centro do chassi.
* Existem 18 *switches* em nove *trays* de *switch*.
* O poder computacional (compute) é comprimido em um único *rack*.
* Este sistema é totalmente **resfriado a líquido**, permitindo a compressão de múltiplos nós de computação em um único *rack*.

Esta mudança – de NVLink integrado para desagregrado, e de resfriamento a ar para líquido – é uma transformação na indústria. O resultado é um computador de **um ExaFLOPS em um único *rack***.

Em termos de desempenho, a máquina alcança:
* Memória com largura de banda de **570 Terabytes por segundo**.
* Tudo na máquina opera em termos de trilhões (T’s).
* Um ExaFLOPS equivale a um milhão de trilhões de operações de ponto flutuante por segundo.

NVIDIA DGX Cloud e Dynamo

Foi anunciado o **NVIDIA Dynamo**, que é essencialmente o sistema operacional de uma Fábrica de IA (*AI Factory*).

No passado, em data centers, o sistema operacional era algo como o VMware, orquestrando diversas aplicações *Enterprise* rodando sobre a infraestrutura *Enterprise*. No futuro, a aplicação principal serão os **agentes**, e o sistema operacional será o Dynamo, rodando sobre uma **Fábrica de IA** ao invés de um data center tradicional.

O nome Dynamo é uma homenagem ao instrumento que iniciou a última Revolução Industrial, que transformava água em energia elétrica utilizável. O software NVIDIA Dynamo é descrito como incrivelmente complexo e representa como um PC deve ser na era da IA: com **20 PetaFLOPS**, 72 núcleos de CPU, interface *chip-to-chip*, memória HBM e slots PCI Express para placas GeForce.

Os produtos **DGX Station** e **DGX Spark** estarão disponíveis através de OEMs como HP, Dell, Lenovo e Asus, sendo voltados para cientistas de dados e pesquisadores.

Robótica e Omniverse

A robótica está avançando significativamente. Há uma escassez global projetada de 50 milhões de trabalhadores humanos até o final da década. A expectativa é que seja necessário pagar robôs US$ 50.000 por ano para que trabalhem, tornando este um setor industrial muito grande.

Para isso, foi criado o **Omniverse**, o sistema operacional para IA física. Duas novas tecnologias foram integradas ao Omniverse:

1. **Cosmos:** Um modelo generativo que entende o mundo físico. Usando o Omniverse para condicionar o Cosmos, é possível gerar um número infinito de ambientes, criando dados controlados por nós, mas sistematicamente infinitos. Isso permite controlar robôs em cenários complexos com perfeição.
2. **Aprendizado por Reforço com Recompensas Verificáveis:** A recompensa verificável na robótica são as **leis da física**. Para treinar modelos de IA rapidamente, é necessário um *motor de física* acelerado por GPU, capaz de operar em tempo real super-linear (*super real time*). Este motor deve ser especializado para corpos rígidos e moles em grão fino, treinar feedback tátil e habilidades motoras finas, e ser compatível com o framework **Moko**, usado por roboticistas globalmente.

Como resultado dessa parceria entre DeepMind, Disney Research e Nvidia, foi anunciado o **Newton**, um motor de física avançado. A demonstração com o robô “Blue” ilustrou a simulação completa em tempo real, incluindo feedback tátil e simulação de corpos rígidos e moles.

Por fim, foi anunciado que o **Groot N1** se torna *open source*.

Perguntas Frequentes

  • O que é o NVLink Switch e qual sua importância?
    O NVLink Switch é o *switch* de maior desempenho já criado, permitindo que todas as GPUs em um sistema de computação falem entre si simultaneamente e com largura de banda total, sendo crucial para a arquitetura desagregada Blackwell.
  • Como a IA melhora o desempenho gráfico em tempo real?
    A IA prevê os pixels não renderizados matematicamente (15 de 16 por pixel) com alta precisão, garantindo que a imagem renderizada com *path tracing* total permaneça visualmente correta e temporariamente estável ao longo dos quadros.
  • O que é o NVIDIA Dynamo?
    Dynamo é o sistema operacional para uma Fábrica de IA (*AI Factory*), projetado para orquestrar agentes de IA, substituindo sistemas operacionais tradicionais como o VMware em data centers.
  • Por que o resfriamento a líquido é fundamental na arquitetura Blackwell?
    O resfriamento a líquido permite que os nós de computação, que são extremamente potentes, sejam comprimidos em um único *rack* (atingindo um ExaFLOPS), o que seria inviável com resfriamento a ar.
  • Qual o objetivo principal do motor de física Newton?
    Newton visa fornecer recompensas verificáveis baseadas nas leis da física para treinar modelos de IA em robótica, permitindo simulações extremamente rápidas e precisas de corpos rígidos, moles e feedback tátil.