Modelos de Treinamento de IA Física da Nvidia para Robôs Humanoides

O Futuro da Robótica: IA Física e a Nova Plataforma Newton

Durante o evento NVIDIA GTC, a atenção se voltou para um conjunto de tecnologias projetadas para capacitar robôs a aprenderem e operarem no mundo físico. Um conceito frequentemente repetido no evento foi o de IA Física, que permite que robôs atuem de maneira eficaz no ambiente real.

Para avançar nesse campo, a Nvidia lançou o Isaac Groot N1, um modelo de fundação de código aberto. Este modelo já vem pré-treinado com os conceitos básicos e é estruturado em dois sistemas: um rápido para a execução de ações e outro lento para o planejamento dessas ações.

Ensinando Novas Tarefas: O Papel dos Dados Sintéticos

O próximo desafio na robótica é ensinar aos robôs novas tarefas, o que exige um conjunto de dados grande e variado. Isso é crucial especialmente quando o robô precisa executar a tarefa aprendida sob diversas condições ambientais.

Uma das abordagens discutidas envolve o uso do Teley para o treinamento de políticas, como a ação de soltar um objeto. Esse processo pode envolver demonstrações humanas, registradas, por exemplo, através de um *headset*. Em seguida, essas demonstrações são escaladas utilizando dados sintéticos.

A Tríade da Geração de Dados: Omniverse, Cosmos e Isaac Groot N1

A criação desses dados sintéticos pode ser facilitada por um ecossistema de ferramentas da Nvidia:

* Nvidia Omniverse: Funciona como uma plataforma que unifica dados de diversas fontes para construir “gêmeos digitais” (*digital twins*) que são fisicamente precisos.
* Cosmos: É uma ferramenta essencial que recebe os dados do Omniverse. Sua importância reside em permitir não apenas a ampliação dos dados para obter fotorrealismo (reduzindo a lacuna entre simulação e realidade), mas também na criação de um volume exponencialmente grande de dados. É possível ir de algumas milhares de imagens para um milhão ou mais.

Essa diversidade de dados é fundamental, pois permite que o modelo seja treinado de maneira mais robusta, promovendo a generalização das capacidades e comportamentos aprendidos. O objetivo é migrar de treinamentos focados em tarefas específicas para um conjunto mais amplo de habilidades.

Newton: Um Novo Motor de Física em Colaboração

A criação de dados sintéticos que sejam o mais aplicáveis possível ao mundo real exige uma representação detalhada das leis da física. Para isso, foi anunciada uma parceria significativa entre DeepMind, Disney Research e Nvidia, resultando no projeto Newton.

Assim como o Isaac Groot N1, o Newton também é código aberto. A abertura do projeto visa permitir que os desenvolvedores não apenas utilizem o trabalho desenvolvido pelas empresas parceiras, mas que também possam contribuir ativamente para a melhoria da ferramenta.

A Crise da Mão de Obra e a Solução Robótica

O contexto por trás do avanço em robôs humanoides é a crescente preocupação com a escassez de mão de obra em escala global. Estima-se que, até o final desta década, o mundo poderá ter uma carência de pelo menos 50 milhões de trabalhadores.

Em uma perspectiva humorística sobre o custo de suprir essa demanda, foi mencionado que, se fosse necessário pagar 50.000 dólares por ano para atrair trabalhadores humanos, seria provável que robôs também precisassem desse valor para “vir trabalhar”.

Sobre o modelo de custo, uma clarificação posterior indicou que a abordagem é mais parecida com a assinatura de serviços de direção autônoma para veículos: o cliente adquire o robô (o hardware) e, subsequentemente, paga pelos serviços que deseja ativar sobre ele.

Perguntas Frequentes

  • O que é IA Física?
    É o tipo de Inteligência Artificial que capacita robôs a operarem de forma eficaz no mundo físico.
  • Como o Isaac Groot N1 estrutura o treinamento de um robô?
    Ele utiliza um sistema rápido para a execução de ações e um sistema lento para o planejamento dessas ações.
  • Qual a função do Nvidia Omniverse no treinamento de robôs?
    Ele funciona como uma plataforma para unificar dados de diferentes fontes e construir um gêmeo digital fisicamente preciso do ambiente ou do robô.
  • Por que o Newton é de código aberto?
    Para que os desenvolvedores possam utilizar o trabalho colaborativo e também contribuir com melhorias para o projeto.
  • Qual a relação entre Cosmos e a redução da lacuna simulação-realidade?
    O Cosmos permite a ampliação dos dados gerados para fotorrealismo, ajudando a diminuir a diferença entre os resultados da simulação e o desempenho no mundo real.