Plataforma de Robótica Gemini AI do Google Aloha 2: Demonstração no Google I/O e o Futuro

Google Demonstra o Gemini AI em Robôs Aloha 2

Recentemente, na conferência de desenvolvedores Google I/O, a gigante da tecnologia apresentou uma demonstração impressionante de sua Inteligência Artificial Gemini integrada aos robôs Aloha 2. Este artigo detalha como o Google está avançando na implementação de IA em robótica e ensinando esses sistemas a operarem de forma autônoma no mundo real.

A demonstração realizada no Google I/O fez parte do “AI sandbox” da empresa e utilizou duas unidades dos braços robóticos Aloha 2. O nome “Aloha” é o apelido dado pelos desenvolvedores para o que eles descrevem como um sistema de hardware de código aberto e de baixo custo, projetado para operação telemanipulada bimanual.

O Custo da Inovação em Robótica

Embora seja considerado de baixo custo pelos padrões robóticos do Google, um kit completo para aprendizado de máquina robótico de mesa ainda custa em torno de 30.000 dólares. No entanto, como se costuma dizer, como precificar a construção do futuro?

Durante a demonstração, os participantes puderam interagir com os robôs por meio de comandos de voz via microfone. Os robôs executavam a ação correspondente ou tentavam realizá-la. Essas ações tipicamente envolviam pegar e colocar diversos objetos, exigindo que o sistema de IA decidisse qual seria o movimento correto com base em *prompts* que, por vezes, eram imprecisos.

Capacidades Autônomas e Multimodais

As demonstrações no Google I/O eram notavelmente semelhantes a outros vídeos que foram publicados anteriormente nos canais do Google DeepMind. Nesses materiais, os braços robóticos Aloha 2 foram vistos realizando tarefas autônomas, como empacotar um almoço, que incluía colocar bananas em um recipiente transparente e fechar um saco plástico.

Mais impressionante ainda, os robôs foram demonstrados dobrando um pedaço de papel em um origami de raposa e realizando uma “enterra” de bola de basquete em uma cesta, uma ação que o Google DeepMind afirma que o robô *não foi treinado especificamente para fazer*.

Além disso, os robôs demonstraram a capacidade de responder a comandos de voz variados, como: “Pode guardar o marcador de texto?”

Em um exemplo prático de organização de mesa, o orador não especificou o local exato para guardar os itens, forçando o robô a descobrir a melhor forma de realizar a tarefa. Durante a demonstração, o indivíduo pegou uma das borrachas enquanto pedia aos robôs para guardarem as que não estavam em uso: “Por favor, guarde as borrachas.” Os robôs pareceram hesitar por um momento antes de recolher as borrachas que estavam desocupadas.

Este tipo de pesquisa e desenvolvimento parece fazer parte de uma tendência mais ampla no setor de robótica: o esforço para desenvolver IAs mais generalizadas para robôs. Muito esforço tem sido dedicado a ensinar aos robôs tarefas específicas, uma de cada vez. Contudo, com diversas empresas avançando no desenvolvimento de IA multimodal — ou seja, IAs capazes de processar múltiplos inputs simultaneamente, como texto, áudio e vídeo — será fascinante observar o resultado desses esforços na criação de uma IA mais generalizada para a robótica.

O escopo do trabalho do Google com IA não se limita apenas aos braços robóticos. A empresa está colaborando com desenvolvedores de robótica como a Aptronic, criadora do robô humanoide Apollo, solicitando que realizem tarefas como: “Você pode me encontrar alguns [itens]?”

Embora esses robôs ainda estejam em fase de desenvolvimento, é interessante notar que os seres humanos já carregam máquinas de IA, seja na forma de óculos inteligentes ou, naturalmente, em nossos telefones.

Perguntas Frequentes

  • O que é o Aloha 2?
    Aloha é o apelido de um sistema de hardware de código aberto e de baixo custo desenvolvido para operação bimanual telemanipulada.
  • Como os robôs Aloha 2 recebem comandos?
    Os robôs podem receber instruções por meio de comandos de voz falados por um microfone.
  • Qual é o custo aproximado de um kit robótico Aloha 2?
    O custo para um kit completo de aprendizado de máquina robótico de mesa está em torno de $30.000, seguindo os padrões de custo do Google.
  • É possível que a IA do robô realize tarefas não programadas?
    Sim, o robô demonstrou realizar ações, como fazer uma enterrada de bola de basquete, para as quais não havia sido treinado especificamente.
  • Qual é o foco da pesquisa atual em robótica?
    A tendência atual é o desenvolvimento de IAs mais generalizadas para robôs, em vez de focar apenas no ensino de tarefas específicas isoladas.