banner
Centro de notícias
Pedidos personalizados são sempre incentivados

IA ajuda robôs a manipular objetos com o corpo inteiro

Jul 22, 2023

As imagens para download no site do MIT News office são disponibilizadas para entidades não comerciais, imprensa e público em geral sob uma licença Creative Commons Attribution Non-Commercial No Derivatives. Você não pode alterar as imagens fornecidas, a não ser recortá-las no tamanho certo. Uma linha de crédito deve ser utilizada na reprodução de imagens; se não for fornecido abaixo, credite as imagens ao "MIT".

Imagem anterior Próxima imagem

Imagine que você queira carregar uma caixa grande e pesada por um lance de escadas. Você pode abrir os dedos e levantar a caixa com as duas mãos, depois segurá-la sobre os antebraços e equilibrá-la contra o peito, usando todo o corpo para manipular a caixa.

Os humanos geralmente são bons na manipulação de todo o corpo, mas os robôs têm dificuldade em realizar essas tarefas. Para o robô, cada ponto onde a caixa pode tocar qualquer ponto dos dedos, braços e torso do transportador representa um evento de contato sobre o qual ele deve raciocinar. Com bilhões de possíveis eventos de contato, o planejamento dessa tarefa rapidamente se torna intratável.

Agora, os pesquisadores do MIT encontraram uma maneira de simplificar esse processo, conhecido como planejamento de manipulação rico em contatos. Eles usam uma técnica de IA chamada suavização, que resume muitos eventos de contato em um número menor de decisões, para permitir que até mesmo um algoritmo simples identifique rapidamente um plano de manipulação eficaz para o robô.

Embora ainda esteja em seus primórdios, esse método poderia potencialmente permitir que as fábricas usassem robôs móveis menores, capazes de manipular objetos com os braços ou corpos inteiros, em vez de grandes braços robóticos que só conseguem agarrar com a ponta dos dedos. Isso pode ajudar a reduzir o consumo de energia e reduzir custos. Além disso, essa técnica poderia ser útil em robôs enviados em missões de exploração a Marte ou outros corpos do sistema solar, já que poderiam se adaptar rapidamente ao ambiente utilizando apenas um computador de bordo.

“Em vez de pensar nisso como um sistema de caixa preta, se pudermos aproveitar a estrutura desses tipos de sistemas robóticos usando modelos, haverá uma oportunidade de acelerar todo o procedimento de tentativa de tomar essas decisões e chegar a soluções ricas em contato. planos”, diz HJ Terry Suh, estudante de graduação em engenharia elétrica e ciência da computação (EECS) e coautor principal de um artigo sobre essa técnica.

Juntando-se a Suh no artigo estão o coautor principal Tao Pang PhD '23, roboticista do Boston Dynamics AI Institute; Lujie Yang, estudante de pós-graduação do EECS; e o autor sênior Russ Tedrake, Professor Toyota de EECS, Aeronáutica e Astronáutica e Engenharia Mecânica, e membro do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL). A pesquisa aparece esta semana no IEEE Transactions on Robotics.

Aprendendo sobre aprender

O aprendizado por reforço é uma técnica de aprendizado de máquina em que um agente, como um robô, aprende a concluir uma tarefa por tentativa e erro, com uma recompensa por se aproximar de uma meta. Os pesquisadores dizem que esse tipo de aprendizagem adota uma abordagem de caixa preta porque o sistema deve aprender tudo sobre o mundo por meio de tentativa e erro.

Tem sido utilizado de forma eficaz para planejamento de manipulação rica em contato, onde o robô busca aprender a melhor maneira de mover um objeto de uma maneira específica.

Mas como podem existir milhares de milhões de pontos de contacto potenciais sobre os quais um robô deve raciocinar ao determinar como usar os dedos, as mãos, os braços e o corpo para interagir com um objeto, esta abordagem de tentativa e erro requer uma grande quantidade de computação.

“A aprendizagem por reforço pode precisar passar milhões de anos em tempo de simulação para realmente ser capaz de aprender uma política”, acrescenta Suh.

Por outro lado, se os investigadores conceberem especificamente um modelo baseado na física, utilizando o seu conhecimento do sistema e da tarefa que pretendem que o robô realize, esse modelo incorpora uma estrutura sobre este mundo que o torna mais eficiente.