Pesquisadores do MIT ajudam robôs a usar todo o corpo para manipular objetos
Por Brianna Wessling | 29 de agosto de 2023
Um robô tentando usar as mãos inteiras para girar uma caçamba 180º. | Fonte: MIT
Uma equipe de pesquisa do MIT desenvolveu uma técnica de IA que permite aos robôs manipular objetos com toda a mão ou corpo, em vez de apenas com a ponta dos dedos.
Quando uma pessoa pega uma caixa, ela normalmente usa as mãos inteiras para levantá-la e, em seguida, os antebraços e o peito para mantê-la firme enquanto a move para outro lugar. Esse tipo de manipulação é a manipulação de todo o corpo e é algo contra o qual os robôs lutam.
Para os robôs, cada ponto onde a caixa pode tocar qualquer ponto dos dedos, braços e torso é um evento de contato sobre o qual o robô precisa raciocinar. Isso deixa os robôs com bilhões de eventos de contato potenciais, tornando extremamente complicado o planejamento de tarefas que exigem todo o corpo. Este processo de um robô tentando aprender a melhor maneira de mover um objeto é chamado de planejamento de manipulação rico em contato.
No entanto, os pesquisadores do MIT encontraram uma maneira de simplificar esse processo usando uma técnica de IA chamada suavização e um algoritmo construído pela equipe. A suavização resume muitos eventos de contato em um número menor de decisões, eliminando eventos que não são importantes para a tarefa e restringindo as coisas a um número menor de decisões. Isso permite que até mesmo um algoritmo simples elabore rapidamente um plano de manipulação eficaz.
Muitos robôs aprendem a manusear objetos por meio do aprendizado por reforço, uma técnica de aprendizado de máquina em que um agente usa tentativa e erro para aprender como concluir uma tarefa em troca de uma recompensa. Através deste tipo de aprendizagem, um sistema tem que aprender tudo sobre o mundo através de tentativa e erro.
Com bilhões de pontos de contato para testar, o aprendizado por reforço pode exigir muita computação, o que o torna uma escolha não ideal para o planejamento de manipulação rico em contatos, embora possa ser eficaz com tempo suficiente.
A aprendizagem por reforço, no entanto, realiza o processo de suavização, tentando diferentes pontos de contato e calculando uma média ponderada dos resultados, que é o que ajuda a torná-la tão eficaz no ensino de robôs.
A equipe de pesquisa do MIT baseou-se nesse conhecimento para construir um modelo simples que realiza esse tipo de pesquisa, permitindo que o sistema se concentre nas interações principais do robô-objeto e preveja o comportamento a longo prazo.
A equipe então combinou seu modelo com um algoritmo que pode pesquisar rapidamente todas as decisões possíveis que um robô pode tomar. Entre o modelo de suavização e o algoritmo, a equipe criou um sistema que só precisava de cerca de um minuto de tempo de computação em um laptop padrão.
Embora este projeto ainda esteja em seus estágios iniciais, este método poderia ser usado para permitir que as fábricas implantassem robôs móveis menores que usam seus corpos inteiros para manipular objetos, em vez de grandes braços robóticos que apenas os seguram com as pontas dos dedos.
Embora o modelo tenha mostrado resultados promissores quando testado em simulação, ele não consegue lidar com movimentos muito dinâmicos, como queda de objetos. Esta é uma das questões que a equipe espera continuar a abordar em pesquisas futuras.
A pesquisa das equipes foi financiada, em parte, pela Amazon, pelo Laboratório Lincoln do MIT, pela National Science Foundation e pelo Grupo Ocado. A equipe incluiu HJ Terry Suh, estudante de graduação em engenharia elétrica e ciência da computação (EECS) e co-autor principal do artigo, sendo o co-autor principal Tao Pang Ph.D. '23, roboticista do Boston Dynamics AI Institute; Lujie Yang, estudante de pós-graduação do EECS; e o autor sênior Russ Tedrake, Professor Toyota de EECS, Aeronáutica e Astronáutica e Engenharia Mecânica, e membro do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL).