Ser pai de um 3
Os humanos são criaturas sociais e aprendem uns com os outros, mesmo desde tenra idade. Os bebês observam atentamente seus pais, irmãos ou cuidadores. Eles assistem, imitam e reproduzem o que veem para aprender habilidades e comportamentos.
A forma como os bebés aprendem e exploram o ambiente que os rodeia inspirou investigadores da Universidade Carnegie Mellon e da Meta AI a desenvolver uma nova forma de ensinar aos robôs como aprender simultaneamente múltiplas competências e aproveitá-las para enfrentar tarefas quotidianas invisíveis. Os pesquisadores decidiram desenvolver um agente robótico de IA com habilidades de manipulação equivalentes às de uma criança de 3 anos.
A equipe anunciou o RoboAgent, um agente de inteligência artificial que aproveita observações passivas e aprendizado ativo para permitir que um robô adquira habilidades de manipulação equivalentes às de uma criança pequena.
“O RoboAgent é um marco crítico em direção aos agentes robóticos gerais que aprendem eficientemente, são eficazes em situações novas e são capazes de expandir seus comportamentos ao longo do tempo”, disse Vikash Kumar, professor adjunto da Escola de Ciência da Computação(opens in new window) da Faculdade de Robótica Instituto(abre em nova janela). “Os robôs atuais são altamente especializados e treinados para tarefas individuais de forma isolada. Em contraste, pretendemos criar um único agente de inteligência artificial capaz de exibir uma ampla gama de habilidades em cenários invisíveis. O RoboAgent aprende como bebês humanos – aproveitando uma combinação de observações passivas abundantes e brincadeiras ativas limitadas.”
RoboAgent pode completar 12 habilidades de manipulação em diferentes cenas. Esta pesquisa aponta para uma plataforma de aprendizagem robótica adaptável a ambientes em mudança. Ao contrário de pesquisas anteriores, a equipe demonstrou seu trabalho em ambientes reais – não em simulação – e o fez com muito menos dados do que projetos anteriores.
“Os RoboAgents são capazes de desenvolver uma complexidade de habilidades muito mais rica do que outros alcançaram”, disse Abhinav Gupta(opens in new window), professor associado do Robotics Institute. “Mostramos uma maior diversidade de habilidades do que qualquer coisa já alcançada por um único agente robótico do mundo real com eficiência e uma escala de generalização para cenários invisíveis que é única.”
O agente da equipe aprende por meio de uma combinação de experiências próprias e observações passivas contidas em dados da Internet. Como um pai guiaria seu filho, os pesquisadores teleoperaram o robô através de tarefas para proporcionar-lhe experiências pessoais úteis.
“A eficácia e a eficiência da nossa abordagem decorrem da nossa nova arquitetura política que permite aos nossos agentes raciocinar mesmo com experiências limitadas”, disse Homanga Bharadwaj, Ph.D. estudante de robótica. “O RoboAgent atua em resposta a objetivos textuais/visuais específicos, prevendo e agregando decisões em termos de blocos temporais de movimentos, em vez de ações comumente usadas por passo de tempo.”
Os robôs aprendem principalmente com suas próprias experiências, e não com o que acontece passivamente ao seu redor. Esta cegueira inerente ao que se passa no seu ambiente limita fundamentalmente a diversidade de experiências a que os robôs estão expostos e as suas capacidades de adaptação a novas situações. Para superar essas limitações, o RoboAgent aprende com vídeos na internet – semelhante à forma como os bebês adquirem conhecimentos e comportamentos observando passivamente.seu entorno.
“O RoboAgent aproveita as informações contidas nesses vídeos para aprender previamente sobre como os humanos interagem com os objetos e usam várias habilidades para concluir tarefas com sucesso”, disse Mohit Sharma, Ph.D. estudante de robótica. “Além disso, observar habilidades semelhantes em vários cenários permite aprender o que é e o que não é necessário para concluir uma tarefa. Ele aproveita essas lições quando se depara com tarefas desconhecidas ou ambientes invisíveis.”
“Um agente capaz desse tipo de aprendizagem nos aproxima de um robô geral que pode completar uma variedade de tarefas em diversos ambientes invisíveis e evoluir continuamente à medida que reúne mais experiências”, disse Shubham Tulsiani(opens in new window), professor assistente no Instituto de Robótica. “O RoboAgent pode treinar rapidamente um robô usando dados limitados no domínio, ao mesmo tempo que depende principalmente de dados gratuitos abundantemente disponíveis na Internet para aprender uma variedade de tarefas. Isto poderia tornar os robôs mais úteis em ambientes não estruturados, como residências, hospitais e outros espaços públicos.”