Como um vídeo seu dobrando roupa pode ajudar a treinar os robôs do futuro

Robôs aprendem a realizar tarefas com base em ações humanas, incluindo movimentos em atividades domésticas

A próxima grande fronteira da inteligência artificial pode estar mais próxima do nosso dia a dia do que imaginamos, começando com tarefas simples, como dobrar roupas. Empresas de tecnologia e pesquisadores estão apostando na coleta massiva de vídeos de atividades cotidianas para treinar robôs capazes de realizar essas tarefas de forma autônoma.

Entre as empresas envolvidas está a DoorDash, famosa pelo seu serviço de entrega de alimentos, que agora está investindo na criação de dados para a robótica. A empresa está recrutando pessoas de diferentes partes do mundo para gravar vídeos enquanto realizam tarefas domésticas, como organizar roupas ou lavar pratos. Em alguns casos, os participantes usam smartphones fixados na cabeça para capturar com precisão os movimentos das mãos, dedos e olhares. De acordo com o The Washington Post, os pagamentos podem chegar até US$ 25 por hora.

Esses vídeos são usados em um processo que visa transformar habilidades humanas em comandos que as máquinas possam entender e executar:

  • Primeiro, os dados são analisados para identificar padrões de movimento;
  • Em seguida, modelos de aprendizado de máquina tentam prever quais ações devem ser executadas em cada etapa de uma tarefa;
  • Por fim, essas instruções são transferidas para robôs, que passam a tentar reproduzir os movimentos de forma independente.

A lógica por trás dessa estratégia segue o conceito conhecido como “leis de escalabilidade”: quanto maior o volume de dados disponíveis, melhor tende a ser o desempenho dos sistemas de IA. Esse princípio já foi fundamental para os avanços em chatbots e na geração de imagens, e agora começa a ser adaptado para a robótica.

Alternativas no treinamento de robôs
No entanto, ao contrário do que acontece com textos e imagens, não há um grande repositório público de dados disponíveis para treinar robôs. Isso torna o processo mais complexo e dispendioso.

Uma alternativa tradicional é a chamada teleoperação, na qual seres humanos controlam robôs manualmente para gerar dados mais precisos. Embora esse método produza informações de alta qualidade, ele é demorado e caro.

Diante desse desafio, pesquisadores estão explorando modelos híbridos. A proposta é utilizar grandes volumes de vídeos de humanos para ensinar conceitos básicos às máquinas e, em seguida, complementar esse aprendizado com uma quantidade menor de dados mais avançados, que são obtidos por meio de teleoperação.

Outras abordagens também estão em teste:

  • Algumas iniciativas buscam adaptar ferramentas para facilitar a captura de movimentos humanos, como dispositivos que simulam garras robóticas;
  • Há ainda projetos que tentam aproximar o design dos robôs da anatomia humana, com o objetivo de tornar a transferência de habilidades mais direta;
  • Outra frente aposta em ambientes virtuais, permitindo que robôs “treinem” em simulações antes de operar no mundo real.

Apesar dos avanços, a implementação prática em grande escala ainda é incerta. Especialistas indicam que os dados mais valiosos virão quando os próprios robôs começarem a atuar em ambientes reais, aprendendo diretamente com a experiência.

No entanto, de acordo com Ken Goldberg, especialista em robótica consultado pelo WP, o tempo para isso acontecer ainda é imprevisível. “Talvez em dois anos, três, cinco, dez, vinte”, disse. “Ou mais.”

Fonte: Olhar Digital

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *