Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas

5 de junho de 2023

Este artigo foi revisado de acordo com o processo editorial e as políticas da Science X. Os editores destacaram os seguintes atributos, garantindo a credibilidade do conteúdo:

verificado

revisar

por Cactus Communications

Aprender com os erros do passado não se limita aos humanos. Os computadores também o fazem. Nas indústrias, isso é feito por meio de sistemas de controle baseados em computador que ajudam a operar os sistemas de produção. Para robôs industriais que executam tarefas específicas em lotes, digamos, produção de roupas, chips de computador ou produtos de panificação, a técnica de controle mais comumente usada é o controle de aprendizado iterativo (ILC). A maioria das indústrias ainda depende de sistemas ILC que usam uma estratégia de aprendizado chamada regra de atualização de tipo proporcional (PTUR). Essa técnica melhora o desempenho dos sistemas ILC repetindo a mesma tarefa repetidamente e atualizando sua entrada de controle com base nos erros encontrados nas iterações anteriores.

No entanto, essa metodologia de controle foi proposta décadas atrás. E como os sistemas ILC estão sendo cada vez mais adotados para a execução de tarefas mais complexas, há a necessidade de técnicas que possam aprender mais rápido e com maior precisão.

Em uma descoberta recente, um grupo de cientistas propôs uma nova técnica que usa a regra de atualização de potência fracionada (FPUR) para melhorar o potencial de desempenho de sistemas ILC lineares de entrada única e saída única. O estudo foi publicado no IEEE/CAA Journal of Automatica Sinica.

As taxas de convergência - as taxas nas quais a diferença entre a saída desejada e a saída real diminui ao longo do tempo - desempenham um papel crucial na definição da eficiência de um sistema ILC. Os métodos existentes para melhorar a taxa de convergência geralmente se mostram insatisfatórios em situações que exigem alta precisão. Mesmo no caso de ganhos de aprendizado constantes ou selecionados manualmente, os sistemas ILC atuais que usam o método de atualização linear não conseguem explorar ao máximo as informações disponíveis. Portanto, os cientistas investigaram abordagens além do PTUR, que utilizavam métodos de atualização não linear para aprender e alcançar a saída desejada.

“O PTUR tradicional usa um termo linear para o erro de rastreamento para atualizar a entrada de controle. Por outro lado, o FPUR usa um termo fracionário para atualização. é maior que o PTUR para pequenos erros de rastreamento, levando a uma taxa de convergência mais rápida", explica Zihan Li, principal autor do estudo e aluno de mestrado na Escola de Matemática da Universidade Renmin da China.

A equipe desenvolveu um novo método FPUR inspirado nas estratégias mais recentes de controle de tempo finito (FTC) e controle de modo deslizante terminal (TSMC), que são técnicas potenciais para superar os problemas mencionados anteriormente e melhorar a velocidade de convergência. Os cientistas também adotaram uma abordagem de mapeamento não linear para explorar a dinâmica do erro ao longo do tempo. Essa abordagem permitiu relatar o desempenho de convergência rápida e caracterizar possíveis ciclos de limite de erros de rastreamento em sistemas ILC. Além disso, simulações numéricas também foram realizadas para validar a eficácia do novo método.

blog

Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas