Apprentissage par Renforcement et Systèmes Distribués
Application à l’Apprentissage de la Marche d’un Robot Hexapode
Le but de ce travail est d’étudier et de proposer des techniques d’apprentissage par renforcement pour l’apprentissage de la marche d’un robot marcheur hexapode.
L’hypothèse sur laquelle repose ce travail est que des marches peuvent être obtenues lorsque la commande des mouvements est distribuée au niveau de chaque patte plutôt que d'être centralisée.
Une approche distribuée de l'apprentissage par renforcement de type Q-learning a été retenue dans laquelle les agents (les contrôleurs de mouvement) contribuant à une même tâche mènent leur propre apprentissage en tenant compte ou non de l'existence des autres agents.
Différentes simulations et tests on été menés avec pour objectif la génération de marches périodiques stables.
La marche apparaît comme un phénomène émergeant des mouvements individuels des pattes.
L'influence des paramètres d'apprentissage sur les marches obtenues est étudiée.
Sont aussi traités des problèmes de tolérances aux fautes et de manque d'information sur l'état du robot.
Enfin il est vérifié en simulation que, avec les algorithmes développés, le robot apprend à rattraper une trajectoire prédéfinie tout en contrôlant sa posture.
Youcef ZENNIR, Docteur en Automatique Industrielle, à l'Institut National des Sciences Appliquées (l'INSA) de Lyon, France, 2004.
Actuellement, Maître des conférences (HDR) au sein du département Pétrochimie et Génie des Procédés (Université de Skikda, Algérie), avec des activités de recherches au sein du Laboratoire d’Automatique de Skikda (LAS).
Fiche technique
- Auteur
- Youcef Zennir
- Langue
- Français
- Éditeur
- Éditions universitaires européennes
30 autres produits dans la même catégorie :
Voir toutLa place de la Télécommunication dans l'Economie malgache
- Nouveau
Etude et mise en place de la securité réseau
- Nouveau
Modélisation des Rotors et commande par retour d’état
- Nouveau
Pour un transport efficace et durable dans la ville de Kisangani/RDC
- Nouveau
La valorisation de déchets 'sachets en plastique' applicable à la localité Mutoto de la commune de Matete, Ville de Kinshasa
- Nouveau
Etude sur la securisation d'un systeme de communication VoIP / VPN
- Nouveau
Étude et modélisation diélectrique des matériaux composites
- Nouveau
Modélisation et contrôle robuste d’une éolienne à base de la MADA
- Nouveau
COMMUNES DE NOUAKCHOTT - MAURITANIE : ENTRE DESERT ET MARES LITTORALES
- Nouveau
Identification des Systèmes Non-linéaires. Structurés en Blocs
- Nouveau
Vers une Nouvelle Technologie Très Efficace de la Manutention
- Nouveau
Bruit acoustique dans l'association onduleur-machine à induction
- Nouveau