Publiée 4 juillet 2026
Thèse CIFRE - Robotique IA
Michelin
Clermont-Ferrand, Auvergne-Rhône-Alpes 63000, France
CDI
Thèse CIFRE - Robotique IA
- - - - - - - - - - - -
Dualité Modèle de Monde - Renforcement : Vers une Robotique par Imitation Frugale en Boucle Fermée
L'automatisation robotique des tâches de manipulation en environnements non structurés constitue l'un des défis majeurs de l'alliance entre la robotique et l'intelligence artificielle. Alors que la robotique industrielle maîtrise la manipulation d'objets rigides aux géométries prédéfinies, le déploiement de systèmes autonomes face à des matériaux complexes, déformables ou adhésifs comme des élastomères, des poudres, ou des milieux granulaires confinés, reste un problème largement ouvert. Les approches de commande classiques, fondées sur la modélisation analytique de la physique des contacts et des déformations, se heurtent à la grande dimensionnalité et à la non-linéarité de ces milieux.
Le présent projet de thèse propose de lever ces verrous par la formulation d'une architecture hybride originale, combinant un modèle de monde (World Model) génératif par diffusion sur espace latent et un contrôle réactif en boucle fermée. L'approche repose sur un apprentissage conjoint exploitant la simulation physique et des données d'imitation réelles.
L'un des objectifs théoriques centraux de la thèse sera de formaliser mathématiquement ce cadre global et de le confronter au formalisme de l'apprentissage par renforcement basé sur les modèles (RL-model based). Nous chercherons à démontrer comment cette architecture se comporte comme un RL model-based implicite guidé par l'imitation, où le modèle de diffusion incarne la fonction de transition d'état, et où la boucle fermée par surrogate remplit le rôle. correctif classiquement dévolu à un estimateur de valeur ou à un calcul d'erreur de différence temporelle, s'affranchissant ainsi du besoin d'une fonction de récompense scalaire explicite.
La validation des développements théoriques s'appuiera sur la manipulation d'objets déformables et visqueux à l'aide d'un système robotique bi-bras. Les scénarios d'évaluation incluront la saisie et la mise en forme de sacs contenant des poudres ou des billes (à concentrations et propriétés de friction variables) ainsi que la manipulation d'élastomères. Les bases d'apprentissage seront réalisées principalement par simulation, avec quelques jeux d'apprentissage tirés de manipulations réelles.
- - - - - - - - - - - -
Michelin, entreprise engagée dans la mobilité durable et reconnue pour ses actions en faveur de l'expérience employé !
Pour en savoir plus sur le Groupe :https://recrutement.michelin.fr
- - - - - - - - - - - -
- - - - - - - - - - - -
Dualité Modèle de Monde - Renforcement : Vers une Robotique par Imitation Frugale en Boucle Fermée
L'automatisation robotique des tâches de manipulation en environnements non structurés constitue l'un des défis majeurs de l'alliance entre la robotique et l'intelligence artificielle. Alors que la robotique industrielle maîtrise la manipulation d'objets rigides aux géométries prédéfinies, le déploiement de systèmes autonomes face à des matériaux complexes, déformables ou adhésifs comme des élastomères, des poudres, ou des milieux granulaires confinés, reste un problème largement ouvert. Les approches de commande classiques, fondées sur la modélisation analytique de la physique des contacts et des déformations, se heurtent à la grande dimensionnalité et à la non-linéarité de ces milieux.
Le présent projet de thèse propose de lever ces verrous par la formulation d'une architecture hybride originale, combinant un modèle de monde (World Model) génératif par diffusion sur espace latent et un contrôle réactif en boucle fermée. L'approche repose sur un apprentissage conjoint exploitant la simulation physique et des données d'imitation réelles.
L'un des objectifs théoriques centraux de la thèse sera de formaliser mathématiquement ce cadre global et de le confronter au formalisme de l'apprentissage par renforcement basé sur les modèles (RL-model based). Nous chercherons à démontrer comment cette architecture se comporte comme un RL model-based implicite guidé par l'imitation, où le modèle de diffusion incarne la fonction de transition d'état, et où la boucle fermée par surrogate remplit le rôle. correctif classiquement dévolu à un estimateur de valeur ou à un calcul d'erreur de différence temporelle, s'affranchissant ainsi du besoin d'une fonction de récompense scalaire explicite.
La validation des développements théoriques s'appuiera sur la manipulation d'objets déformables et visqueux à l'aide d'un système robotique bi-bras. Les scénarios d'évaluation incluront la saisie et la mise en forme de sacs contenant des poudres ou des billes (à concentrations et propriétés de friction variables) ainsi que la manipulation d'élastomères. Les bases d'apprentissage seront réalisées principalement par simulation, avec quelques jeux d'apprentissage tirés de manipulations réelles.
- - - - - - - - - - - -
Michelin, entreprise engagée dans la mobilité durable et reconnue pour ses actions en faveur de l'expérience employé !
- Une note de 99/100 à l'index de l'égalité femmes-hommes
- Entreprise « Handi accueillante », avec un réseau de référents et ambassadeurs Handicap pour vous accompagner
- 83,5% de taux d'engagement de nos employés
- 94,6% des stagiaires et alternants nous recommandent, label "Happy Trainees" depuis 9 années consécutives
- Classé parmi les groupes du CAC 40 les plus engagés selon les Bac+5 à l'index RSE Universum 2023
- Parmi les 100 entreprises les plus attractives pour les étudiants et actifs BAC+2/3 au classement Universum 2023
- N°1 des entreprises de plus de 500 stagiaires et alternants qui rémunèrent le mieux au Classement HappyTrainees® Rémunération 2023
- Dans le Top 10 des meilleurs employeurs en France au classement Glassdoor 2023
- Dans le top 3 des entreprises du secteur « Automobile / Equipementier » en matière d'attractivité employeur à l'édition 2024 du Palmarès @EPOKA @GROUPE IFOP @Occurrence
Pour en savoir plus sur le Groupe :https://recrutement.michelin.fr
- - - - - - - - - - - -