Passer au contenu principal
Publiée 20 juin 2026

Data Scientist Junior H/F

Banque de France
Paris, Île-de-France 75000, France CDI

Type de recrutement :
Stage

Domaine de compétences :
Donnée

Ville :
Paris

Département :
Paris

Description du poste:

Au sein de la Direction Générale du Système d'Information (DGSI), la Direction des Données et des Services Analytiques (DDSA), est en charge, en soutien aux métiers, d'offrir un ensemble de prestations et d'outils favorisant les initiatives d'innovation, le partage, l'exploitation et la valorisation des données.
La DDSA est partie prenante de l'action stratégique sur l'intelligence artificielle engagée par la Banque de France, regroupant également des expertises métiers, réglementaires, informatiques pour intégrer les solutions d'intelligence artificielle (IA) dans le Système d'Information de l'entreprise. Le stage s'inscrira dans ce contexte.

Ce stage vise à étudier si les grands modèles de langage (LLM) développent des biais lorsqu'ils sont entraînés sur des corpus de textes américains plutôt que sur des corpus français ou européens. L'idée est de vérifier si les données d'entraînement influencent la manière dont les modèles interprètent les communications des banques centrales.

Pour cela, le projet vise à comparer la capacité de différents LLM à classifier les annonces des banques centrales selon leur orientation monétaire (« hawkish » ou restrictive, versus « dovish » ou accommodante), en se basant sur une échelle de référence validée par des experts humains. Les modèles entraînés sur les textes de la Réserve fédérale américaine (Fed) seront testés sur les communications de la BCE et de la Banque de France, et inversement. Pour tester les biais en matière de stabilité financière, le même exercice sera réalisé sur les données des banques commerciales américaines, européennes et françaises.

L'objectif est de distinguer deux phénomènes : la performance du modèle (écart par rapport au jugement humain) et le biais éventuel (tendance systématique à juger les textes comme plus restrictifs ou plus accommodants). Si un biais apparaît après l'entraînement spécialisé mais pas dans le modèle de base, il pourra être attribué au corpus utilisé pour l'apprentissage.

Cette recherche permettra de mieux comprendre dans quelle mesure les données d'entraînement influencent les analyses produites par les LLM et d'identifier les précautions méthodologiques nécessaires pour leur utilisation future dans l'analyse économique et monétaire.

Profil recherché:

Formation recherchée :
• Vous êtes diplômé récent d'une formation supérieure en métier de la donnée ou informatique (Ingénieur ou formation universitaire) avec un goût pour l'économie (une double formation serait un plus)
• Votre cursus scolaire vous a permis de maîtriser les fondements mathématiques et statistiques des techniques science des données et IA et vous avez mis en pratique vos connaissances au travers de projets étudiants et/ou de stages.

Compétences :
• Prérequis : connaissance en Deep Learning et NLP avec une première expérience dans l'utilisation de modèles de type LLM
• Maitrise de la programmation avancée en R ou Python
• Aptitude à vulgariser une information complexe aussi bien à l'écrit qu'à l'oral, bonnes capacités rédactionnelles et de communication

Qualités :
• Esprit méthodique et rigueur d'analyse.
• Force de proposition, agilité, autonomie.
• Curiosité et créativité
• Goût du travail en équipe

Stage de 2 mois à pouvoir dès que possible

La Banque de France est une institution socialement responsable, attachée au respect de la diversité sous toutes ses formes, à la lutte contre les discriminations, à favoriser la parité Femme/Homme et à garantir un environnement de travail de qualité.

Des aménagements de poste peuvent être organisés pour tenir compte des handicaps des personnes recrutées.

Contactez nos ambassadeurs Myjobglasses

S’inscrire aux alertes d’offres d’emploi