Publiée 25 juin 2026
Data Scientist - Valorisation des données de santé pour la recherche épidémiologique F/H
AP-HP Assistance publique Hopitaux de Paris
Paris, Île-de-France 75000, France
CDI
Description du poste
Métier
Autres métiers - Autres métiers
Intitulé du poste
Data Scientist - Valorisation des données de santé pour la recherche épidémiologique F/H
Type de contrat
CDD uniquement
Télétravail
Oui
Présentation du service
Le centre de pharmaco-épidémiologie de l'Assistance Publique-Hôpitaux de Paris (CEPHEPI)
Le CEPHEPI est une structure transversale de l'AP-HP dont l'objectif est d'évaluer les médicaments et dispositifs médicaux en vie réelle (c'est-à-dire après l'obtention de l'AMM ou du marquage CE), avec le plus haut niveau de qualité méthodologique.
Localisé sur le site de la Pitié-Salpêtrière, le CEPHEPI collabore avec des porteurs de projets de l'ensemble de l'AP-HP et de toutes disciplines médicales confondues, et des partenaires industriels pour répondre à des objectifs de santé publique.
Le CEPHEPI travaille en liens étroits avec le Département de Santé Publique et l'Unité
de Recherche Clinique de la Pitié-Salpêtrière ainsi qu'avec l'équipe PEPITES de
l'Institut Pierre Louis de Santé Publique (IPLESP, UMR-S 1136) à Sorbonne Université. https://pitiesalpetriere.aphp.fr/centre-pharmacoepidemiologie-cephepi/
Le Centre de Référence des Maladies Auto-immunes et Auto-inflammatoires
Systémiques Rares de l'adulte - CUMULUSS
Le CUMULUSS, rattaché au service de Dermatologie de l'hôpital Tenon, est coordonné par le Pr François CHASSET. Le centre est spécialisé dans les atteintes cutanées et vasculaires des maladies auto-immunes rares (filière FAI²R).
Le centre conduit de nombreuses recherches sur le lupus cutané avec ou sans atteinte systémique, ainsi que sur les manifestations vasculaires des maladies systémiques (ulcères de sclérodermie, capillaroscopie, pressions digitales, etc.).
Vos missions
Missions principales :
• Communiquer avec les médecins pour comprendre au mieux les problématiques de recherche, identifier la sous-cohorte adaptée aux enjeux du projet et les variables à extraire ou à construire à partir de données structurées.
• Exécuter des algorithmes de NLP déjà développés pour extraire certaines variables.
• Développer et valider des algorithmes de NLP pour extraire des variables plus spécifiques afin d'appuyer les recherches.
• Réaliser les analyses statistiques permettant de répondre aux questions de recherche.
• Participer à la réponse à des appels à projets pour lancer de nouvelles études.
• Aider à la valorisation des résultats sous forme d'articles scientifiques et de présentations en congrès nationaux et internationaux, en particulier dans le champ des maladies auto-immunes rares.
Profil recherché
Idéalement, vous...
- Avez un diplôme d'ingénieur ou équivalent (bac+5, master 2) en mathématiques, informatique, sciences des données ou biostatistiques.
- Adhérez aux valeurs du service public et vous êtes passionné(e) par le domaine de la santé.
- Avez une expérience ou un intérêt pour la recherche en santé, notamment en épidémiologie clinique appliquée aux maladies rares.
Et vous avez un savoir-faire dans plusieurs de ces domaines :
- Expertise en NLP, utilisation et entraînement de modèles de langue.
- Expertise en statistiques.
- Expertise en calcul distribué et en data management (Spark, etc.).
- Expertise en développement Python et/ou R.
Et humainement
- Curiosité, dynamisme et sens de l'initiative.
- Capacité à vulgariser des concepts à des non-experts.
- Sens de l'écoute.
- Rigueur, méthode.
- Qualités relationnelles et goût pour le travail en équipe, dans un environnement hospitalo-universitaire multidisciplinaire.
Contacts
Adrien LAGASSE - Référent Data Science CEPHEPI : [email protected] Pr François CHASSET et Alexandre TEBOUL - centre CUMULUSS : [email protected] / [email protected]
Horaires de travail
- Forfait jour
Critères candidat
Langues
Les avantages de l'AP-HP
Schéma Horaire
Jour
Temps de travail
7h30
Vos avantages à l'AP-HP
- RTT
-Remboursement transport à hauteur de 75%
- Télétravail
Localisation du poste
Localisation du poste
France, Ile-de-France, Paris (75)
Ville
Paris 13
Hôpital et/ou site
Hôpital Pitié-Salpêtrière - Paris 13 (GHU Sorbonne)
Service d'affectation
CEPHEPI
Métier
Autres métiers - Autres métiers
Intitulé du poste
Data Scientist - Valorisation des données de santé pour la recherche épidémiologique F/H
Type de contrat
CDD uniquement
Télétravail
Oui
Présentation du service
Le centre de pharmaco-épidémiologie de l'Assistance Publique-Hôpitaux de Paris (CEPHEPI)
Le CEPHEPI est une structure transversale de l'AP-HP dont l'objectif est d'évaluer les médicaments et dispositifs médicaux en vie réelle (c'est-à-dire après l'obtention de l'AMM ou du marquage CE), avec le plus haut niveau de qualité méthodologique.
Localisé sur le site de la Pitié-Salpêtrière, le CEPHEPI collabore avec des porteurs de projets de l'ensemble de l'AP-HP et de toutes disciplines médicales confondues, et des partenaires industriels pour répondre à des objectifs de santé publique.
Le CEPHEPI travaille en liens étroits avec le Département de Santé Publique et l'Unité
de Recherche Clinique de la Pitié-Salpêtrière ainsi qu'avec l'équipe PEPITES de
l'Institut Pierre Louis de Santé Publique (IPLESP, UMR-S 1136) à Sorbonne Université. https://pitiesalpetriere.aphp.fr/centre-pharmacoepidemiologie-cephepi/
Le Centre de Référence des Maladies Auto-immunes et Auto-inflammatoires
Systémiques Rares de l'adulte - CUMULUSS
Le CUMULUSS, rattaché au service de Dermatologie de l'hôpital Tenon, est coordonné par le Pr François CHASSET. Le centre est spécialisé dans les atteintes cutanées et vasculaires des maladies auto-immunes rares (filière FAI²R).
Le centre conduit de nombreuses recherches sur le lupus cutané avec ou sans atteinte systémique, ainsi que sur les manifestations vasculaires des maladies systémiques (ulcères de sclérodermie, capillaroscopie, pressions digitales, etc.).
Vos missions
Missions principales :
• Communiquer avec les médecins pour comprendre au mieux les problématiques de recherche, identifier la sous-cohorte adaptée aux enjeux du projet et les variables à extraire ou à construire à partir de données structurées.
• Exécuter des algorithmes de NLP déjà développés pour extraire certaines variables.
• Développer et valider des algorithmes de NLP pour extraire des variables plus spécifiques afin d'appuyer les recherches.
• Réaliser les analyses statistiques permettant de répondre aux questions de recherche.
• Participer à la réponse à des appels à projets pour lancer de nouvelles études.
• Aider à la valorisation des résultats sous forme d'articles scientifiques et de présentations en congrès nationaux et internationaux, en particulier dans le champ des maladies auto-immunes rares.
Profil recherché
Idéalement, vous...
- Avez un diplôme d'ingénieur ou équivalent (bac+5, master 2) en mathématiques, informatique, sciences des données ou biostatistiques.
- Adhérez aux valeurs du service public et vous êtes passionné(e) par le domaine de la santé.
- Avez une expérience ou un intérêt pour la recherche en santé, notamment en épidémiologie clinique appliquée aux maladies rares.
Et vous avez un savoir-faire dans plusieurs de ces domaines :
- Expertise en NLP, utilisation et entraînement de modèles de langue.
- Expertise en statistiques.
- Expertise en calcul distribué et en data management (Spark, etc.).
- Expertise en développement Python et/ou R.
Et humainement
- Curiosité, dynamisme et sens de l'initiative.
- Capacité à vulgariser des concepts à des non-experts.
- Sens de l'écoute.
- Rigueur, méthode.
- Qualités relationnelles et goût pour le travail en équipe, dans un environnement hospitalo-universitaire multidisciplinaire.
Contacts
Adrien LAGASSE - Référent Data Science CEPHEPI : [email protected] Pr François CHASSET et Alexandre TEBOUL - centre CUMULUSS : [email protected] / [email protected]
Horaires de travail
- Forfait jour
Critères candidat
Langues
- Anglais (3- Niveau professionnel)
- Français (3- Niveau professionnel)
Les avantages de l'AP-HP
Schéma Horaire
Jour
Temps de travail
7h30
Vos avantages à l'AP-HP
- RTT
-Remboursement transport à hauteur de 75%
- Télétravail
Localisation du poste
Localisation du poste
France, Ile-de-France, Paris (75)
Ville
Paris 13
Hôpital et/ou site
Hôpital Pitié-Salpêtrière - Paris 13 (GHU Sorbonne)
Service d'affectation
CEPHEPI