Publiée 6 juin 2026
Ingénieur H/F Anonymisation acoustique et sémantique de la parole.
Inria
Nancy, Grand-Est 54000, France
CDI
Contexte et atouts du poste
Ce poste d'ingénieur.e se place dans le cadre de l'ANR SpeechPrivacy ( ANR-23-CE23-0022 ) "Dés enchevêtrement d'attributs multiples, acoustique et sémantique, pour la privacité.", dont l'objectif est d'améliorer la privacité pour les utilisateurs de technologies de la parole et du langage, afin d'empêcher l'utilisation de leur enregistrements vocaux à des fins pour lesquelles l'utilisateur n'a pas donné son consentement [1]. Le projet SpeechPrivacy vise à proposer une solution flexible de protection de la vie privée, fondée sur la séparation des différentes caractéristiques de la parole et sur l'obfuscation ou la modification ciblée de certains attributs. Les objectifs sont de (1) concevoir une solution capable de dissocier plusieurs attributs et d'évaluer l'impact de leur modification sur les autres attributs ainsi que sur l'utilité pour un cas d'usage donné ; (2) développer un système robuste de détection des mots sensibles et des informations comme l'âge ou le sexe, avec leur substitution dans le signal vocal ; (3) proposer une interface permettant aux utilisateurs de contrôler finement le compromis entre protection de la vie privée et utilité, pour différents attributs.
Ainsi, les partenaires de ce projet étudient les moyens d'anonymiser la parole directement dans le signal acoustique mais aussi dans son contenu linguistique. Ces travaux s'accompagnent aussi de l'évaluation de l'anonymisation suivant le cas d'usage.
Le/la ingénieur.e sera co-encadré.e par Vincent Colotte et Natalia Tomashenko. Il/elle bénéficiera de l'expertise de l'équipe Multispeech en traitement de la parole et il/elle collaborera avec les doctorants et les autres partenaires du projet.
Des déplacements réguliers sont prévus pour ce poste ? N'hésitez pas à le signaler et à assurer que "les frais de déplacements seront pris en charge dans la limite du barème en vigueur".
Mission confiée
Dans ce contexte, la personne recrutée aura pour mission principale de développer une solution intégrant les différents modules conçus par les partenaires. Un cas d'usage envisagé consiste à anonymiser automatiquement un signal vocal en modifiant ses caractéristiques acoustiques [2] et en remplaçant certains mots jugés sensibles [3]. L'objectif n'est pas de produire des deepfakes, mais de préserver un signal final intelligible et exploitable, tout en permettant à l'utilisateur de contrôler les différents niveaux d'anonymisation. Pour ce faire, la personne recrutée travaillera en étroite collaboration avec les doctorants impliqués dans les différentes composantes du processus d'anonymisation.
Au-delà de ce traitement, le logiciel devra intégrer des métriques permettant d'évaluer le niveau de protection atteint, afin que l'utilisateur puisse ajuster les paramètres en fonction du cas d'usage.
Enfin, en complément de ce prototype, un second objectif sera de proposer un premier système de référence, dans le cadre du Voice Privacy Challenge [4].
[1] Andreas Nautsch, Catherine Jasserand, Els Kindt, Massimiliano Todisco, Isabel Trancoso, and Nicholas Evans. "The GDPR & speech data: Reflections of legal and technology communities, first steps towards a common understanding". In: Interspeech. 2019.
[2]Yangyang Qu, Michele Panariello, Massimiliano Todisco, Nicholas Evans. Reference-free Adversarial Sex Obfuscation in Speech. APSIPA 2025, 17th Asia Pacific Signal and Information Processing Association Annual Summit and Conference, Oct 2025, Shangri-la, Singapore.
[3] ZHAO H. (2023). A GAN Speech Inpainting Model for Audio Editing Software. In INTERSPEECH 2023, p. 5127-5131 : ISCA. DOI : 10.21437/Interspeech.2023-904.
[4] Natalia Tomashenko, Xiaoxiao Miao, Pierre Champion, Sarina Meyer, Michele Panariello, et al.. The Third VoicePrivacy Challenge: Preserving Emotional Expressiveness and Linguistic Content in Voice Anonymization. Computer Speech and Language , inPress, pp.101988. <10.1016/j.csl.2026.101988> .
Principales activités
Principales activés :
Compétences
Master ou Diplôme d'ingénieur en traitement de la parole, machine learning, informatique, TAL ou dans un domaine lié.
Solides compétences en programmation Python/Pytorch.
Une expérience préalable en traitement de la parole ou en TAL sera un atout.
Avantages
Rémunération
A partir de 2692 € brut/mois selon diplômes et expérience
Ce poste d'ingénieur.e se place dans le cadre de l'ANR SpeechPrivacy ( ANR-23-CE23-0022 ) "Dés enchevêtrement d'attributs multiples, acoustique et sémantique, pour la privacité.", dont l'objectif est d'améliorer la privacité pour les utilisateurs de technologies de la parole et du langage, afin d'empêcher l'utilisation de leur enregistrements vocaux à des fins pour lesquelles l'utilisateur n'a pas donné son consentement [1]. Le projet SpeechPrivacy vise à proposer une solution flexible de protection de la vie privée, fondée sur la séparation des différentes caractéristiques de la parole et sur l'obfuscation ou la modification ciblée de certains attributs. Les objectifs sont de (1) concevoir une solution capable de dissocier plusieurs attributs et d'évaluer l'impact de leur modification sur les autres attributs ainsi que sur l'utilité pour un cas d'usage donné ; (2) développer un système robuste de détection des mots sensibles et des informations comme l'âge ou le sexe, avec leur substitution dans le signal vocal ; (3) proposer une interface permettant aux utilisateurs de contrôler finement le compromis entre protection de la vie privée et utilité, pour différents attributs.
Ainsi, les partenaires de ce projet étudient les moyens d'anonymiser la parole directement dans le signal acoustique mais aussi dans son contenu linguistique. Ces travaux s'accompagnent aussi de l'évaluation de l'anonymisation suivant le cas d'usage.
Le/la ingénieur.e sera co-encadré.e par Vincent Colotte et Natalia Tomashenko. Il/elle bénéficiera de l'expertise de l'équipe Multispeech en traitement de la parole et il/elle collaborera avec les doctorants et les autres partenaires du projet.
Des déplacements réguliers sont prévus pour ce poste ? N'hésitez pas à le signaler et à assurer que "les frais de déplacements seront pris en charge dans la limite du barème en vigueur".
Mission confiée
Dans ce contexte, la personne recrutée aura pour mission principale de développer une solution intégrant les différents modules conçus par les partenaires. Un cas d'usage envisagé consiste à anonymiser automatiquement un signal vocal en modifiant ses caractéristiques acoustiques [2] et en remplaçant certains mots jugés sensibles [3]. L'objectif n'est pas de produire des deepfakes, mais de préserver un signal final intelligible et exploitable, tout en permettant à l'utilisateur de contrôler les différents niveaux d'anonymisation. Pour ce faire, la personne recrutée travaillera en étroite collaboration avec les doctorants impliqués dans les différentes composantes du processus d'anonymisation.
Au-delà de ce traitement, le logiciel devra intégrer des métriques permettant d'évaluer le niveau de protection atteint, afin que l'utilisateur puisse ajuster les paramètres en fonction du cas d'usage.
Enfin, en complément de ce prototype, un second objectif sera de proposer un premier système de référence, dans le cadre du Voice Privacy Challenge [4].
[1] Andreas Nautsch, Catherine Jasserand, Els Kindt, Massimiliano Todisco, Isabel Trancoso, and Nicholas Evans. "The GDPR & speech data: Reflections of legal and technology communities, first steps towards a common understanding". In: Interspeech. 2019.
[2]Yangyang Qu, Michele Panariello, Massimiliano Todisco, Nicholas Evans. Reference-free Adversarial Sex Obfuscation in Speech. APSIPA 2025, 17th Asia Pacific Signal and Information Processing Association Annual Summit and Conference, Oct 2025, Shangri-la, Singapore.
[3] ZHAO H. (2023). A GAN Speech Inpainting Model for Audio Editing Software. In INTERSPEECH 2023, p. 5127-5131 : ISCA. DOI : 10.21437/Interspeech.2023-904.
[4] Natalia Tomashenko, Xiaoxiao Miao, Pierre Champion, Sarina Meyer, Michele Panariello, et al.. The Third VoicePrivacy Challenge: Preserving Emotional Expressiveness and Linguistic Content in Voice Anonymization. Computer Speech and Language , inPress, pp.101988. <10.1016/j.csl.2026.101988> .
Principales activités
Principales activés :
- Développer des applications et des interfaces à partir de travaux de recherche.
- Concevoir des plateformes expérimentales.
- Rédiger la documentation
- Tester, modifier jusqu'à valider
- Présenter l'avancée des travaux aux partenaires
Compétences
Master ou Diplôme d'ingénieur en traitement de la parole, machine learning, informatique, TAL ou dans un domaine lié.
Solides compétences en programmation Python/Pytorch.
Une expérience préalable en traitement de la parole ou en TAL sera un atout.
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale
Rémunération
A partir de 2692 € brut/mois selon diplômes et expérience