Publiée 20 juin 2026
Doctorant F/H Grammaires Catégorielles Abstraites Probabilistes
Inria
Nancy, Grand-Est 54000, France
CDI
Mission confiée
Les grammaires catégorielles abstraites offrent un cadre formel permettant d'encoder d'autres formalismes grammaticaux. En particulier, les grammaires catégorielles abstraites du second ordre, dont les structures d'analyse se réduisent à des arbres, permettent de représenter les grammaires régulières, les grammaires hors-contexte et les grammaires hors-contexte à composants multiples.
En théorie des automates et des langages formels, il est courant que les différents formalismes considérés donnent lieu à des variantes pondérées ou probabilistes.
Les grammaires pondérées, dont les grammaires probabilistes sont un cas particulier, permettent de maîtriser l'explosion combinatoire associée à l'analyse syntaxique des langages ambigus. De plus, les poids associés aux règles de production peuvent être estimés à partir d'un ensemble donné d'observations. Pour les grammaires régulières probabilistes, l'algorithme d'inférence est l'algorithme Forward-Backward . La généralisation de cet algorithme aux grammaires hors-contexte probabilistes donne lieu à l'algorithme Inside-Outside , ces deux algorithmes étant en fait des instances de la méthode de maximisation de l'espérance.
Le sujet de cette thèse est de développer une notion de grammaire catégorielle abstraite probabiliste. Dans un premier temps, il s'agira de définir une notion de grammaire catégorielle abstraite probabiliste du second ordre et de généraliser l'algorithme Inside-Outside à celle-ci. À cette fin, on pourra s'appuyer sur la réduction de l'analyse syntaxique des grammaires catégorielles abstraites du second ordre à des requêtes datalog , due à Kanazawa.
Avantages
Rémunération
2300 € brut/mois
Les grammaires catégorielles abstraites offrent un cadre formel permettant d'encoder d'autres formalismes grammaticaux. En particulier, les grammaires catégorielles abstraites du second ordre, dont les structures d'analyse se réduisent à des arbres, permettent de représenter les grammaires régulières, les grammaires hors-contexte et les grammaires hors-contexte à composants multiples.
En théorie des automates et des langages formels, il est courant que les différents formalismes considérés donnent lieu à des variantes pondérées ou probabilistes.
Les grammaires pondérées, dont les grammaires probabilistes sont un cas particulier, permettent de maîtriser l'explosion combinatoire associée à l'analyse syntaxique des langages ambigus. De plus, les poids associés aux règles de production peuvent être estimés à partir d'un ensemble donné d'observations. Pour les grammaires régulières probabilistes, l'algorithme d'inférence est l'algorithme Forward-Backward . La généralisation de cet algorithme aux grammaires hors-contexte probabilistes donne lieu à l'algorithme Inside-Outside , ces deux algorithmes étant en fait des instances de la méthode de maximisation de l'espérance.
Le sujet de cette thèse est de développer une notion de grammaire catégorielle abstraite probabiliste. Dans un premier temps, il s'agira de définir une notion de grammaire catégorielle abstraite probabiliste du second ordre et de généraliser l'algorithme Inside-Outside à celle-ci. À cette fin, on pourra s'appuyer sur la réduction de l'analyse syntaxique des grammaires catégorielles abstraites du second ordre à des requêtes datalog , due à Kanazawa.
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale
Rémunération
2300 € brut/mois