Qu’est-ce ?

Les objectifs sont de progresser dans l’étude des registres de langue et de développer des méthodes automatiques de transformation de textes d’un registre vers un autre. Ce travail s’appuiera sur l’extraction de patrons linguistiques spécifiques à des registres donnés et sur leur prise en compte dans un processus de production automatique de paraphrases. La bonne conduite du projet sera assurée par les compétences fortes et complémentaires des membres de l’équipe dans ces thématiques.

Le projet TREMoLo se situe dans une optique de recherche exploratoire dont l’objectif à long terme est de produire des connaissances fondamentales pour les approches d’extraction de régularités stylistiques spécifiques de textes et de production automatique de langage naturel. Les registres de langue sont un cas d’étude stratégique vers cet objectif à long terme.

Pourquoi ?

Le registre de langue a une forte influence sur l’expressivité véhiculée par un énoncé. Il s’agit pourtant d’un aspect du langage encore largement marginal en traitement automatique des langues (TAL), domaine dominé par l’étude de la dimension informationnelle du langage. En réponse à ce manque, le projet TREMoLo s’intéresse à la notion de registre de langue, avec le français comme langue d’étude.

Le projet s’inscrit dans le mouvement actuel visant l’étude du style des textes, mouvement nourri par l’intérêt des nombreuses applications possibles. On peut citer, par exemple, l’authentification de textes, l’accès à l’information, l’amélioration de systèmes de dialogue humain-machine et l’aide à l’apprentissage des langues. Les retombées sociétales du projet se situent naturellement dans ces domaines en offrant la possibilité de moduler des textes. Scientifiquement, les avancées du projet tiennent principalement dans l’utilisation conjointe de techniques de fouille de données et des approches statistiques de TAL, ainsi que la découverte de nouvelles connaissances en linguistique et sociolinguistique. Ces différents points confèrent au projet un fort potentiel de valorisation industrielle.