Le registre de langue a une forte influence sur l’expressivité véhiculée par un énoncé. Il s’agit pourtant d’un aspect du langage encore largement marginal en traitement automatique des langues (TAL), domaine dominé par l’étude de la dimension informationnelle du langage. En réponse à ce manque, le projet TREMoLo s’intéresse à la notion de registre de langue, avec le français comme langue d’étude.
Le projet s’inscrit dans le mouvement actuel visant l’étude du style des textes, mouvement nourri par l’intérêt des nombreuses applications possibles. On peut citer, par exemple, l’authentification de textes, l’accès à l’information, l’amélioration de systèmes de dialogue humain-machine et l’aide à l’apprentissage des langues. Les retombées sociétales du projet se situent naturellement dans ces domaines en offrant la possibilité de moduler des textes. Scientifiquement, les avancées du projet tiennent principalement dans l’utilisation conjointe de techniques de fouille de données et des approches statistiques de TAL, ainsi que la découverte de nouvelles connaissances en linguistique et sociolinguistique. Ces différents points confèrent au projet un fort potentiel de valorisation industrielle.