Le projet Pantagruel (ANR 23-IAS1-0001) ambitionne de développer et évaluer des modèles linguistiques multimodaux (écrit, oral, pictogrammes) inclusifs pour le français. Il mobilise des chercheurs de diverses disciplines telles que l’informatique, le traitement du signal, la sociologie et la linguistique pour assurer des résultats fiables et variés.
Exemple de suite de pictogrammes signifiant :
Le chat mange la souris
Les principales contributions visent à créer des modèles auto-supervisés accessibles pour le français, adaptés à différents domaines d’application. De plus, le projet prévoit la mise en place de bancs d’essais pour évaluer ces modèles, en tirant parti des expériences précédentes.
Une attention particulière est portée à la réduction des biais et des stéréotypes dans les données et les modèles. Des mesures seront prises pour atténuer ces biais, en tenant compte des caractéristiques démographiques des locuteurs et des auteurs, avec l’appui d’un comité d’éthique.
Le projet vise également à développer des outils logiciels facilitant l’intégration de ces modèles dans diverses applications, en mettant l’accent sur l’accessibilité pour les utilisateurs non techniques.
Dans l’ensemble, Pantagruel cherche à améliorer les modèles linguistiques multimodaux pour le français, avec des implications potentielles dans différents domaines tels que la santé et les arts.
What's new?
Les modèles Jargon ont été ajoutés sur Huggingface (voir page 'Code et modèles')