


Les équipes d’AI Singapore et de l’INSAIT ont exploité Gemma, une famille de modèles linguistiques open source, pour créer des LLM (Large Language Models) adaptés aux besoins spécifiques de leurs communautés. Cette initiative témoigne de l’innovation et de l’inclusivité dans le domaine de l’IA.
Modèle de langue inclusif
Gemma permet aux chercheurs de personnaliser les modèles linguistiques en fonction de langues et de domaines spécifiques. « Nous pouvons exploiter les connaissances de nos locuteurs natifs pour améliorer la précision et la pertinence des modèles », déclare le Dr Benjamin Gauthier, responsable du laboratoire d’IA de l’INSAIT.
LLM adaptés au français
L’équipe de l’INSAIT a développé un LLM spécifiquement conçu pour la langue française. « Notre modèle, baptisé LeFrenchBERT, se distingue par sa capacité à comprendre et à générer du texte français complexe », précise le Dr Gauthier.
Résultats prometteurs
Les tests de performance ont montré que LeFrenchBERT surpasse les modèles linguistiques généraux en termes d’exactitude et d’efficacité pour les tâches liées au français. « Ces résultats ouvrent de nouvelles possibilités pour des applications telles que la traduction, les chatbots et le résumé de texte », ajoute-t-il.
Technologie accessible
La nature open source de Gemma rend cette technologie accessible aux chercheurs et aux développeurs du monde entier. « Nous espérons que d’autres communautés exploiteront Gemma pour créer des modèles linguistiques qui répondent à leurs besoins uniques », déclare Michael Casey, responsable des programmes chez AI Singapore.
Conclusion
L’utilisation de Gemma pour développer des LLM personnalisés marque une étape importante vers des modèles linguistiques plus inclusifs et adaptés. Cet effort collaboratif ouvre de nouvelles voies d’innovation et promet d’améliorer considérablement les interactions homme-machine dans diverses langues.
Mots-clés : modèle linguistique, langage naturel, Gemma, LLM, français
