Livraison du plus grand modèle de langue multilingue "open science" jamais entraîné

Communiqué de presse Sciences de l'information

S’ils fournissent régulièrement des résultats fascinants, les grands modèles d’intelligence artificielle sont généralement des boîtes noires : on ne sait pas exactement comment ils calculent leurs réponses et de nombreux éléments ne sont pas rendus publics. Le projet BigScience, impliquant un millier de chercheurs et chercheuses dans une démarche de science participative et ouverte, change la donne avec « Bloom ». Il s’agit du plus gros modèle de langue multilingue entrainé de manière complètement ouverte et transparente. Ce type d’intelligence artificielle apprend simultanément un modèle de génération de textes et un modèle de représentation de textes en effectuant de manière répétitive une tâche élémentaire : prédire le prochain mot d’un texte dont on connait le début, à la manière de ce que font les claviers « intelligents ». En plus de gérer 46 langues, allant de l’anglais au basque, son caractère open science aidera les scientifiques de tous horizons à explorer le fonctionnement des modèles de langue pour les améliorer. Le projet BigScience, initié par l’entreprise Hugging Face, a été soutenu par le CNRS, GENCI1 et le ministère de l’Enseignement supérieur et de la Recherche, ce qui a permis d’entraîner Bloom sur la machine « Jean Zay », un des plus puissants supercalculateurs d’Europe.

  • 1Le CNRS a été impliqué en particulier via son Institut du développement et des ressources en informatique scientifique (Idris). GENCI : Grand équipement national de calcul intensif.

Afin d'offrir plus de typologies de textes à une IA (langues variées, littérature, notes techniques, code informatique) et proposer cette base de données en open science, le projet BigScience inclut plusieurs centaines de scientifiques dont ceux du LIRMM dans le projet Bloom. Ce projet d'envergure vise à diversifier l’approche et les sources, afin que le modèle soit capable de remplir des tâches différentes.

Lire le communiqué de presse