Projet LaCAS-IA lauréat SESAME 2024

26 novembre 2024
  • LaCAS

  • Recherche

Le projet LaCAS est un des lauréats du programme SESAME 2024 : ce financement attribué par la région Île-de-France va permettre l'acquisition d'un matériel de pointe permettant d'intégrer l’IA à la plateforme LaCAS, rapprochant ainsi le projet de ses objectifs techniques et de ses ambitions politiques, en matière de science ouverte et de préservations des langues du monde.
sesame
LaCAS lauréat SESAME 2024 © LaCAS 2024‎
Contenu central

Le dispositif « Soutien aux Équipes Scientifiques pour l’Acquisition de Moyens Expérimentaux (SESAME) » permet de cofinancer des équipements scientifiques nécessaires au fonctionnement des laboratoires de recherche publics franciliens pour mener des projets d’envergure. Sur 34 dossiers reçus, le projet LaCAS-IA fait partie des 12 lauréats. 

LaCAS-IA vise à intégrer l'IA à la plateforme LaCAS (créée, en partie, dans le cadre d'un précédent projet SESAME 2020) pour automatiser le moissonnage et la classification des métadonnées, entraîner des modèles linguistiques sur des langues rares, et offrir des outils de traitement et de recherche avancés.

Les axes techniques du projet LaCAS-IA

Ce financement va permettre l'acquisition de processeurs graphiques, ou GPU (de l'anglais Graphics Processing Unit) et de baies de stockage, permettant d'optimiser les capacités de calcul et de gestion des données, deux axes techniques majeurs du projet. 

Accordéons
Le stockage optimal de données

Les projets comme LaCAS nécessitent de gérer d’importants volumes de données (corpus linguistiques, bases de données de textes ou d’enregistrements audio, etc.). La gestion efficace de ces données est donc un enjeu crucial sur lequel repose l’ensemble des autres déploiements du projet.

L’automatisation des procédés

Les domaines comme la traduction automatique, l’analyse sémantique ou la génération de langage naturel, nécessitent des ressources de calcul importantes. Les GPU réduisent largement le temps nécessaire à la réalisation de ces procédés.

Les axes politiques du projet LaCAS-IA

Les optimisations techniques, en plus de renforcer la crédibilité du projet LaCAS dans un domaine hautement compétitif (IA et TAL), contribuent de manière décisive aux ambitions politiques du projet. La science ouverte et la préservation des langues rares sont deux axes essentiels, qui distinguent le projet d’autres initiatives scientifiques ou technologiques semblables et en font un acteur incontournable de la valorisation des études aréales en France.

Accordéons
Les objectifs de science ouverte

Les baies de stockage centralisées permettent de partager des ressources de données plus facilement entre les chercheurs et collaborateurs, améliorant ainsi la coopération internationale et le développement de nouvelles recherches basées sur des corpus ouverts.

La préservation des langues rares

Les modèles de langage à grande échelle (LLM) émergent comme des catalyseurs puissants dans la préservation et l’étude des langues rares. Ces outils d’intelligence artificielle, capables de traiter et de générer du langage humain avec une précision remarquable, offrent une lueur d’espoir pour les quelques 2 500 langues menacées dans le monde.