Présentation de l'équipe

L'ERTIM est une Équipe d'Accueil au carrefour de l'ingénierie multilingue et du Traitement Automatique des Langues. Elle a pour objets principaux la recherche en sémantique des textes pour les applications ; le développement de méthodologie pour l’ingénierie des textes et des documents numériques multilingues et la production de ressources multilingues (lexicales, terminologiques, textuelles, didactiques).

Les travaux de l’ERTIM se caractérisent par :

     - Une recherche axée sur la résolution de problèmes scientifiques posés par les applications.
Les recherches de l’équipe ont toujours eu pour objectif de répondre à des problèmes applicatifs concrets. A titre d’exemple, dans les années 1990, la terminologie textuelle élaborée par M. Slodzian et D. Bourigault visait le problème de l’inadéquation des terminologies de domaines aux usages à partir d’une réflexion théorique sur les genres textuels et un outillage technique (extraction de syntagmes à partir de corpus raisonnés) (Min. Indus. SAFIR). Dans les années 2000, l’instrumentation textométrique des concepts de la sémantique textuelle (F. Rastier) a eu pour objectif la conception de nouveaux algorithmes de filtrage de textes (EC PRINCIP et ANR C-MANTIC). Dans les années 2010, ce sont l’identification des signaux faibles et l’extraction d’information subjective (fouille d’opinion, analyse des sentiments) qui apparaissent comme des terrains de prospection et d’expérimentation porteurs pour l’équipe. L’ERTIM s’efforce d’adopter une position critique par rapport aux modèles théoriques dominants et propose des alternatives fondées sur le primat donné à la praxis et au sémiotique, par opposition à l’ontologie et à la référence.

     - Une attention continue à la demande sociale, caractérisée par des projets
. en ingénierie des connaissances médicales (pharmacovigilance : ANR VIGITERMES ; fouille de textes en fœtopathologie pour la valorisation de la recherche médicale : ANR ACCORDYS),
. en veille sanitaire (prévention contre le tabagisme : ANR C-MANTIC ; comportements liés à la prévention contre le Sida au Vietnam)
. en filtrage de contenu préjudiciable et illicite (racisme et xénophobie sur Internet : projet européen Safer Internet PRINCIP). À cette attention portée à la demande sociale, s’ajoute naturellement une attention portée à la demande économique — hier, pour la constitution de ressources terminologiques pour l’industrie (projet SAFIR avec EDF), aujourd’hui, beaucoup par le biais de thèses CIFRE (AMI Software, SemantiWeb, GEOL SEMANTICS, etc.).

Par ailleurs, le Master spécialité « Ingénierie Linguistique » (PLURITAL, http://plurital.org) dont l’ERTIM est Equipe d’Accueil, met chaque année sur le marché du travail plus d’une dizaine de diplômés qualifiés en TAL et ingénierie linguistique, dans les domaines du traitement de corpus multilingue et de ses applications (fouille de textes, agrégation de contenus, analyse de sentiments, élaboration de terminologie, veille, lexicologie), la traduction outillée (chef de projet de traduction, localisation d'applications et sites web, traducteur), la gestion de l'information multilingue (veille, webmarketing, documentation et archivage...).

     - Un intérêt marqué pour les nouveaux usages et les nouvelles pratiques du texte (Internet, réseaux sociaux, etc.) où la linguistique des textes a tout intérêt à construire ses problématiques (e-réputation, extraction d’information sur des forums de discussion, identification des autorités, aide à la compréhension des textes numériques, etc.). La linguistique pratiquée à l’ERTIM est une linguistique des textes considérés comme des objets culturels et confinant à une sémiotique des cultures. Témoins des cultures, les textes sont étudiés dans toutes leurs dimensions (production, interprétation, traduction, transformation, etc.). L’équipe occupe à cet égard au sein de l’INALCO une position épistémologique originale, entre sciences du langage et sciences de la culture (i.e. les études aréales).

     - La participation à la valorisation du patrimoine linguistique (et culturel) de l’INALCO, laquelle s’instancie d’une part dans l’outillage TAL des langues étudiées et enseignées à INALCO, et d’autre part, par la réalisation d’outils et de ressources didactiques pour l’apprentissage des langues (plateforme et outils d’apprentissage ou d’aide à la lecture, textes didactisés), ou le développement de méthodologies de fouille de textes pour les humanités numériques.

 

Contact(s)

ertim@inalco.fr

En savoir plus