Axe 5 - Dictionnaires, corpus, réseaux, changements linguistiques

Responsable : Svetlana Krylosova

L’axe 5 « Dictionnaires, corpus, réseaux. Changements linguistiques » est l’axe linguistique du CREE. Les enseignants-chercheurs travaillent sur différentes langues telles que le bulgare, l’estonien, le finnois, le russe, le tchèque, l’ukrainien, etc.
Sur la période 2019-2023, les chercheurs de l’axe 5 poursuivront leurs travaux en sociolinguistique, en linguistique du corpus, en terminologie, en lexicologie et en lexicographie, engagés lors du précédent quinquennat, en ouvrant de nouvelles perspectives.

Pour le projet 5.1, une équipe interdisciplinaire a été créée afin de lancer un nouvel axe de recherches sur l’étude formelle et informatisée du lexique russe. L’équipe du projet 5.2 poursuit son travail sur les changements linguistiques et l’étend à l’aspect sociolinguistique des changements dans les langues suite à l’emploi concomitant des variétés standardisées et non standardisées par les locuteurs dans une communauté linguistique. Le projet 5.3 réunit les chercheurs autour de la réalisation d’outils lexicographiques et de corpus unilingues ou bilingues..

Ainsi, outre les objectifs théoriques (réflexions sur la sémantique, la standardisation des langues, le processus de modification linguistique), les chercheurs de l’axe 5 se fixent également l’objectif descriptif suivant : créer de nouvelles ressources lexicographiques (dictionnaires, réseaux lexicaux) et des corpus parallèles qui pourraient être utilisés non seulement pour l’étude linguistique elle-même, mais aussi comme support pour l’enseignement de nos langues ainsi que pour le traitement automatique des langues.
La réalisation de ces projets de long terme est possible grâce à l’établissement de partenariats avec d’autres équipes de recherches de l’Inalco (CERMOM, ERTIM, Plidam) mais également avec des partenariats nationaux (ATILF CNRS, Université Lyon-2, Université Lille 3, Université Jean Moulin Lyon 3, Université de Toulouse 2, Université de Corse ; Université de Rennes 1, l’Université du Littoral-Côte d’Opale) et internationaux (Université de Sofia Saint Clément d’Ohrid, Université de Montréal, International Sociolinguistic Society in Sofia (INSOLISO), Association franco-estonienne de lexicographie (AFEL, Tartu, Estonie), l’Institut de la langue estonienne (EKI, Tallinn, Estonie), le Centre estonien de ressources linguistiques (EKK, Tallinn), l’Université de Laval, Université de Milan, Université de Sherbrooke, Jožef Stefan Institute, DFKI – German Research Center for Artificial Intelligence).

Les projets de l’axe 5 étant complémentaires, les chercheurs des trois projets travaillent ensemble à l’occasion de la préparation des journées d’études, des colloques, de la formation des jeunes chercheurs.

Projets :

5.1. Lexicologie explicative et combinatoire du russe selon l'approche des réseaux lexicaux

Responsables : Vincent Bénet (CREE, CEFR), Svetlana Krylosova (CREE)

Le projet Lexicologie Explicative et Combinatoire du Russe selon l’approche des Réseaux lexicaux (LEC-ru) a pour objectif de constituer à l’INALCO une équipe spécialisée dans l’étude formelle et informatisée du lexique de la langue russe. Les activités de l’équipe LEC-ru possèdent deux caractéristiques principales. Premièrement, elles se situent dans un cadre théorique et descriptif appelé Lexicologie Explicative et Combinatoire, qui permet de formaliser de façon rigoureuse les descriptions lexicales et qui s’insère dans une approche globale de l’étude de la langue dans tous ses modules de fonctionnement — sémantique, syntaxe, morphologie et phonétique. Une telle approche met aussi tout particulièrement l’accent sur l’étude et la modélisation de la phraséologie lexicale (locutions et collocations). Deuxièmement, l’activité de description du lexique russe s’appuie sur le développement d’un réseau lexical de grande taille (Réseau Lexical du russe, RL-ru). Un tel réseau est une représentation du lexique où les mots sont interconnectés par un système normalisé de relations paradigmatiques et syntagmatiques explicitement décrites. Il s’agit d’une structure de représentation particulièrement adaptée aux exploitations pédagogiques (enseignement du russe langue étrangère, notamment) et au traitement automatique de la langue.
 
Le projet s’inscrit dans le cadre de la convention signée entre l’Inalco et le CNRS (laboratoire Analyse et Traitement Informatique de la Langue Française) avec la participation de l’Observatoire de linguistique Sens-Texte de l’Université de Montréal.
 
Chercheurs associés au projet : Elena Akborisova Da Silva (Plidam, Inalco), Vincent Bénet (CREE & CEFR), Angelina Biktchourina (CREE), Nikolaï Chepurnykh (ATILF CNRS, Université de Lorraine), Tomara Gotkova (ATILF CNRS, Université de Lorraine), Lidia Kolzoun (ATILF CNRS & CREE), Svetlana Krylosova (CREE), Polina Mikhel (ATILF CNRS, Université de Lorraine). Avec la participation de Lidia Iordanskaja (OLST, Université de Montréal), François Lareau (OLST, Université de Montréal), Igor Meľčuk (OLST, Université de Montréal), Alain Polguère (ATILF CNRS, Université de Lorraine).

Principales collaborations : ATILF CNRS, Université de Lorraine & OLST, Université de Montréal.
 
Opérations de recherche :

  • construction d’un Réseau lexical du russe RL-ru (responsable Svetlana Krylosova) ;
  • formation d’étudiants en lexicologie explicative et combinatoire, co-encadrement des stages, des mémoires de master, codirection des thèses de doctorat (Vincent Bénet, Svetlana Krylosova) ;
  • établissement de partenariats nationaux et internationaux en lexicologie dans ses applications (séminaires et séances de travail réguliers à l’Inalco, à l’ATILF CNRS et à l’OLST – Université de Montréal) (responsable Svetlana Krylosova) ;
  • lancement de la collaboration avec quatre universités italiennes (l’Università Cattolica del Sacro Cuore de Milan l’Università degli Studi di Bologna, l’Università degli Studi di Napoli « Parthenope », l’Università degli Studi di Perugia et l’Università degli Studi di Verona) dans le domaine de la lexicologie, la phraséologie et la terminologie comparées (responsables Svetlana Krylosova, Polina Mikhel & la chercheuse du projet 5.2 Snejana Gadjeva) ;
  • mise en place d’un projet satellite sur la description lexicographique des termes de chimie en perspective plurilingue (Polina Mikhel) ;
  • mise en place d’un projet satellite sur la description lexicographique des clausatifs russes (Elena Akborisova, Nikolay Chepournykh, Tomara Gotkova, Lidia Kolzoun, Svetlana Krylosova, Polina Mikhel) ;
  • mise en place d’un projet satellite sur la description lexicographique des verbes de déplacement (Svetlana Krylosova, Polina Mikhel, avec la participation de Polina Voronova) ;
  • didactisation des définitions lexicographiques du RL-ru permettant leur exploitation en salle de cours (création des supports de cours comprenant des définitions didactisées, des exercices, des consignes pour les enseignants) (Lidia Kolzoun, Svetlana Krylosova) ;
  • organisation, dans le cadre de la formation doctorale de l’Inalco, des conférences d’Igor Mel’čuk, Université de Montréal (responsable Svetlana Krylosova, avec la participation de l’équipe LEC-ru) ;
  • colloque international « Lexique et corps humain », juin 2021 (responsable scientifique Svetlana Krylosova, avec la participation de l’équipe LEC-ru ainsi que des chercheurs du projet 5.2 Snejana Gadjeva & Gueorgui Armianov) ;
  • publication d’un numéro spécial d’une revue international sur la lexicologie (Svetlana Krylosova) ;
  • colloque international sur la lexicologie et la terminologie comparées en octobre 2023 (responsables scientifiques Snejana Gadjeva CREE, Claudio Grimaldi Université de Naples, Svetlana Krylosova CREE, Maria Teresa Zanola Université de Milan ; avec la participation de l’équipe LEC-ru ainsi que des chercheurs des projets 5.2 et 5.3, Gueorgui Armianov & Kaja Dolar) ;
  • participation à des séminaires doctoraux, des journées d’études et des colloques internationaux, publications d’articles ;
  • aide de l’équipe LEC-ru dans le mise en place du Réseau Lexical de l’Ukrainien (ATILF CNRS) (Tomara Gotkova, Svetlana Krylosova & Polina Mikhel). 

Mots-clefs : théorie « Sens — Texte » ; Lexicologie Explicative et Combinatoire ; langue russe ; Réseau lexical ; lexicologie ; phraséologie ; terminologie ; enseignement / acquisition du sens.

5.2. Changements linguistiques internes et externes : similitudes et divergence

Responsables : Snejana Gadjeva (CREE), Gueorgui Armianov (CREE)

Le projet vise à réunir des chercheurs qui étudient des changements dans tous les domaines des langues en les associant à des processus d’évolution observés à des périodes données de l’histoire des sociétés qui les parlent. Ces changements linguistiques sont le résultat de différentes mutations sociales et étatiques marquées par un renoncement à des réalités du passé et une adoption de nouvelles formes d’expression langagière.

L’originalité du projet consiste en l’analyse de données linguistiques contemporaines, recueillies lors d’enquêtes de terrain ou tirées de corpus inédits. La problématique abordée est investie grâce à une approche sociolinguistique, aussi bien en synchronie qu’en diachronie, qui vise à faire le lien entre les productions proprement linguistiques et les contextes sociaux dans lesquelles ils se manifestent. Une attention particulière est portée aussi bien sur l’interaction entre langue standard et variétés non-standards (sociolectes, dialectes) que sur les interférences entre des langues parlées au sein de communautés bilingues et plurilingues de nos jours.

La variété des contextes sociaux dans lesquelles se manifestent les pratiques linguistiques étudiées donne la possibilité, d’un côté, de définir des facteurs externes spécifiques motivant les changements linguistiques au sein d’une communauté. Cette diversité de situations permet, d’un autre côté, de croiser différentes données linguistiques (langues slaves, balkaniques, turc, arabe, hébreu et langues juives) afin de démontrer l’existence d’une dynamique de transformation commune à plusieurs sociétés, par ailleurs rattachées à des espaces géopolitiques (européen, balkanique, méditerranéen) et historiques distincts (post-ottoman, post-austro-hongrois, postsoviétique).

Chercheurs associés au projet : Georgui Armianov (CREE),  Oleg Chinkarouk (CREE), , Snejana Gadjeva (CREE), Svetlana Krylosova (CREE), Ilona Sinzelle-Poňavičová (doctorante CREE),  Janna Vassiliotchek (CREE), Krassimira Aleksova (Université de Sofia Saint Clément d’Ohrid), Dominique Samson (CREE). 

Principales collaborations : Université Jean Moulin Lyon 3, Sorbonne Université, CNRS, Université de Rennes 1, l’Université du Littoral-Côte d’Opale, Université de Sofia Saint Clément d’Ohrid, International Sociolinguistic Society in Sofia (INSOLISO).

Opérations de recherche :

  • participation à l’organisation du colloque international Lexique et corps humain (avec les collègues du projet 5.1 ; Snejana Gadjeva, Gueorgui Armianov) ;
  • publication d’un volume thématique de la revue Slovo, 2022 (dir. Snejana Gadjeva & Svetlana Krylosova ; avec la participation de Gueorgui Armianov, Ilona Sinzelle-Poňavičová, Jeanna Vassilioutchek & Dominique Samson) ;
  • publication d’un chapitre sur les variétés non-standards : Sub-standard varieties, slang, argot and jargon, In: Neil Bramer (dir.), Oxford guide to the Slavonic languages, Chapter 7.5, Oxford University Press (Gueorgui Armianov) ;
  • séminaire doctoral Standard et non standard dans les langues de l’Europe médiane, destiné aux doctorants et aux étudiants de master (responsable Gueorgui Armianov ; avec la participation des chercheurs des projets 5.1 et 5.3 : Antoine Chalvin, Oleg Chinkarouk, Snejana Gadjeva, Svetlana Krylosova & Ilona Sinzelle-Poňavičová, ainsi que des chercheurs d’autres équipes de l’Inalco (Plidam, Sedyl)) ;
  • séminaire de L3, parcours Linguistique : Dynamiques des contacts de langues (assuré par Snejana Gadjeva) ;
  • séminaire du Master Science du Langage : Processus et effets des contacts des langues (assuré par Snejana Gadjeva) ;
  • participation annuelle à plusieurs séminaires aréaux ou thématiques collectifs à l’Inalco : Linguistique des langues balkaniques (Gueorgui Armianov, Snejana Gadjeva) ; Questions de grammaire dans l’aire finno-balto-slave (Snejana Gadjeva, Oleg Chinkarouk, Jeanna Vassilioutchek) ; Méthodes en dialectologie : théorie et pratique (Snejana Gadjeva) ; Textes. Linguistique. Traduction (Svetlana Krylosova) ; Histoire et sciences sociales : théories et méthodes (Snejana Gadjeva) ; Séminaire du Quai Branly (Snejana Gadjeva) ;
  • participation à des journées d’études et des colloques internationaux ;
  • participation aux Débats du CREE (Gueorgui Armianov, Snejana Gadjeva) ;
  • participation au projet ANR Atlas of the Balkan linguistic area (Snejana Gadjeva) ;
  • enquêtes de terrain auprès des turcophones de Bulgarie, collecte de données audio (Snejana Gadjeva, en lien avec les travaux des chercheurs de l’axe 4 du CREE) ;
  • expertise de traduction en langue bulgare (Gueorgui Armianov, Snejana Gadjeva).

Mots-clefs : changements linguistiques ; changements sociaux ; dynamique sociolinguistique ; variétés standards / non-standards ; linguistique de corpus.

5.3. Corpus et, dictionnaires et outils pédagogiques

Responsable : Antoine Chalvin (CREE)

Ce projet vise à constituer un espace de coopération pour les enseignants-chercheurs qui, au sein du CREE, travaillent à la réalisation d’outils lexicographiques, pédagogiques ou de corpus bilingues, ainsi qu’à l’analyse de ces outils et de leurs modalités d’élaboration ou d’utilisation. Le projet favorise les échanges d’expériences, la diffusion des bonnes pratiques et la familiarisation avec les outils informatiques pertinents pour la réalisation de dictionnaires et de corpus. La réflexion menée dans le cadre du projet s’intéresse également aux nouvelles pratiques de lexicographie collaborative (dictionnaires collaboratifs tels que Wiktionnaire), en analysant leur spécificité par rapport à la lexicographie traditionnelle (comparaison des dictionnaires collaboratifs avec les dictionnaires académiques en utilisant les ressources offertes par le traitement automatique des langues). Les échanges d’expériences et la réflexion collective prendront la forme de journées d’étude associant des chercheurs extérieurs.

Chercheurs associés au projet : Gueorgui Armianov (CREE), Vincent Bénet (CREE & CEFR), Antoine Chalvin (CREE), Oleg Chinkarouk (CREE), Iryna Dmytrychyn (CREE), Kaja Dolar (CREE), Snejana Gadjeva (CREE), Madis Jürviste (Association franco-estonienne de lexicographie, Tartu), Svetlana Krylosova (CREE), Heete Sahkai (Institut de la langue estonienne, Tallinn), Natalya Shevchenko (CREE & CRTT, Lyon-II 2), Olena Saint-Joanis (ELLIAD, Univ. Franche-Comté), Anatoly Tokmakov (Inalco), Marie Stachowitsch (CREE),  Janna Vassilioutchek (CREE), Marie Vrinat-Nikolov (CREE).

Principales collaborations : l’équipe ERTIM de l’Inalco, l’Association franco-estonienne de lexicographie (AFEL, Tartu, Estonie), l’Institut de la langue estonienne (EKI, Tallinn, Estonie), le Centre estonien de ressources linguistiques (EKK, Tallinn), Université Lille 3, Université Jean Moulin Lyon 3, Université de Toulouse 2, Université de Corse, Université de Laval, Université de Milan, Université de Sherbrooke, Jožef Stefan Institute, DFKI – German Research Center for Artificial Intelligence.

Opérations de recherche :

  • lancement, au sein du CREE, du nouveau projet international Réseau de recherches sur les ressources lexicales collaboratives s’intéressant aux questions métalexicographiques qui concernent les dictionnaires, encyclopédies, corpus et autres types de ressources construites de façon collaborative (Kaja Dolar, Antoine Chalvin & Marie Steffens) ;
  • organisation d’une journée d’étude sur les nouvelles pratiques lexicographiques, 2021 (responsable scientifique Kaja Dolar) ;
  • création et développement du Module d'ukrainien pour NooJ en libre accès (dictionnaire électronique 167 000 mots & les grammaires morphologiques et syntaxiques), 2018-2022 (Olena Sait-Joanis) ;
  • publication d’un recueil d’articles sur les marques de registre dans les dictionnaires monolingues et bilingues, 2020 (dir. Georgui Armianov) ;
  • publication d’une méthode du bulgare, 2020 (Snejana Gadjeva & Marie Vrinat-Nikolov) ;
  • création de ressources audio en bulgare, 2017-2018 (Snejana Gadjeva & Georgui Armianov) ;
  • publication du Grand dictionnaire estonien-français = Suur eesti-prantsuse sõnaraamat (GDEF), 2021 (dir. Antoine Chalvin) ;
  • publication d’une méthode de la langue de la presse russe, 2018 (Svetlana Krylosova, Marie Stachowitsch & Anatoly Tokmakov) ;
  • étiquetage sémantique du dictionnaire électronique russe sur le logiciel NooJ : implantation de balises sémantiques hiérarchisées sur la base du dictionnaire de Tuzov, 2017-2022 (Vincent Bénet) ;
  • poursuite du travail sur le Dictionnaire des verbes bulgares (Marie Vrinat-Nikolov, Gueorgui Armianov & Snejana Gadjeva) ;
  • poursuite du travail sur le Dictionnaire des noms et des adverbes bulgares et tableaux grammaticaux, 2021 (dir. Gueorgui Armianov & Snejana Gadjeva).

Mots-clefs : lexicographie, dictionnaires, corpus parallèles, ressources lexicales collaboratives, étiquetage sémantique, logiciel NooJ, apprentissage des langues, argot, bulgare, estonien, finnois, russe, ukrainien.