bannière15

Contexte et objectifs du colloque

Dans un contexte mondial où la numérisation massive des productions langagières transforme notre rapport au savoir, à la langue et aux discours, l’intelligence artificielle (IA) s’impose comme un levier incontournable de mutation épistémologique. La linguistique contemporaine ne peut rester imperméable à ces bouleversements : elle se redéfinit aujourd’hui à travers des approches croisées alliant sciences du langage, traitement automatique des langues (TAL), humanités numériques, analyse textométrique et ingénierie des corpus (Silberztein, 2019; Lebart, Salem & Berry, 1998).

Cette convergence interdisciplinaire affecte profondément nos manières de penser, de produire et de transmettre les savoirs linguistiques. En effet, la constitution des corpus numériques – qu’ils soient oraux, écrits, multimodaux, littéraires ou spécialisés – devient à la fois un geste scientifique, politique et technique. Comme le rappellent Habert, Nazarenko et Salem (1997), la constitution d’un corpus est toujours le résultat de choix méthodologiques et idéologiques qui orientent la sélection et l’annotation des données. À cet égard, Pearson (1998) souligne que « la compilation d’un corpus n’est jamais un acte neutre ; elle implique toujours des décisions qui affectent la représentativité et le biais des données collectées ». Les critères de sélection, d’annotation et de structuration posent dès lors une question essentielle de représentativité : quelles variétés linguistiques sont valorisées ? Quelles voix sont ignorées ? Quelles cultures sont invisibilisées dans les corpus actuels ?

Parallèlement, l’essor fulgurant de l’IA dans les sphères scientifiques et médiatiques s’accompagne d’une évolution terminologique accélérée. Les concepts comme apprentissage profond, réseaux de neurones, transformers ou modèles de langage bouleversent les catégories traditionnelles. Dans cette perspective, Gaudin (2003) rappelle que la terminologie est étroitement liée aux dynamiques sociales et scientifiques : elle reflète l’évolution des savoirs et l’institutionnalisation des domaines.

Cette transformation s’observe également dans la didactique des langues. Les corpus – en particulier oraux – constituent « des ressources importantes pour l’apprentissage des langues : phénomènes de collocation et phraséologie, microsyntaxe des entrées lexicales, étude des langues de spécialité, typologie des textes » (Chambers, Mélanges CRAPEL n°31). Lorsqu’ils sont enrichis et analysés à l’aide d’outils numériques ou d’IA, ces corpus renforcent encore leur potentiel pédagogique : extraction automatique de phénomènes linguistiques, contextualisation discursive et adaptabilité pour différents profils d’apprenants. Toutefois, leur intégration en classe doit rester critique : quels outils pour quels publics ? Quelle place pour l’interprétation humaine ? Comment assurer une adéquation avec la diversité des apprenants ?

Enfin, l’irruption de l’IA dans le champ des sciences du langage appelle une réflexion critique sur les savoirs qu’elle produit. Derrière la puissance des modèles statistiques, que disent les biais algorithmiques, les processus de labellisation automatique ou les données d’entraînement sur nos représentations du langage ? Comme l’affirment Ducel, Névéol & Fort (2022), « l’équité et l’absence de biais stéréotypés deviennent des critères de qualité importants à prendre en compte dans les applications de traitement automatique des langues ». Dans cette perspective, la linguistique outillée par l’IA nécessite un regard épistémologique sur ses fondements.

C’est dans cet esprit que s’inscrit ce colloque, qui se veut un espace de rencontre, de partage et de questionnement sur les pratiques linguistiques, terminologiques et didactiques à l’ère de l’intelligence artificielle. Il rassemblera chercheurs, enseignants, doctorants et praticiens autour d’analyses croisées, d’expériences de terrain et de réflexions prospectives.

Objectifs du colloque

    • Examiner les avancées de l'intelligence artificielle dans la construction et l'analyse des corpus numériques : ce premier objectif vise à comprendre comment l'IA peut être utilisée pour construire des corpus numériques représentatifs et analyser de manière efficace les données linguistiques à grande échelle.
    • Comprendre l'impact de l'intelligence artificielle sur l'évolution terminologique : il s'agit ici d'analyser comment l'IA influence la création et l'adaptation des terminologies dans différents domaines, ainsi que les implications de ces changements pour la communication et la compréhension linguistique.
    • Identifier les défis méthodologiques et conceptuels associés à l'utilisation de l'intelligence artificielle dans l'analyse linguistique : cet objectif vise à mettre en lumière les difficultés rencontrées lors de l'application de méthodes basées sur l'IA dans le domaine de la linguistique, et à proposer des pistes pour les surmonter.
    • Promouvoir une approche interdisciplinaire et collaborative dans l'étude des corpus numériques et de l'intelligence artificielle : en favorisant les échanges entre chercheurs issus de différents domaines (linguistique, informatique, sciences cognitives, etc.), ce dernier objectif cherche à encourager une réflexion holistique sur les enjeux et les opportunités de l'IA dans le domaine de la linguistique et de la terminologie.

Les propositions de communication pourront porter sur les thématiques ou les axes suivants : 

Axe 1 : Ingénierie des corpus à l’ère de l’IA

    • Méthodologies de constitution, annotation, et structuration des corpus linguistiques
    • Problématiques liées à la diversité linguistique et à la représentativité
    • Outils et plateformes de collecte et d’analyse : avantages et limites
    • Données issues des réseaux sociaux, forums, blogs : nouveaux terrains, nouvelles méthodes ?

Axe 2 : Terminologie, néologie et IA

    • Créations terminologiques dans le champ de l’IA (lexiques, dictionnaires, glossaires spécialisés)
    • Emprunts et transferts de concepts : entre anglais technique, français et langues locales
    • Traduction et adaptation terminologique : enjeux multilingues
    • Évolution du sens des concepts dans les discours médiatiques, scientifiques et éducatifs

Axe 3 : Corpus numériques et apprentissage linguistique

    • Intégration des corpus dans l’enseignement du FLE/FOS/FOU
    • Didactisation des corpus : quelles modalités ? quels outils ?
    • L'IA comme support d'évaluation et d’adaptation pédagogique
    • Expérimentations en classe ou en contexte universitaire

 Axe 4 : Enjeux critiques et épistémologiques de l’IA en linguistique

    • Biais algorithmiques dans les outils d’analyse linguistique
    • Légitimation ou marginalisation des variétés linguistiques ?
    • L’intelligence artificielle est-elle vraiment “intelligente” linguistiquement ?
    • Réflexions éthiques sur la normalisation des pratiques langagières par les technologies

Bibliographie indicative

Chambers, A. (2009). Les corpus oraux en français langue étrangère : authenticité et pédagogie. Mélanges CRAPEL, (31), 15‑33. https://fr.scribd.com/document/296349025/Les-Corpus-Oraux-en-Francais-Langue-Etrangere

Daille, B., & Romary, L. (Éds.). (2001). Traitement automatique des langues, 42(2), numéro spécial : Traitement automatique des langues et linguistique de corpus. Paris : ATALA.

Ducel, F., Névéol, A., & Fort, K. (2022). La recherche sur les biais dans les modèles de langue est biaisée : état de l’art en abyme. Traitement Automatique des Langues, 64(3). https://www.atala.org/content/tal_64_3_5

Gaudin, F. (2003). Socioterminologie : Une approche sociolinguistique de la terminologie. Bruxelles : De Boeck.

Ganascia, J.-G. (2017). Le mythe de la singularité : Faut-il craindre l'intelligence artificielle ? Paris : Le Seuil.

Ganascia, J.-G. (2024). L’I.A. expliquée aux humains. Paris : Seuil.

Habert, B., Nazarenko, A., & Salem, A. (1997). Les linguistiques de corpus. Paris : Armand Colin.

Lebart, L., Salem, A., & Berry, L. (1998). Exploring textual data. Dordrecht : Kluwer Academic Publishers.

Marie-Anne Paveau. (2015). Conversion numérique et modification épistémologique. Analyser les discours natifs du web (Conférence, 15 septembre 2015). La pensée du discours. https://doi.org/10.58079/ssp1

Pearson, J. (1998). The compilation of corpora. In A. Wilson, P. Rayson, & A. McEnery (Eds.), Corpus linguistics around the world (pp. 3–22). Amsterdam : Rodopi.

Puren, C. (2011). La didactique des langues face à l’innovation technologique. In Usage des nouvelles technologies et enseignement des langues étrangères – UNTELE (pp. 3–14). Compiègne : Actes du colloque.

Romero, M., Heiser, L., & Lepage, A. (Dirs.). (2023). Enseigner et apprendre à l’ère de l’intelligence artificielle : Acculturation, intégration et usages créatifs de l’IA en éducation [Livre blanc]. Canopé. https://hal.science/hal-04013223

Silberztein, M. (2019). Les outils informatiques au service des linguistes : présentation. Langue française, 203(3), 7–14. https://doi.org/10.3917/lf.203.0007

Vezzani, F. (2022). Terminologie numérique : Conception, représentation et gestion. Lausanne : Peter Lang Verlag.

Chargement... Chargement...