ATTENTION : Une migration de la base de données est programmée jeudi 21 août.
Elle peut occasionner des problèmes d'accès à Sciencesconf. |
|
Contexte et objectifs du colloque Dans un contexte mondial où la numérisation massive des productions langagières transforme notre rapport au savoir, à la langue et aux discours, l’intelligence artificielle (IA) s’impose comme un levier incontournable de mutation épistémologique. La linguistique contemporaine ne peut rester imperméable à ces bouleversements : elle se redéfinit aujourd’hui à travers des approches croisées alliant sciences du langage, traitement automatique des langues (TAL), humanités numériques, analyse textométrique et ingénierie des corpus (Silberztein, 2019; Lebart, Salem & Berry, 1998). Cette convergence interdisciplinaire affecte profondément nos manières de penser, de produire et de transmettre les savoirs linguistiques. En effet, la constitution des corpus numériques – qu’ils soient oraux, écrits, multimodaux, littéraires ou spécialisés – devient à la fois un geste scientifique, politique et technique. Comme le rappellent Habert, Nazarenko et Salem (1997), la constitution d’un corpus est toujours le résultat de choix méthodologiques et idéologiques qui orientent la sélection et l’annotation des données. À cet égard, Pearson (1998) souligne que « la compilation d’un corpus n’est jamais un acte neutre ; elle implique toujours des décisions qui affectent la représentativité et le biais des données collectées ». Les critères de sélection, d’annotation et de structuration posent dès lors une question essentielle de représentativité : quelles variétés linguistiques sont valorisées ? Quelles voix sont ignorées ? Quelles cultures sont invisibilisées dans les corpus actuels ? Parallèlement, l’essor fulgurant de l’IA dans les sphères scientifiques et médiatiques s’accompagne d’une évolution terminologique accélérée. Les concepts comme apprentissage profond, réseaux de neurones, transformers ou modèles de langage bouleversent les catégories traditionnelles. Dans cette perspective, Gaudin (2003) rappelle que la terminologie est étroitement liée aux dynamiques sociales et scientifiques : elle reflète l’évolution des savoirs et l’institutionnalisation des domaines. Cette transformation s’observe également dans la didactique des langues. Les corpus – en particulier oraux – constituent « des ressources importantes pour l’apprentissage des langues : phénomènes de collocation et phraséologie, microsyntaxe des entrées lexicales, étude des langues de spécialité, typologie des textes » (Chambers, Mélanges CRAPEL n°31). Lorsqu’ils sont enrichis et analysés à l’aide d’outils numériques ou d’IA, ces corpus renforcent encore leur potentiel pédagogique : extraction automatique de phénomènes linguistiques, contextualisation discursive et adaptabilité pour différents profils d’apprenants. Toutefois, leur intégration en classe doit rester critique : quels outils pour quels publics ? Quelle place pour l’interprétation humaine ? Comment assurer une adéquation avec la diversité des apprenants ? Enfin, l’irruption de l’IA dans le champ des sciences du langage appelle une réflexion critique sur les savoirs qu’elle produit. Derrière la puissance des modèles statistiques, que disent les biais algorithmiques, les processus de labellisation automatique ou les données d’entraînement sur nos représentations du langage ? Comme l’affirment Ducel, Névéol & Fort (2022), « l’équité et l’absence de biais stéréotypés deviennent des critères de qualité importants à prendre en compte dans les applications de traitement automatique des langues ». Dans cette perspective, la linguistique outillée par l’IA nécessite un regard épistémologique sur ses fondements. C’est dans cet esprit que s’inscrit ce colloque, qui se veut un espace de rencontre, de partage et de questionnement sur les pratiques linguistiques, terminologiques et didactiques à l’ère de l’intelligence artificielle. Il rassemblera chercheurs, enseignants, doctorants et praticiens autour d’analyses croisées, d’expériences de terrain et de réflexions prospectives. Objectifs du colloque
Les propositions de communication pourront porter sur les thématiques ou les axes suivants : Axe 1 : Ingénierie des corpus à l’ère de l’IA
Axe 2 : Terminologie, néologie et IA
Axe 3 : Corpus numériques et apprentissage linguistique
Axe 4 : Enjeux critiques et épistémologiques de l’IA en linguistique
Bibliographie indicativeChambers, A. (2009). Les corpus oraux en français langue étrangère : authenticité et pédagogie. Mélanges CRAPEL, (31), 15‑33. https://fr.scribd.com/document/296349025/Les-Corpus-Oraux-en-Francais-Langue-Etrangere Daille, B., & Romary, L. (Éds.). (2001). Traitement automatique des langues, 42(2), numéro spécial : Traitement automatique des langues et linguistique de corpus. Paris : ATALA. Ducel, F., Névéol, A., & Fort, K. (2022). La recherche sur les biais dans les modèles de langue est biaisée : état de l’art en abyme. Traitement Automatique des Langues, 64(3). https://www.atala.org/content/tal_64_3_5 Gaudin, F. (2003). Socioterminologie : Une approche sociolinguistique de la terminologie. Bruxelles : De Boeck. Ganascia, J.-G. (2017). Le mythe de la singularité : Faut-il craindre l'intelligence artificielle ? Paris : Le Seuil. Ganascia, J.-G. (2024). L’I.A. expliquée aux humains. Paris : Seuil. Habert, B., Nazarenko, A., & Salem, A. (1997). Les linguistiques de corpus. Paris : Armand Colin. Lebart, L., Salem, A., & Berry, L. (1998). Exploring textual data. Dordrecht : Kluwer Academic Publishers. Marie-Anne Paveau. (2015). Conversion numérique et modification épistémologique. Analyser les discours natifs du web (Conférence, 15 septembre 2015). La pensée du discours. https://doi.org/10.58079/ssp1 Pearson, J. (1998). The compilation of corpora. In A. Wilson, P. Rayson, & A. McEnery (Eds.), Corpus linguistics around the world (pp. 3–22). Amsterdam : Rodopi. Puren, C. (2011). La didactique des langues face à l’innovation technologique. In Usage des nouvelles technologies et enseignement des langues étrangères – UNTELE (pp. 3–14). Compiègne : Actes du colloque. Romero, M., Heiser, L., & Lepage, A. (Dirs.). (2023). Enseigner et apprendre à l’ère de l’intelligence artificielle : Acculturation, intégration et usages créatifs de l’IA en éducation [Livre blanc]. Canopé. https://hal.science/hal-04013223 Silberztein, M. (2019). Les outils informatiques au service des linguistes : présentation. Langue française, 203(3), 7–14. https://doi.org/10.3917/lf.203.0007 Vezzani, F. (2022). Terminologie numérique : Conception, représentation et gestion. Lausanne : Peter Lang Verlag. |