Carnet de recherche Approches Computationnelles du Monde Chinois
Séance 2 (Jeudi 4 décembre, 12h-14h) — Bridging the Close/Distant Reading Divide : Analyses de corpus historiques sur la Chine moderne (19-20e siècles)
Cécile Armand, CNRS (IAO)
Christian Henriot, Aix-Marseille Université (Irasia)
Depuis une trentaine d’années, les sources historiques numériques accessibles aux chercheurs de la Chine moderne se sont multipliées. Cette numérisation massive ouvre de nouvelles perspectives, mais soulève aussi des défis inédits, liés non seulement à l’échelle des corpus, mais aussi à leur multilinguisme, à la diversité des genres et des supports, ainsi qu’aux biais introduits par des programmes de numérisation souvent opaques. L’essor de l’intelligence artificielle (IA) a renforcé ce mouvement, invitant à repenser les corpus non plus seulement comme des textes à lire individuellement, mais comme des réservoirs de données requérant des méthodes de traitement automatiques. Pour autant, les outils computationnels demeurent encore largement sous-exploités, voire mal compris par les historiens, de sorte que la richesse de ces corpus et leur potentiel de transformation historiographique restent en grande partie inexplorés.
Cette session présentera les travaux du projet ENP-China, qui s’efforce de relever ces défis en intégrant pleinement les méthodes computationnelles au cœur de la recherche historique. Le projet s’attache à structurer et à enrichir sémantiquement de vastes corpus textuels (presse, annuaires, archives, journaux intimes, dictionnaires biographiques, données du web), disponibles en texte intégral, et à développer des méthodes adaptées pour extraire, organiser, et analyser l’information historique qu’ils contiennent. A travers une collaboration inédite entre historiens et chercheurs en informatique, ce travail a conduit au développement de la Modern China Textual Database (MCTB) et de l’application HistText, un outil basé sur l'IA dédié à la construction et à l’analyse de corpus sur mesure. Des études de cas viendront illustrer concrètement comment cet écosystème peut renouveler notre connaissance de la Chine moderne et contemporaine.
Durée: 00:30:25