Les actualités de l'unité NuAnCES en ligne

actu20171213 NuAnCES carnethypotheseNuAnCES (Numérisation et Analyse de Corpus pour la rEcherche Scientifique) est l’une des trois unités fonctionnelles de la plate-forme technologique de la MSHE Ledoux, avec GeoBFC (1) et ESCCo (2). Elle vient de se doter d’un blog d’actualité sous la forme d’un carnet de recherche Hypothèses. Entretien avec Sébastien Jacquot, nouveau responsable de l’unité NuAnCES.

Sébastien Jacquot vous venez de prendre la responsabilité de l’unité NuAnCES, pouvez-vous vous présenter ?
Je suis ingénieur en développement et déploiement d’applications au laboratoire ELLIADD (3). Je développe des outils dédiés à l’exploration et à l'analyse de données textuelles, notamment l’analyse statistique. Au laboratoire ELLIADD, je contribue par exemple au développement du logiciel TXM en collaboration avec l’institut IHRIM (4) de l’ENS de Lyon. Il s’agit d’un logiciel de textométrie, c’est-à-dire d’analyse quantitative et qualitative des textes. Parallèlement, je développe des outils pour l’exploitation avancée, la diffusion et la valorisation d’archives multimédia. J’ai ainsi travaillé à la constitution de fonds d'archives textuelles et audiovisuelles tels que Bagouet, Lagarce, Liptay, Louis-Combet… et au développement des outils liés à leur exploitation (notamment la plateforme audiovisuelle FANA). Ces activités prennent place dans le pôle de recherche « Archive, bases, corpus » de la MSHE Ledoux et l’action FANUM (Fonds d’Archives NUMériques). Mes relations avec la MSHE et la plate-forme technologique sont donc anciennes. A présent, je prends la responsabilité de l’unité NuAnCES, en remplacement de Virginie Lethier, qui elle-même a pris la responsabilité de la plate-forme technologique dans son ensemble.

Pouvez-vous présenter l’unité NuAnCES ?
NuAnCES est constituée d’un ensemble de matériels et de compétences liées aux opérations de numérisation, de structuration des données et à leur analyse. L’unité accompagne les projets sur l’ensemble de la chaîne, qui va de la numérisation à l’analyse, en passant par la constitution de corpus exploitables. Elle est ouverte à toutes les disciplines de sciences humaines et sociales, qui sont confrontées à des traitements similaires des données : numérisation, structuration et préparation de corpus. Les besoins ne se limitent pas aux sciences du langage ou à la littérature mais incluent également la sociologie, avec les données issues des enquêtes de terrain, la géographie…
En termes d’équipement, nous avons des scanners très performants, avec lesquels on peut numériser tous types de documents : des plans, des photos, des manuscrits, de grands formats comme les journaux par exemple, des livres… Plusieurs des scanners sont non destructifs, et permettent ainsi de numériser des archives anciennes et fragiles. Nous avons également un scanner 3D pour la numérisation d’objets. Et nous souhaiterions développer l'aspect multimédia de la plate-forme avec notamment un support à la numérisation de documents audiovisuels.
La plate-forme ne se limite cependant pas à cet ensemble d’équipements et aux compétences techniques qui l’accompagnent. C'est aussi un lieu de réflexion et d’élaboration d’outils méthodologiques et conceptuels concernant la constitution, le traitement et l’analyse des données. Nous développons et transférons des compétences sur l’ensemble du cheminement qui mène à l’analyse ; ce cheminement n’est pas neutre, il présente des enjeux pour la recherche dans la mesure où il a des impacts sur les résultats. Avec cet ensemble de matériels et grâce aux compétences des chercheurs et des ingénieurs, l’unité NuAnCES est donc en mesure d’aider les chercheurs mais aussi les institutions à construire des données exploitables, partageables et pérennes.

NuAnCES ne s’adresse pas uniquement aux chercheurs ?
NuAnCES est avant tout impliquée dans des projets scientifiques – des projets en outre avec une dimension pluridisciplinaire forte. Mais, cette expertise peut aussi intéresser d’autres institutions, comme des bibliothèques, des musées, des associations ou même des entreprises. L’unité NuAnCES a récemment accompagné le Crédit Agricole de Franche-Comté dans un projet de valorisation des archives de la banque. Ce travail est notamment visible à la « maison de Salins-les-Bains », qui a vu la naissance du Crédit Agricole à la fin du XIXe siècle.

NuAnCES vient d’ouvrir un carnet de recherche Hypothèses, pouvez-vous expliquer de quoi il s’agit et pourquoi le faire maintenant ?
L’unité NuAnCES est née en 2015, elle est donc relativement récente. Le travail réalisé sous la houlette de Virginie Lethier a d’abord été de développer et structurer l’unité. Communiquer ne peut venir que dans un second temps. Maintenant, nous sommes prêts pour communiquer en direction de la communauté scientifique, des institutions et du grand public. C’est la raison d’être de ce carnet Hypothèses.
Le carnet de recherche est un service offert par OpenEdition, un portail de ressources électroniques pour les sciences humaines et sociales. Il se présente sous la forme d’un site web, avec différentes rubriques recensant le matériel de l’unité NuAnCES, les données, les projets de recherche et les publications, mais aussi les méthodes et les outils que l’on y développe… Il est régulièrement actualisé par des billets, qui peuvent porter sur une recherche en cours, une publication qui vient de sortir, un aspect méthodologique… L’avantage du carnet Hypothèses est qu’il est proche de l’actualité de la recherche et son écriture est nettement moins formelle que celle d’un article scientifique. On peut également ajouter des photos et des liens permettant aux lecteurs de s’arrêter dans le cheminement proposé. On peut présenter ce que l’on fait et les problèmes que l’on rencontre, et alors faire appel à d’autres chercheurs. C’est un lieu de partage et d’échange.
En somme, c’est une manière à la fois de rendre visible nationalement le travail fait dans l’unité NuAnCES et de tisser des liens avec des chercheurs qui travaillent sur les mêmes problématiques, des problématiques connexes ou avec des institutions qui peuvent être intéressées par notre expertise.
Pour le moment, nous avons publié des billets de vulgarisation d’articles scientifiques, dont l’un par exemple porte sur l’utilisation de la textométrie en géographie. Elvire Mathis, stagiaire à l’unité NuAnCes, finalise un billet de présentation du travail mené sur un corpus de livrets d’opéra de la fin du XVIIe et début XVIIIe siècles accessible sur le portail TXM Web porté par ELLIADD, la version en ligne du logiciel de textométrie. Ce portail, hébergé par la plate-forme technologique de la MSHE, est destiné à accueillir d'autre corpus.
Pour la suite, nous projetons de publier des tutoriels de nos outils et des guides méthodologiques.
Toute personne intéressée peut retrouver les actualités de l’unité NuAnCES sur hypothèses et aussi sur le site de la MSHE, puisque les cinq derniers billets du carnet de recherche sont également publiés sur la page dédiée à la plate-forme technologique de la MSHE Ledoux.


(1) Plate-forme Géomatique Bourgogne Franche-Comté
(2) Expérimentation pour les Sciences du Comportement et de la Cognition
(3) Éditions, langages, littératures, informatique, arts, didactiques, discours
(4) Institut d’histoire des représentations et des idées dans les modernités