Conférence

eScriptorium : plateforme de transcription automatique

Peter Stokes et Benjamin Kiessling - 08 octobre 2021
ENS - PSL

Présentation d'eScriptorium : une plateforme d’applications web pour la transcription automatique de documents manuscrits ou imprimés, par Peter Stokes et Benjamin Kiessling (UMR 8546 AOROC - CNRS/ENS/EPHE) dans le cadre de l’Atelier Digit_Hum 2020-2021 : Sciences de l'Antiquité et humanités numériques

eScriptorium, dans sa forme finale, est destiné à être un outil pour l'ensemble de la chaîne de production des éditions numériques. Les principaux éléments actuellement mis en oeuvre à cette fin sont une méthode de transcription et d'annotation automatique pour le matériel manuscrit et imprimé par machine. Une attention particulière a été accordée à la réduction des hypothèses implicites sur le matériel à traiter, rendant accessible du matériel qui est habituellement hors de portée des méthodes d'apprentissage automatique, comme les documents historiques, les systèmes d'écriture mal desservis et les cas d'utilisation très spécifiques. Contrairement à de nombreuses autres plateformes, elle est totalement ouverte et prend en charge des interfaces standard (ALTO, PageXML, IIIF) pour l'importation et l'exportation. Non seulement les données restent la propriété de chaque utilisateur, mais également tous les artefacts des différentes méthodes d'apprentissage automatique de la plate-forme qui peuvent être utilisés indépendamment de toute installation particulière d'escriptorium, mais également en dehors d'escriptorium lui-même par le biais d'installations locales du moteur ROC Kraken. En tant que telle, la plate-forme s'intègre facilement dans une variété de workflows, des petits projets personnels des utilisateurs individuels à la numérisation à grande échelle dans des projets d'archives.