Le projet Oresm : « Œuvres et Référentiels des Étudiants, Suppôts et Maîtres de l’Université de Paris au Moyen Âge »

Oresm est un projet qui vise à collecter, à sémantiser et à valoriser des données relatives à l’histoire de l’université de Paris et aux personnes liées à cette université entre le XIIe et le XVIe siècle, en les rendant accessibles et interrogeables à partir d’un portail web dédié.

Règles de vie des collégiens du collège fondé par Jean de Hubant, illustrées dans le cartulaire de l’Ave Maria (1346). Cartulaire du collège de Hubant
Règles de vie des collégiens du collège fondé par Jean de Hubant, illustrées dans le cartulaire de l’Ave Maria (1346). Cartulaire du collège de Hubant, AE/II/408 (ancien MM//406). © Archives nationales de France

Oresm est un projet soutenu et co-financé par le GIS CollEx-Persée, porté conjointement depuis 2020 par la Bibliothèque interuniversitaire de la Sorbonne (BIS) et par le laboratoire de médiévistique occidentale de Paris (LaMOP – UMR 8589) avec de nombreux partenaires. 

Les Archives nationales y contribuent très activement par l’intermédiaire de deux départements de la direction des Fonds : le département du Moyen Âge et de l’Ancien Régime, qui détient la majorité des archives anciennes de l’Université et des collèges parisiens, et le Minutier Central des notaires parisiens, qui conserve les actes notariés où peuvent apparaître maîtres et étudiants. Le Lab des Archives nationales, en raison de son expertise dans le domaine de l’ingénierie des données et des connaissances, est particulièrement impliqué dans les aspects numériques du projet.

Le projet vise à réinventorier et enrichir les notices des documents issus des archives de l’Université et des collèges parisiens du XIIIe au XVIe siècle, actuellement conservés dans les différentes institutions partenaires. Ces notices sont également collectées, structurées, interconnectées et valorisées dans un portail commun.

Ce portail ambitionne à terme :

  • de réunir au sein d’un inventaire virtuel les documents qui font partie du fonds d’archives de l’université et qui sont aujourd’hui dispersés entre les institutions partenaires ;
  • d’interagir avec un référentiel des personnes liées à l’université de Paris, agrégeant les données nominatives issues des dépouillements, les informations de la base  Studium Parisiense  (gérée par le LaMOP) et celles d’autres référentiels et bases de données spécialisées, et permettant aux utilisateurs de soumettre des demandes de réconciliation (alignement) de leurs données avec ce référentiel ;
  • de proposer un répertoire des manuscrits liés aux personnes ayant gravité autour de l’université de Paris.
     

Plusieurs travaux sont en cours d’achèvement. Un inventaire virtuel a été constitué en XML/EAD, qui décrit les sous-ensembles composant le fonds d’archives de l’Université. Des dépouillements fins d’archives ont été réalisés, pour identifier et décrire précisément les pièces d’archives aujourd’hui dispersées, en particulier celles provenant de plus de trente collèges parisiens et conservées dans la série M des Archives nationales.

Les données issues de ces dépouillements font actuellement l’objet de traitements afin de produire et de rendre finement exploitable un graphe de connaissances : modélisation du graphe à l’aide d’une extension de l’ontologie Records in Contexts Ontology (RiC-O), conversion des données en triplets RDF conformes à cette ontologie. L’inventaire virtuel en XML/EAD sera également converti en données RDG conformes à la même ontologie, qui seront agrégées au graphe. Certains référentiels des Archives nationales seront eux aussi intégrés à ce graphe.

Le graphe obtenu sera prochainement importé dans une instance du logiciel GraphDB, installée sur un serveur de la BIS. Une interface de recherche sera mise en place ; elle utilisera en particulier l’outil Sparnatural et devrait ainsi permettre une interrogation à la fois intuitive et fine du graphe. Cette interface sera intégrée au portail web Oresm.
Parallèlement, le référentiel des personnes liées à l’Université de Paris, baptisé Buridan, est en cours de réalisation sous la responsabilité du LaMOP et avec l’aide de la société Logilab. Il contiendra en particulier des données extraites de la base Studium Parisiense, celles issues des dépouillements d’archives, et d’autres bases de référence, également sémantisées, et qui pourront être alignées entre elles afin de consolider les connaissances sur ces personnes, puis mises à jour le cas échéant. 

Buridan sera doté d’une interface qui utilisera deux APIS également développées dans le cadre du projet : une API de recherche, et une API d’alignement de données externes avec les données intégrées à Buridan. Le processus d’alignement sera fondé sur le calcul de scores de correspondance conformément à des règles spécifiques, pour une série de critères utilisables pour ces données incomplètes et souvent incertaines (comme le nom des personnes, leur période d’activité, leur grade dans une discipline). Les données du graphe de connaissances issu des descriptions des archives de l’Université et les données de Buridan seront interconnectées ; il sera possible de passer de l’un à l’autre.
Tous les travaux techniques sont menés par (ou avec l’aide de, pour Buridan) une ingénieure recrutée pour un an par la BIS, qui travaille en concertation avec les représentants de tous les partenaires, et en collaboration étroite avec le Lab des Archives nationales.

Courant 2025, ces dispositifs très innovants, à la fois en matière de valorisation de connaissances sur les archives médiévales de l’Université de Paris, et d’aide à la recherche en histoire sur les personnes liées à cette université, devraient être mis en ligne.

Pour aller plus loin


   • Le carnet de recherche du projet Oresm.
   • La présentation de la preuve de concept réalisée en 2021, dans le cadre de la journée d’étude Oresm du 26 novembre 2021.
   • La présentation du travail réalisé en 2023 sur le volet numérique du projet, faite le 15 novembre 2023 lors de la Journée d’étude internationale sur les premières implémentations de Records in Contexts : support de présentation et enregistrement vidéo.

Suivez-nous sur les réseaux sociaux et Abonnez-vous à notre lettre d’information