De nouvelles modalités de recherche sur les archives notariales
Un prototype réalisé avec l’outil Sparnatural propose de nouvelles modalités de recherche sur les archives notariales, à partir de leurs métadonnées sémantisées.

32 000 instruments de recherche
La description des archives permet à tous les publics de faire des recherches afin d’identifier et de sélectionner les documents ou données utiles, puis d’y accéder (directement en ligne ou en faisant une réservation pour une consultation sur place). Cette description est aujourd’hui réalisée par les archivistes conformément à des normes relativement anciennes qui définissent l’organisation et le contenu des instruments de recherche.
Aux Archives nationales, environ 32 000 instruments de recherche ont ainsi été produits, sont mis à jour en continu, et publiés dans la salle de lecture virtuelle. Ils décrivent plusieurs millions d’unités de description (séries de dossiers, dossiers ou pièces). Cependant, la recherche dans ces métadonnées peut être améliorée, notamment en multipliant les points d’accès aux métadonnées. De plus, les technologies utilisables pour mettre à disposition des données sur internet ont beaucoup évolué ces dernières années.
Les bibliothèques ont commencé, il y a quelques années, à travailler à une transformation de leurs catalogues en se fondant sur de nouvelles normes visant à mieux répondre aux besoins des publics (voir à ce sujet le site web de la transition bibliographique).
Les services d’archives se lancent en ce moment dans le même processus, en se fondant sur une norme toute récente, Records in Contexts (RiC). Il s’agit d’identifier dans les métadonnées les entités qui s’y trouvent décrites (les documents, mais aussi les personnes, organismes, lieux, activités, dates…), et de regrouper les éléments d’information relatifs à chacune de ces entités (ces informations étant souvent dispersées ou répétées aujourd’hui dans plusieurs instruments de recherche), enfin de relier ces entités entre elles par des relations précises et explicites, qui deviennent elles-mêmes interrogeables. On produit alors ce qu’on appelle un graphe d’entités liées, qui permet de s’affranchir des contraintes des collections d’inventaires juxtaposés, et de lier aussi les entités que l’on a décrites avec d’autres entités décrites par d’autres institutions. Ce graphe peut techniquement prendre la forme d’un jeu de données sémantisées (ou données liées, pour le web de données).
En chiffres
72 665 groupes de documents (fonds, séries, liasses, dossiers de clients…)
400 570 actes notariés décrits, à ce jour, au sein des liasses
104 383 mentions d’actes relevées au sein des 3 135 répertoires
629 246 personnes (dont 3 213 personnes dotées d’un IRI)
530 organismes (dont 528 dotés d’un IRI)
15 559 lieux (dont 15463 dotés d’un IRI)
Un démonstrateur conçu avec des utilisateurs
Les Archives nationales (via leur Lab) travaillent sur ce sujet depuis plusieurs années. Elles ont notamment réalisé en 2022, en collaboration avec la société Sparna et en impliquant des utilisateurs via des ateliers, un démonstrateur qui permet de faire, d’une manière totalement nouvelle et intuitive, des recherches dans le tiers des métadonnées qui décrivent les archives des notaires de Paris conservées aux Archives nationales.
Ces métadonnées, jusqu’ici stockées dans plus de 1 570 inventaires et 1 100 notices de producteurs, ont été transformées en un seul graphe, conforme à l’ontologie Records in Contexts Ontology (RiC-O) dans sa version 0.2.
Les deux formulaires mis en place permettent d’interroger ce graphe via de nombreux points d’accès (archives, personne, notaire, étude, voie parisienne…), de sélectionner successivement relations et entités liées à ces points d’accès, bref de construire pas à pas sa propre question, puis une fois les résultats affichés, d’exporter si on le souhaite ces résultats, enfin de consulter la notice relative à l’entité cherchée. On peut ainsi poser des questions que la salle de lecture virtuelle, dans son état actuel, ne permet pas de poser. Le dispositif de recherche est plus intuitif et donne une plus grande liberté.
Le projet, financé en grande partie par le ministère de la Culture, se poursuit aujourd’hui. De nouvelles versions des formulaires de recherche, qui ont été construits en utilisant un logiciel appelé Sparnatural, seront disponibles en 2025.
De nouvelles évolutions du logiciel Sparnatural sont par ailleurs en cours, financées en partie par les Archives nationales. En même temps, le Lab va travailler à mettre le graphe de connaissances en conformité avec la version 1.0 de l’ontologie RiC-O, publiée en décembre 2023, à inclure dans le graphe les métadonnées de plus d’archives notariales, et à corriger des défauts dans les métadonnées d’origine, que le travail réalisé a permis de mieux cerner.
Pour aller plus loin
Documentation du projet
Exemples de recherche dans le démonstrateur :
> sur les archives relatives à Jean-Baptiste Poquelin ;
> sur les types de documents des actes notariés datant de 1848, avec les cotes et les dates de ces documents.
Vidéo de la journée de présentation de la première phase du projet (juin 2022).
Voir aussi « Décrire les archives ».