Interview de Jacques Fredj, directeur du Mémorial de la Shoah

  • Questions mémorielles

  • Seconde Guerre mondiale (1939-1945)

Publié / modifié le : 28/05/2025

Jacques Fredj, directeur du Mémorial de la Shoah, a répondu aux questions de Mémoire d'avenir n°58. Il expose ici l'usage de l'intelligence artificielle pour extraire et traiter les données de plus de 31 000 fiches de police. Des fiches issues du fichier de contrôle des Juifs de Paris et ses alentours, recensés auprès de la police en 1940.

« « L'intelligence artificielle pour traiter le « fichier juif » »

Jacques Fredj, directeur du Mémorial de la Shoah

Le contexte

Depuis 2024, les Archives nationales et le Mémorial de la Shoah travaillent ensemble à un accès sécurisé à distance au « fichier de contrôle » des juifs de Paris et de sa proche banlieue, établi sous l'Occupation.

Partiellement détruit vers 1947, ce fichier comprend aujourd'hui 31 584 fiches, concernant des personnes presque toutes arrêtées.
 

Comment s'est imposée l'intelligence artificielle pour ce travail minutieux, qui va nécessiter plusieurs années ?

Notre objectif est de saisir l'intégralité des fiches. Le choix d'utiliser l'IA pour nous aider à l'atteindre résulte de la convergence de plusieurs facteurs.

D'abord nous avons pu effectuer un test sur un fichier numérisé, en grande partie dactylographié et plutôt bien structuré. Je veux parler du fichier du recensement des Juifs de la préfecture de police de 1941, connu sous le nom de « fichier de contrôle ».

Le deuxième facteur, c'est la rencontre avec les ingénieurs de Teklia qui ont proposé de mettre leur savoir-faire à la disposition de ce projet d'une haute sensibilité pour nous.

Comment sont vérifiées les données extraites par l'intelligence artificielle ?

Avant de mettre ces informations à la disposition du public, nous avons décidé d'effectuer une relecture complète des données compilées par la machine. À cet effet, nous avons mis en place une équipe mixte de relecteurs, d'archivistes et de bénévoles triés sur le volet, hébergée au Centre d'accueil et de recherche des Archives nationales, à Paris. C'est un très bel exemple de coopération entre nos deux institutions.

Est-ce que cela peut ouvrir vers d'autres projets ?

Il nous faut déjà terminer ce fichier, dont il reste, à ce jour, 86 % du corpus à relire. Ensuite, étendre ce projet est très tentant mais les autres fichiers sont manuscrits, et plus difficiles à manier.

Le fichier du camp de Drancy, par exemple, est constitué de fiches très différentes les unes des autres, avec des informations portées de manières non structurées. Il faudra faire des tests pour vérifier la faisabilité d'une telle opération.

En savoir plus

Suivez-nous sur les réseaux sociaux et Abonnez-vous à notre lettre d’information