Pérenniser

L’archivage numérique repose sur des principes et une stratégie de pérennisation.

© DR

Les principes de l’archivage numérique

Le Manuel de préservation numérique de la Cellule nationale de veille sur les formats (CNVF) qualifie, en 2019, la pérennisation comme une « série d’activités jugées nécessaires pour garantir un accès continu aux objets numériques aussi longtemps que nécessaire […] au-delà des limites de la défaillance des médias ou des changements technologiques et organisationnels ».

Archiver et pérenniser les données numériques ne se limitent donc pas à de simples opérations de conversion de formats, mais impliquent de garantir : 

  • l’intelligibilité et l’exploitabilité dans le temps des données, au-delà de l’obsolescence technologique de leurs environnements applicatifs de production, de leurs formats et de leurs supports ;
  • leur intégrité ;
  • leur authenticité (le fait que leur contenu n’a pas été modifié et que les traitements pour l’archivage sont tracés).

Le patrimoine archivistique numérique reflète la société et ses pratiques. Il suit donc l’évolution et la généralisation des outils informatiques dans l’administration et de leurs supports de stockage. Aussi, quand, dans les années 1980, les outils informatiques se sont déployés dans l’administration, les Archives nationales ont dû mettre en place des outils et des modes opératoires, afin de collecter, classer, conserver et communiquer au public ce nouveau type d’archives. 

Au tournant des années 2000-2010, les processus de dématérialisation et d’e-administration se généralisent ; les archives nativement numériques se sont alors considérablement accrues. Les Archives nationales ont ainsi requestionné leurs pratiques et leurs outils d’archivage numérique. 

Une démarche pionnière

Les Archives nationales ont pris en compte la question des archives électroniques au début des années 1980 avec le système Constance – pour « CONservation et STockage des Archives Nouvelles Constituées par l’Électronique » – dédié au traitement de ce type d’archives. Il a permis de les conserver dans leur intégrité et de les garder intelligibles sans limitation de durée : un défi majeur face à la rapidité de l’obsolescence technique !

Les principes retenus :

  • rendre les archives numériques accessibles en dehors des systèmes qui les ont produits ; 
  • permettre à n’importe quel utilisateur de les décoder sur le temps long.

Les premiers versements étaient essentiellement composés de fichiers d’enquêtes statistiques, notamment en provenance de l’Insee, mais aussi des services statistiques de plusieurs ministères : Agriculture, Équipement, Industrie, etc. 

Ces fonds sont composés des fichiers électroniques de données et de la documentation technique s’y rapportant et permettant de conserver la structure des données dans le temps, de manière à pouvoir continuer à les interroger. 
Par exemple, l’archivage des recensements de population de l’Insee de 1962, 1968, 1975 et 1982 permet d’approfondir la réflexion sur la méthodologie à adopter. Ils constituent, aujourd’hui, des archives historiques très importantes pour la recherche.

En chiffres

200

millions de fichiers nativement numériques, conservés Archives nationales, en 2023

127

téraoctets de données accessibles

Pérenniser aujourd’hui, une stratégie globale

Les Archives nationales se sont dotées d’une plateforme d’archivage numérique qui s’appuie sur la solution logicielle Vitam. Elle vise à collecter, gérer, conserver et communiquer les archives numériques issues des ministères, des opérateurs publics de l’État et de dons d’archives privées. 

La stratégie de pérennisation de ces archives numériques repose sur l’association au sein d’un même paquet d’information appelé SIP (submision information package) des données et de leurs métadonnées (gestion, description, format, poids, empreinte…). La stratégie de pérennisation comprend donc tout un ensemble de moyens techniques, humains et organisationnels qui permettent de garantir le maintien de ce lien entre données et métadonnées assurant ainsi la lisibilité et l’exploitabilité dans le temps des archives numériques.
Les échanges de données et métadonnées s’appuient sur le standard d’échanges pour l’archivage (SEDA).

Une politique des formats sur trois niveaux d’engagement

Pour assurer une pérennisation dans le temps des données, les Archives nationales ont défini une politique de formats qui prend la forme d’un tableau qui indique pour différentes catégories de données (données structurées, bureautiques, messageries, images, audiovisuelles, etc.) :

  • des formats « acceptés » que les Archives nationales s’engagent à préserver avec audit régulier. Les missions des archives au sein des ministères, en charge de la collecte, doivent inciter les producteurs à favoriser ces formats ;
  • des formats « tolérés », collectés et conservés en l’état, sans engagement sur leur maintenabilité dans le temps ;
  • des formats « refusés » qui ne sont pas collectés en raison de problématiques techniques ou en l’absence de valeur juridique ou d’intérêt historique.

Ce tableau reflète l’état des connaissances et la politique format de l’institution à la date de publication du tableau. Il est ainsi régulièrement mis à jour.

Consulter le tableau de la politique de format

Formats de numérisation des archives sonores et audiovisuelles 

Nature du support original : film      

Format pour l’archivage : MKV/FFV1    

Format de diffusion : Mpeg4 AVC part10 (H264)
 

Nature du support original : vidéo    

Format pour l’archivage : MKV/FFV1    

Format de diffusion : Mpeg4 AVC part10 (H264)

Nature du support original : son   

Format pour l’archivage : WAVE    

Format de diffusion : MP3

Suivez-nous sur les réseaux sociaux et Abonnez-vous à notre lettre d’information