logo

LA GESTION DE DONNÉES

Les fichiers obtenus par numérisation peuvent être enrichis de métadonnées, techniques et documentaires, directement reliées au media grâce à une base de données. Le transfert des archives sur support numérique facilite de beaucoup leur accessibilité et leur usage mais pose quelques problèmes de conservation.

Une gestion informatique rigoureuse

La gestion de ces médias et de leurs multiples copies est un métier complexe et onéreux. La conservation des médias numériques est d’autant plus important que la plupart des documents audiovisuels que l’Institut reçoit aujourd’hui pour conservation, sont déjà en numérique.

Il est nécessaire d’une part de maintenir les systèmes informatiques qui créent les copies numériques de sauvegarde et d’autre part, de suivre l’évolution de ces systèmes pour pouvoir « relire » cinq ou dix ans plus tard ces mêmes copies. Cette gestion exige aussi de s’intéresser aux technologies numériques nouvelles comme la virtualisation et l’intelligence artificielle.

Une base de données centrale

La base de données « IAMflow » est un orchestrateur entre les flux techniques et les informations documentaires. Depuis 25 ans, l’Institut fait évoluer cet outil de gestion. Hiérarchisées, toutes ces données permettent d’identifier les documents, de faire le lien avec leurs copies, de garder l’historique de leurs utilisations, bref d’en assurer la complète traçabilité.

La sauvegarde des données numériques

Règle essentielle pour la sauvegarde des données numériques : la copie, régulière et récurrente. C’est pourquoi, à l’Institut, chaque média numérique ou numérisé a deux copies de conservation au minimum. L’élément numérique original est conservé sur deux cartouches LTO distinctes (support magnétique contenant des données numériques) qui sont conservées dans des abris de conservation différents pour minimiser les risques de perte. Chaque copie est recopiée sur un nouveau support tous les cinq ans.

La sauvegarde des métadonnées techniques et documentaires est tout aussi importante. Ce sont des millions de données qui sont conservées dans la base de données et dans des fichiers .txt autonomes, fichiers sauvegardés qui permettront de basculer vers de nouveaux systèmes d’exploitation.

Un Data center dédié

Un péta de données est archivé à l’Institut, aussi bien en archives dites « chaudes » (en accès rapide sur serveur) qu’en archives dites « froides » (accès plus lent, sur disque dur et sur LTO). Ce data center accueille tous les serveurs de production de l’Institut ainsi que l’infrastructure qui gère les réseaux et les applications métiers.