Journée d'études : Implémentations de Records in contexts - 5/22 - Session introductives

Archives nationales de France

26/02/2024

SESSION INTRODUCTIVE. RIC DANS SES CONTEXTES - ACTUALITÉS DE RIC ET DE SES RELATIONS AVEC D’AUTRES STANDARDS

PREMIS : un modèle de données et des expressions XML et RDF pour la préservation numérique par Bertrand Caron (expert en modélisation, département des Métadonnées, BnF ; membre du Comité éditorial PREMIS)

[English]
INTRODUCTORY SESSION. RIC IN ITS CONTEXTS -
AN UPDATE ABOUT RIC AND ITS CONNECTIONS WITH OTHER STANDARDS

PREMIS: a data model for digital preservation, and its XML and RDF representations by Bertrand Caron (modeling expert, Metadata Department, Bibliothèque nationale de France; member of PREMIS Editorial Committee)

—

Les premières implémentations de Records in Contexts / Early implementations of Records in Contexts

Le Groupe d'experts sur la description archivistique (EGAD) du Conseil international des archives (ICA) a organisé le 15 novembre 2023 le premier événement international entièrement dédié aux premières implémentations de nouveau standard Records in Contexts (RiC)

voir : https://www.ica.org/fr/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/ pour la description des archives.

Le programme et les supports de présentation, en français ou en anglais, sont disponibles à cette adresse :
https://drive.google.com/drive/folders/1zywJxTuccDjSX-QUrYc4deACs_BTw9z8?usp=drive_link

The Expert Group on Archival Description (EGAD) of the International Council on Archives (ICA) organized on November 15th 2023 the first international event entirely dedicated to early implementations of the new Records in Contexts (RiC) archival description standard https://www.ica.org/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/

The program and the slides of this study day, in French or English, are available at: https://drive.google.com/drive/folders/1zywJxTuccDjSX-QUrYc4deACs_BTw9z8?usp=drive_link

Catégorie

📚

Éducation

Transcription

Afficher la transcription complète de la vidéo

00:00 Bonjour à toutes, bonjour à tous.

00:10 Donc, je vais essayer de vous faire un petit, une présentation rapide de ce format de métadonnées

00:20 cousins en quelque sorte de Ricoh et je vais vous le faire en français.

00:24 Donc, le rêve de toute ma vie professionnelle d'imposer à nos collègues anglophones une

00:28 présentation en français, mais par mensuetude, je vous ai proposé des diapositives en anglais.

00:35 En dix minutes, je vais vous présenter un petit peu le panorama et les caractéristiques

00:41 particulières de Prémis.

00:42 Je n'aurai pas le temps de développer les possibles points de contact entre les deux

00:48 standards, mais ce sont des choses qui, de toute façon, sont en réflexion entre nos

00:54 groupes de travail.

00:55 Donc, je vais vous parler rapidement du modèle de données de Prémis, ses différents outils

01:04 et ses expressions officielles en XML et en RDF.

01:09 Tu peux passer à la suivante.

01:11 Donc, le standard Prémis est un standard.

01:17 Il s'agit de l'acronyme Preservation Metadata Implementation Strategies et il s'agit d'un

01:29 standard de facto qui a été développé à l'origine plutôt dans le milieu des bibliothèques.

01:35 Maintenant, il est utilisé à la fois par les bibliothèques, les archives et dans d'autres

01:40 contextes également.

01:41 À partir de 2005 et donc le contexte, le cas d'usage qu'il tente de problématiser,

01:50 de couvrir, c'est l'information la plus large et la plus commune à tous les types

01:57 de documents dont vous avez besoin pour garantir à long terme la préservation des objets

02:02 numériques.

02:03 Je peux passer à la suivante pour présenter un petit peu ce dont on parle lorsqu'on parle

02:12 de Prémis.

02:14 Prémis, c'est d'abord le document principal, c'est un dictionnaire de données qui présente

02:21 à la fois le modèle de données et ce dictionnaire, cette liste arborescente d'éléments de

02:31 métadonnées qu'on appelle unités sémantiques, "Semantic Units", et qui crée une sorte

02:40 de checklist avec un certain nombre de définitions de tous les éléments nécessaires, tous,

02:47 non pas tous, mais une partie pour la préservation numérique.

02:52 Donc, je vous ai mis également le site, la caractéristique, le standard est maintenu

03:00 par un groupe d'experts, le "Premises Editorial Committee", qui est international, issu de

03:08 plusieurs secteurs, et la maintenance, la partie logistique est assurée par la bibliothèque

03:17 du Congrès.

03:18 Une des caractéristiques également qu'il faut avoir à l'esprit lorsqu'on pense Prémis,

03:22 c'est que, outre le dictionnaire de données, le groupe, le comité éditorial maintient

03:28 également une liste de vocabulaire contrôlée, qui sont des valeurs possibles pour chacune

03:34 de ces éléments de métadonnées, donc par exemple une liste de type d'événements

03:41 de préservation, une liste de type d'algorithme de hachage, d'empreinte numérique, qui est

03:49 maintenue par la bibliothèque du Congrès sur un site dédié à la publication de ces

03:55 vocabulaires web-sémantiques, et qui donc peut avoir un rythme de vie différent en

04:04 termes de mise à jour.

04:05 Voilà, je peux passer à la suivante.

04:07 Le périmètre de Prémis est donc relativement large, il couvre à la fois l'utilisabilité,

04:26 la compréhensibilité, l'intégrité et l'authenticité des objets numérés.

04:33 Voilà, donc cette fameuse pyramide des objectifs de préservation.

04:39 Pour autant, son périmètre est à la croisée de chemin d'un certain nombre de domaines

04:44 existants, et avec lesquels Prémis négocie un périmètre donné, notamment avec les

04:51 métadonnées descriptives, donc là c'est le contact avec Ric O qui est évident, et

04:56 pour lequel, a priori, le recoupement est relativement faible, et seulement pour certains

05:03 cas d'usage.

05:04 Là aussi où Prémis va arrêter son périmètre, c'est pour la description concrète des objets

05:11 numériques par type de contenu, donc dès qu'il s'agit de décrire une image fixe en

05:17 termes techniques, ou une vidéo, Prémis laisse la main à d'autres schémas de métadonnées

05:22 spécialisées.

05:23 Donc le modèle de données de Prémis, il est celui de haut niveau, bien sûr comme

05:34 il est arborescent, il a un certain nombre de groupements à l'intérieur qui vont devenir

05:40 des classes lorsqu'on parle ontologie, mais ici on a ce modèle donné de haut niveau

05:45 qui est relativement simple, avec l'élément principal qui est l'objet numérique, qui

05:51 peut être décrit à quatre niveaux différents, celui du fichier en termes informatiques,

05:57 bien sûr, celui de la représentation numérique, qui est un ensemble de données, de fichiers

06:02 qui va fournir une représentation numérique complète d'une entité intellectuelle.

06:10 Cette entité intellectuelle est hors du périmètre de Prémis, sauf pour un cas particulier,

06:15 sur lequel je ne m'étendrai pas, mais qui permet de traiter aussi des cas d'environnement

06:19 logiciel et matériel pour de l'émulation.

06:21 Mais sinon, c'est là le point de contact avec les autres standards.

06:25 Et puis enfin, au niveau plus bas que le fichier, il y a la possibilité de décrire à l'intérieur

06:29 du fichier des flux, par exemple à l'intérieur d'un conteneur audiovisuel, un flux vidéo,

06:35 un flux audio, un flux textuel synchronisé.

06:37 Ensuite on a les éléments, événements de préservation et agents intervenants là-dedans,

06:42 donc c'est les métadonnées de provenance, globalement, et enfin l'entité droit qui

06:48 présente l'ensemble des informations dont l'entrepôt numérique a besoin pour savoir

06:56 s'il a le droit ou non de réaliser telle ou telle opération de préservation.

07:00 Alors, je vous ai mis une petite image de ce dont ces unités sémantiques dont le dictionnaire

07:11 de données est fait essentiellement, une liste d'éléments, ici il s'agit de "inhibitors",

07:17 donc des mécanismes de protection qui peuvent entraver des opérations de préservation

07:22 avec toujours les contraintes d'utilisation, le "rational", donc la raison pour laquelle

07:28 il est souhaitable de conserver cette information-là, et des notes d'application et d'usage.

07:34 Voilà ce dont est faite la structure de ce dictionnaire de données, des éléments,

07:41 des atomes de ce dictionnaire.

07:43 Les usages de prémisses sont de nature un petit peu différente, les différents contextes

07:53 dans lesquels on les utilise, je vais les passer rapidement.

07:56 D'abord, le plus traditionnellement, et le plus de manière évidente, c'est dans

08:02 ce qu'on appelle les "manifestes", donc les fichiers de métadonnées qui sont embarqués

08:07 dans des paquets d'informations.

08:09 Généralement, assez souvent, prémisses sont utilisées à l'intérieur de fichiers

08:14 METS, et donc le groupe de travail a produit un document d'utilisation qui décrit la

08:26 façon dont ces deux standards doivent fonctionner ensemble.

08:29 J'ai mis également quelques cas où ces prémisses sont utilisées de cette manière-là.

08:35 Il est également utilisé dans une mesure plus ou moins importante par des très grands

08:39 acteurs de la préservation numérique à travers le monde, je cite les trois les plus

08:44 évidents, mais il y en a d'autres, Archivematica, Rosetta et donc Preservica.

08:49 Et puis enfin, dans une mesure relativement moindre, il est utilisé par certains outils

08:55 open source d'analyse, et notamment le cas d'Apachtica qui fournit l'information

09:02 de chiffrement des PDF en prémisses.

09:05 Donc, les expressions.

09:09 Comme je vous le disais, une prémisse est techniquement neutre, théoriquement.

09:14 On le sait bien dans les archives, la neutralité est un objectif.

09:20 La neutralité n'existe pas, mais on tend vers une sorte de neutralité.

09:25 Je dis cela parce que la nature arborescente du dictionnaire de données est très proche

09:29 de la logique XML.

09:30 Malgré tout, on essaie de permettre d'utiliser les prémisses dans des contextes différents,

09:37 bases de données relationnelles, bases de données XML, entrepôts de triplets comme

09:41 ce qu'on fait à la BNF.

09:42 Et parmi les expressions officiellement validées, il y a l'expression en XML pour

09:49 lequel, depuis très longtemps, il y a des schémas XSD.

09:52 Et puis, depuis la version 2 et maintenant la version 3, une ontologie qui fait la part

09:58 belle désormais au bon principe théoriquement du web sémantique et du modèle entité-association

10:05 avec la réutilisation notamment de Provo, de Dublin Core, d'ODRL, etc.

10:11 Et puis, pour terminer, un petit mot sur la conformité à prémisses.

10:16 On a un document spécifique pour savoir si les implémentations sont conformes et à

10:21 quel niveau.

10:22 Et elle s'articule sur deux plans.

10:24 La question de quelles entités on implémente, soit l'objet seul, soit l'objet plus les

10:30 métadonnées de provenance, donc événements et agents.

10:33 Et puis un deuxième plan qui est dans quelle mesure est-ce qu'on peut être le niveau

10:40 d'implémentation.

10:41 Le premier niveau qui est à travers la documentation d'alignement.

10:44 Donc on dit simplement voilà comment nos structures de données s'alignent avec les

10:50 logiques de prémisses par export, si c'est le deuxième niveau, et enfin par implémentation

10:56 interne, qui est le niveau le plus avancé en quelque sorte.

11:00 Et je crois que j'en ai terminé pour ce panorama très rapide de prémisses.

11:05 Voilà.

11:06 Merci beaucoup Bertrand.

11:08 C'est effectivement rapide mais également instructif.

11:13 Donc je voulais juste redire, comme tu l'as déjà dit, que les groupes EGAD et Prémisses

11:21 Editorial Committee se sont contactés pour travailler ensemble à voir comment articuler

11:32 les deux modèles ou au minimum produire en conjointement un document expliquant comment

11:40 utiliser Prémisses et RIC en même temps, ce qui sera nécessaire notamment pour la

11:50 description des archives numériques, sachant que comme Daniel l'a dit, le modèle RIC

11:59 et l'anthologie ne rentrent pas dans le détail de la description physique des documents

12:04 et par voie de conséquence des métadonnées qui servent à leur préservation dans le temps.

12:12 Pour en dire quelques mots en anglais, je voulais juste ajouter que l'EGAD et la Prémisses

12:21 Editorial Committee ont commencé à discuter de la façon dont nous pouvions articuler

12:27 les modèles ou au minimum produire un document en conjoint pour expliquer comment les utiliser

12:36 ensemble, ce qui serait nécessaire au moins pour la description des archives numériques,

12:46 sachant que le modèle RIC ne rentre pas dans le détail de la description physique des

12:54 documents et par voie de conséquence des métadonnées qui servent à leur préservation.

13:00 Merci.

13:01 [SILENCE]

Recommandations

14:14

À suivre

Journée d'études : Implémentations de Records in contexts - 6/22 - Session introductives

Archives nationales de France