• l’année dernière
SESSION 2. LES IMPLÉMENTATIONS DE RIC AU SEIN DES INSTITUTIONS

Développement d’un modèle de données suisse basé sur Records in Contexts par Jan Krause-Bilvin (archiviste informaticien, Archives cantonales vaudoises, Suisse ; membre du groupe ICA/EGAD)

[English]
SESSION 2. RIC EARLY IMPLEMENTATIONS WITHIN INSTITUTIONS

Developing a Swiss data model based on Records in Contexts
by Jan Krause-Bilvin (computer archivist, Archives cantonales vaudoises, Switzerland; member of ICA/EGAD)
Transcription
00:00 [SILENCE]
00:08 Merci Tobias.
00:10 Alors, rebonjour à tout le monde, comme on dit en Suisse romande.
00:15 Donc, pour changer, je vais parler français.
00:19 Donc, je vais vous parler d'un projet, comme dans futur,
00:25 de développement d'un modèle de données basé sur RIC en Suisse.
00:32 Et en Suisse, on a déjà un certain nombre de premières implémentations.
00:38 [SILENCE]
00:41 Ah non, c'est bon, ça tourne.
00:43 Donc, bon, ça affiche tout d'un coup, mais c'est pas plus mal.
00:46 Voilà, donc j'ai choisi de vous en faire une sélection.
00:52 Et pour faire une sélection, il a fallu utiliser un critère.
00:55 Alors, je me suis dit, ben voilà, je prends que ce qui est en production.
00:58 Ça veut pas dire que c'est les seules choses ou que c'est les plus intéressantes,
01:02 mais simplement celles qui sont en production.
01:05 Alors, par exemple, au milieu de la croix, il y a marqué Memoriave,
01:10 qui a un outil qui s'appelle MemoBase,
01:13 qui est donc un agrégateur audiovisuel pour le pays,
01:18 un peu comme Europeana local, si on veut.
01:21 Il y a au-dessus, le drapeau du canton de Bâle,
01:26 donc le noir et blanc, là, qui a mis en place un pipeline
01:32 pour exporter leurs données au format RIC de façon quotidienne
01:38 avec un endpoint SPARQL.
01:40 Les archives fédérales qui sont représentées par le carré blanc
01:45 avec le petit drapeau suisse en haut à gauche,
01:48 eux, ont fait la même chose,
01:51 mais aussi, ils ont mis en place une interface de visualisation
01:58 de ces données dans laquelle on peut naviguer graphiquement assez facilement.
02:04 Et derrière, ça produit des rockets SPARQL qu'on peut voir et éditer, d'ailleurs,
02:08 si on clique sur le petit "voir la recap".
02:12 Il y a aussi DocuTeam qui, en fait, récemment...
02:17 Les autres projets que j'ai mentionnés, ça fait déjà typiquement au moins un an qu'ils sont là,
02:22 voire plutôt deux, en production.
02:25 Par contre, DocuTeam, récemment, a sorti une série de modules basés sur RIC
02:33 qui vont de l'ingeste en passant par la description, l'archivage à long terme et la diffusion.
02:41 Et puis, un autre exemple, le SAPA, le Swiss Association for Performing Arts,
02:47 c'est une association qui s'occupe de mettre en valeur les arts de la scène,
02:50 donc danse, théâtre, etc.,
02:53 qui, depuis assez longtemps, je ne sais plus combien d'années,
02:56 ont mis en place eux-mêmes un outil basé sur RIC
03:00 qui est assez intéressant parce que ça permet de décrire assez finement
03:05 les différents types d'agents, de personnes, les auteurs, les danseurs, etc.,
03:10 mais aussi les lieux dans lesquels se passent les représentations,
03:13 donc pas seulement les théâtres, mais aussi les salles qui sont concernées,
03:16 et relier tout ça avec des événements, donc les performances artistiques.
03:22 Ça prend un moment. Voilà.
03:28 Donc, on a un certain nombre de premières implémentations en production depuis un moment,
03:34 et je pense que maintenant, l'idée, ce qui serait utile,
03:38 c'est de mettre ce qui a été, disons,
03:43 qui a été découvert en faisant ça, en commun,
03:46 pour faire quelque chose de mieux, et si possible, d'interopérable.
03:51 Voilà. Et pour ce faire, après discussion avec différentes personnes,
03:59 et puis on en a ensuite parlé en groupe,
04:01 on s'est dit que le bon endroit pour faire ça,
04:04 ce serait un groupe de travail de l'association suisse des archivistes,
04:08 et puis, comme vous voyez, il y a pas mal d'institutions
04:12 qui sont intéressées à participer d'emblée,
04:15 donc il y a déjà une certaine masse critique pour ça,
04:18 il y en aura certainement d'autres aussi.
04:21 Et donc, concrètement, je vais vous juste dire un peu plus
04:31 sur quelques pistes qui me semblent intéressantes
04:34 qui ont été explorées pour prendre un peu, disons, des choses concrètes.
04:39 Alors, la première, même au base, que j'ai mentionnée,
04:45 je vais en dire un tout petit peu.
04:47 Ce qu'il faut savoir, c'est que cet après-midi,
04:49 il y a une collègue de Memoriave, Roberta Padlina,
04:53 qui va en parler plus en détail, mais ce qui est intéressant,
04:56 c'est que c'est un système qui utilise Ricoh comme squelette de base
05:01 pour son modèle de méthode, mais aussi d'autres choses,
05:03 parce que comme ils font de l'audiovisuel,
05:05 il y a besoin d'autres choses, notamment Ebucor, Scos,
05:09 et puis ils utilisent Fedora Commons comme outil,
05:12 pas de triple store, mais un moteur de recherche.
05:16 Un autre exemple que j'ai déjà mentionné,
05:22 c'est Balvil, qui fait cet export de son archival information system
05:27 chaque jour.
05:29 Ce que je trouve intéressant dans ce projet,
05:31 c'est qu'ils ne font pas simplement l'export,
05:33 mais ils ont utilisé ceci, ils se sont rendus compte,
05:37 tiens, on pourrait faire mieux, on pourrait se rapprocher de Ricoh
05:40 avec ce qu'on a déjà, et gentiment, gentiment,
05:43 ils améliorent leur existant pour pouvoir se rapprocher gentiment de Ricoh
05:48 et avoir quelque chose de mieux dans leur triple store,
05:51 et c'est comme ça qu'ils passent à Ricoh d'une certaine manière.
05:54 Alors les archives fédérales, comme je vous ai mentionné,
06:00 c'est un peu similaire, ils ont fait un export de leur AIS,
06:03 mais par contre là, il y a cet outil de visualisation,
06:06 donc vous pouvez aller sur visualize.admin.ch
06:09 et puis explorer des datasets qui ne sont pas uniquement d'ailleurs
06:14 ce qui vient de l'AIS, mais il y a aussi des jeux de données primaires avec.
06:20 Et puis, donc, DocuTeam que j'ai mentionné aussi,
06:25 donc là vous voyez, il y a tout un écosystème de modules
06:29 qui peuvent être utilisés soit indépendamment, soit ensemble,
06:33 donc ça aussi, ça va être présenté par Christian Moser de DocuTeam
06:37 cet après-midi, notamment DocuTeam Context,
06:40 qui est l'outil de description, mais il y a aussi DocuTeam Box
06:45 pour la préservation numérique et puis Sirius pour la diffusion.
06:49 Là, il y a plein de standards qui sont combinés,
06:52 donc il y a RIC comme base, mais il y a aussi Premis pour la préservation
06:56 et puis d'autres choses, Ebucor, etc.
06:58 Et il y a plein de sortes d'outils techniques qui sont utilisés
07:01 selon les différents modules, alors ça peut aller de Graph Database,
07:05 enfin ça va, de Graph Database en passant par le Triple Store
07:08 à des moteurs de recherche.
07:13 Ah oui, bon, donc ça c'est juste une petite capture d'écran de Sirius
07:16 comme teaser, de Context comme teaser pour tout à l'heure,
07:20 où vous voyez qu'on peut déjà là-dedans décrire des agents,
07:23 des lieux, des instantiations, etc.
07:26 Et donc, si on reprend tout ça ensemble, je pense qu'on a vraiment
07:32 une certaine masse critique pour pouvoir mettre tout ça ensemble
07:36 et faire un bon modèle de données basées sur RIC
07:41 qui couvre tout le cycle de vie des archives,
07:45 de la production jusqu'à la diffusion.
07:48 Et puis, maintenant, c'est un gros challenge par contre
07:53 de mettre ensemble tout ça et de préparer ça,
07:56 et ça va aussi dans le sens de Records in Context Application Guidelines
08:00 qui est aussi encore à faire, et qui pourrait peut-être se nourrir
08:03 de ce genre de projet-là.
08:05 Voilà.
08:06 Merci.
08:07 Sous-titrage ST' 501
08:09 [Sous-titrage ST' 501]
08:11 [Sous-titrage ST' 501]
08:13 [Sous-titrage ST' 501]
08:15 [Sous-titrage ST' 501]
08:17 [Sous-titrage ST' 501]
08:19 [SILENCE]

Recommandations