• l’année dernière
SESSION 4. RIC DANS DES PROJETS DE RECHERCHE

D’ISAD(G) à RiC : transformation des catalogues de plusieurs institutions culturelles du canton suisse de Zoug par Josip Spec (Archives de la Banque nationale suisse), à partir de son mémoire de Master en sciences de l’information.

[English]

SESSION 4. RIC IN RESEARCH PROJECTS

From ISAD(G) to RiC: Transforming the catalogues of multiple GLAM institutions in the Swiss Canton of Zug by Josip Spec (Archive of the Swiss National Bank, Switzerland). Based on his Master thesis in Information science
Transcription
00:00 Je vais vous parler de ma thèse de mastère que j'ai écrite l'année dernière,
00:07 pendant mes études post-graduat dans l'informatique.
00:11 Je vais vous dire quel était le but de ma thèse,
00:15 les étapes que j'ai pris pour atteindre ce but.
00:19 Je voudrais partager mes conclusions sur le chemin.
00:23 Peut-être pouvons-nous en parler un peu plus.
00:27 Si vous avez une opinion sur ma thèse,
00:31 ou si vous avez une autre conclusion à propos de votre travail.
00:35 Je vais commencer par un quote du modèle conceptual de Rick.
00:41 Les archéologues connaissants d'Isaac G.
00:44 pourraient initialement trouver le modèle conceptual de Rick
00:47 un peu plus compliqué à comprendre.
00:50 "En étant un peu plus nouveau,
00:53 "je me suis rendu compte que c'était exactement
00:57 "le sentiment que j'avais au début.
01:00 "En parlant avec des collègues d'autres institutions,
01:03 "ils ont tous le même sentiment."
01:06 Le but était de faire quelque chose
01:11 qui faciliterait mon propre compréhension de Rick,
01:14 et au mieux,
01:16 avec les autres archéologues,
01:18 pour mieux comprendre le modèle,
01:21 ce qu'il fait et comment il fonctionne.
01:24 Je me suis rendu compte que le meilleur moyen
01:27 de faire cela,
01:29 c'est d'explorer et d'illustrer les standards
01:32 pour une groupe d'objectifs archéologiques.
01:35 Ce n'est pas seulement pour des personnes
01:38 avec un background en IT,
01:40 ou une bonne compréhension technique,
01:43 mais pour essayer de faire quelque chose
01:46 que chaque personne qui travaille dans un archive
01:49 peut comprendre.
01:51 Je voulais faire cela de façon pratique,
01:54 en utilisant des exemples réels.
01:57 Pour atteindre ce but,
02:00 j'ai dû prendre deux pas.
02:03 D'abord, j'ai dû savoir comment
02:06 passer de l'IstG à Records & Context,
02:09 c'est-à-dire que j'ai dû exporter les données
02:12 et les mapper pour Rick.
02:14 Le deuxième pas, c'est d'explorer
02:17 le potentiel de Rick,
02:20 et de trouver les cas d'utilisation
02:23 pour les différentes institutions.
02:26 Je dois donc enrichir les données,
02:29 les lier, et jouer avec cela
02:32 pour trouver ce qui est possible.
02:35 Qu'ai-je fait exactement
02:38 pour exporter et mapper ?
02:41 Pour réaliser ce thésis,
02:44 j'ai travaillé dans une autre institution,
02:47 dans la bibliothèque du canton de Zug,
02:50 un petit canton au centre de la Suisse.
02:53 J'ai identifié quatre institutions
02:56 dans le canton,
02:59 une bibliothèque qui utilisait
03:02 un catalogue de bibliothèque basé sur RDA,
03:05 et un catalogue d'archives basé sur l'IstG.
03:08 Les archives de la ville et de la ville du canton
03:11 étaient des sources de données potentielles,
03:14 ainsi que le musée historique de Zug,
03:17 qui a un catalogue basé sur CyDoc.
03:20 En plus des sources de données,
03:27 j'ai aussi identifié des thèmes de recherche,
03:30 car je ne voulais pas exporter les données complètes,
03:33 mais seulement certaines données.
03:36 J'ai donc défini des cas de recherche
03:39 auxquels un chercheur pourrait être intéressé,
03:42 parmi les entités RIC,
03:45 ce qui signifie des personnes,
03:48 des endroits, des événements, ou des corps.
03:51 J'aimerais utiliser CryptoAgi comme exemple.
03:54 Pour donner un peu de contexte,
03:57 CryptoAgi n'a rien à voir
04:00 avec les crypto-monnaies ou le bitcoin,
04:03 qui a fait et a vendu
04:06 des appareils de cryptographie
04:09 depuis les années 50,
04:12 jusqu'en 2020.
04:15 En 2018,
04:18 et récemment en 2020,
04:21 l'entreprise a été exposée
04:28 à vendre des appareils de cryptographie
04:31 avec des portes arrière,
04:34 ce qui a permis aux services intelligents
04:37 de déciprer les communications en cryptographie.
04:40 C'est un sujet très relevant,
04:43 au moins en Suisse.
04:46 Après avoir identifié les données
04:52 auxquelles j'étais intéressé,
04:55 j'ai dû les exporter.
04:58 C'était un défi et un défi
05:01 de récupérer les données
05:04 des catalogues existants.
05:07 Ceci me donne donc
05:10 ma première conclusion,
05:13 la propriété des données.
05:16 Les institutions que j'ai ici
05:19 sont plus petites,
05:22 qui n'ont pas les ressources
05:25 pour fabriquer leur propre appareil,
05:28 mais qui relient leurs clients
05:31 à des appareils de 3e partie.
05:34 J'ai l'expérience que même s'ils ont un catalogue,
05:37 ils ne peuvent pas accéder
05:40 à leurs propres données.
05:43 Les Archives nationales de l'UK
05:46 ont dénommé les catalogues
05:49 comme un asset de business crucial.
05:52 Il faut donc
05:55 que ces catalogues soient
05:58 en propriété de chaque institution.
06:01 Après avoir extrait les données,
06:07 j'ai dû les mapper
06:10 pour les records en contexte.
06:13 Pour cela, j'ai créé
06:16 un modèle d'informations.
06:19 Je ne vais pas en parler,
06:22 mais c'est la deuxième conclusion,
06:25 la modélisation des données.
06:28 C'est crucial et ça fait du sens
06:31 de penser à l'utilisation des données
06:34 existantes des précédentes données,
06:37 mais pas seulement,
06:40 mais aussi de penser à l'utilisation
06:43 des données futures,
06:46 à la façon dont les données
06:49 peuvent être utilisées
06:52 pour générer des bénéfices.
06:55 La modélisation des données
07:01 permet aux institutions
07:04 de trouver des solutions
07:07 pour les besoins des institutions.
07:10 La troisième conclusion
07:13 concernant la modélisation des données
07:16 est la nettoyage des données.
07:19 C'est évident et normal
07:22 que les erreurs et les inconsistences
07:25 s'accumulent au cours du temps
07:28 dans les catalogues créés
07:31 au cours des années,
07:34 décennies et siècles.
07:37 Mais les ressources primaires
07:40 ne sont pas aussi bonnes
07:43 que les données métallographiques.
07:46 La nettoyage des données
07:49 doit être une priorité.
07:52 Je crois que la transition
07:55 de l'ISFG à l'accès aux records
07:58 et aux contextes est une bonne opportunité
08:01 pour prendre du temps
08:04 et nettoyer les catalogues.
08:07 Je ne suis pas d'accord avec
08:10 les exportations et l'importation
08:13 d'un database graphique.
08:16 C'est un exemple des entités présentes.
08:19 Les entités jaunes et vertes
08:22 sont les records et les instantiations.
08:25 Ce qui a déjà existé dans l'ISFG
08:28 et dans les précédents databases.
08:31 Les entités bleues et vertes
08:34 sont les personnes, les endroits
08:37 et les entreprises.
08:40 C'est la première étape,
08:43 d'extraire les données et de les mapper
08:46 aux records et aux contextes.
08:49 Pour la deuxième étape,
08:52 je reviendrai au exemple de CryptoAgain.
08:55 Ce que vous voyez ici
08:58 est l'exportation et la mapping des données existantes.
09:01 Les entités bleues sont les records
09:04 qui ont déjà existé dans les précédentes databases.
09:07 Donc, il n'y a pas de valeur supplémentaire.
09:10 Pour mon cas,
09:13 j'ai pris des données supplémentaires
09:16 de l'Internet de commerce suisse
09:19 et j'ai pu
09:22 connecter des données
09:25 sur les différents
09:28 groupes de la compagnie,
09:31 sur les successeurs,
09:34 sur les informations géographiques,
09:37 sur les différents types d'entités
09:40 qui pourraient être valables
09:43 à certains types d'institutions.
09:46 Pendant la préparation de cette présentation,
09:49 j'ai regardé CryptoAgain
09:52 dans le registre des échanges
09:55 et j'ai réalisé que
09:58 tout le monde
10:01 avait une image différente
10:04 dans le registre des échanges.
10:07 J'ai donc identifié une autre compagnie
10:10 avec le même nom,
10:13 CryptoAgain.
10:16 Ce que Rick m'a permis de faire
10:19 c'est de modéliser
10:22 quand la nouvelle compagnie a été créée
10:25 ou les noms précédents,
10:28 quand un changement de nom a eu lieu
10:31 et depuis quand la nouvelle compagnie
10:34 s'appelle Crypto.
10:37 Je suis, par exemple,
10:40 utilisé depuis le 6 juin 2023.
10:43 Ils ont récemment renommé CryptoAgain.
10:46 Cet exemple montre comment
10:49 on peut résoudre un problème
10:52 que beaucoup d'archives peuvent faire face à,
10:55 des entités avec les mêmes noms,
10:58 soit des personnes, soit des groupes de travail.
11:01 Les conclusions que j'ai pu
11:11 décrire pendant la préparation
11:14 de ces données sont
11:17 les suivantes.
11:20 Une interface graphique
11:23 utilisable pour les utilisateurs est essentielle.
11:26 Je pense que très peu de gens dans les archives
11:29 travaillent directement avec des données,
11:32 mais la plupart des gens ont besoin
11:35 d'une interface qui leur permettra
11:38 de travailler de façon efficace,
11:41 comme mentionné Christian.
11:44 Je suis curieux de voir
11:47 les solutions de ce genre de softwares
11:50 qui seront développées dans le futur
11:53 pour comprendre les concepts de Rick
11:56 et les faire utilisables pour les archivistes.
11:59 La 5e conclusion est que
12:02 une approche doublée est nécessaire.
12:05 Il y a certaines opportunités
12:08 que Rick offre aux archivistes
12:11 mais elles ne sont pas nécessairement
12:14 interdites aux clients.
12:17 Les chercheurs, les historiens,
12:20 ils ont peut-être besoin de quelque chose
12:23 de complètement différent de ce que nous avons besoin.
12:26 La dernière conclusion est que
12:29 le personnel avec les connaissances et les compétences
12:32 est aussi important pour faire l'utilisation de Rick.
12:35 Ces gens ne vont pas apparaître
12:38 dans un seul site,
12:41 ils doivent être éducés,
12:44 et les archives doivent investir
12:47 du temps et de l'argent
12:50 pour amener leurs employés
12:53 à un nouveau standard.
12:56 Pour conclure,
13:02 Rick offre beaucoup de possibilités et de potentiel,
13:05 mais elles ne vont pas apparaître
13:08 tout de suite.
13:11 Il faut beaucoup d'efforts pour atteindre le standard.
13:14 Les événements comme celui-ci
13:17 sont une opportunité parfaite
13:20 pour échanger des expériences,
13:23 des luttes, des idées.
13:26 J'ai hâte de voir d'autres événements
13:29 et de voir ce que l'avenir
13:32 nous offre dans les solutions
13:35 et l'utilisation des records et des contextes.
13:39 Merci.
13:42 Je vais laisser quelques commentaires.
13:45 Si quelqu'un veut lire le texte
13:48 et voir les détails de ce que j'ai fait,
13:51 je vous ai aussi partagé le lien
13:54 dans la description.
13:57 Merci.
14:00 Merci.
14:03 Merci.
14:06 [SILENCE]

Recommandations