15- Natalia Pashkeeva et Mael Le Noc

Archives nationales de France

SESSION 3. OUTILS ET SYSTÈMES POUR LES DONNÉES RIC  Le projet Off-Site : vers une configuration de Heurist basée sur RiC-CM par Natalia Pashkeeva (chercheuse associée CERCEC - UMR 8083 EHESS/CNRS, France) et Maël Le Noc (community technical advisor, Heurist)  [English] SESSION 3. TOOLS AND SYSTEMS FOR RIC DATA  The Off-Site project: towards a RiC-CM based Heurist configuration by Natalia Pashkeeva (associate researcher, CERCEC - UMR 8083 EHESS/CNRS, France), and Maël Le Noc (community technical advisor, Heurist)

Transcript

00:00 Bonjour.

00:09 Donc, hello.

00:10 Just a few words in English for the English speaking people.

00:13 I will speak French.

00:14 But you have rather detailed information in my PowerPoint in English,

00:20 so you can follow me.

00:21 Donc, j'ai le privilège de représenter ici l'équipe du projet de recherche off-site,

00:28 qui est financée par le Conseil européen de la recherche et qui a été conçu par l'anthropologue

00:35 Shora Makaremi, qui est chercheuse au CNRS et qui n'est pas dans l'auditorium,

00:41 mais qui est normalement avec nous connectée en ligne.

00:45 Donc, du coup, l'équipe du projet est également rattachée au CNRS.

00:50 Le projet s'intéresse à la violence post-révolutionnaire en Iran dans les années 80.

00:56 En fait, c'est la première décennie après la révolution islamique de 1979.

01:01 Et le projet s'intéresse également aux politiques de mémoire par rapport à cette période.

01:08 Donc, on peut peut-être...

01:10 Next slide, please.

01:12 L'équipe se situe au croisement des disciplines.

01:16 On a les anthropologues, les historiens.

01:18 On a aussi les spécialistes de l'art.

01:21 On a aussi des aspects archivistiques et évidemment, une nouvelle technologie dans une triple perspective, je dirais.

01:28 On a d'abord au sens de l'usage des outils technologiques pour rendre accessibles les sources historiques,

01:36 mais aussi, on investigue vraiment la transformation de la source historique sous l'influence de nouvelles technologiques.

01:43 Et enfin, c'est la nouvelle technologie dans le travail de recherche.

01:48 Parmi les buts du projet, il y avait la construction d'une base de données qu'on appelle "contre-archives".

01:55 Et vous allez comprendre très vite pourquoi on utilise ce mot.

01:59 La base de données a été conçue pour représenter une ethnographie des sources disponibles pour étudier la première décennie post-révolutionnaire en Iran.

02:10 Donc évidemment, non seulement les sources, mais les acteurs qui participaient et qui participent aujourd'hui dans la production, collecte, préservation et diffusion des sources en ligne.

02:21 Donc au sein de Offsite, moi j'ai été censée, entre autres tâches, de concevoir la base de données et je dirais de trouver une solution.

02:31 C'est comme ça que j'appelle ça, ma tâche.

02:33 Une solution pour réaliser la base de données, la solution la plus optimale du point de vue de notre conception de la base de données,

02:43 mais aussi au regard du budget et des ressources humaines du projet.

02:48 Donc sous la solution, j'entends évidemment un schéma de métadonnées et aussi comment la réaliser techniquement, la base de données.

02:55 Donc notre choix final, c'est le modèle conceptuel de RIC intégré dans le système de création de bases de données EURIST.

03:05 Je sais que je ne suis pas dans le panel projet de recherche, mais plutôt "tools and systems",

03:10 mais je vais quand même prendre encore un peu de temps pour vous expliquer ce choix,

03:15 parce que pour cela, j'ai besoin de vous vraiment placer brièvement dans le contexte du projet Offsite.

03:20 Donc on a deux grands thèmes, on prend l'exemple de l'éran post-révolutionnaire d'abord pour étudier la violence dans les états répressifs.

03:28 Cela englobe l'étude des mécanismes, des pratiques de la violence, l'évolution de la législation,

03:34 pratiques de tarture, systèmes et acteurs de surveillance et de punition, le fonctionnement des tribunaux

03:44 et aussi, chose importante, c'est comment les gens, les individus vivent tout cela au quotidien.

03:50 Les expériences individuelles et collectives et aussi les effets à long terme, notamment

03:57 les effets sur la politique et les pratiques sociales au sein des sociétés qui ont vécu

04:05 des périodes de violence particulièrement élevées et massives.

04:09 Et donc le deuxième grand thème, et c'est là que nous nous sommes tournés vers l'ontologie,

04:15 vers le modèle conceptuel de RIC, c'est la production et la circulation des connaissances

04:21 académiques et civiques sur tous ces aspects de la violence.

04:25 La question cruciale, c'est comment collectons les données au moment où la violence se produit

04:31 mais aussi postérieurement.

04:33 Parce que les régimes répressifs mettent en place tout un ensemble de barrières législatives

04:39 et administratives qui entravent d'abord tout simplement la sécurité physique des personnes

04:44 et avec ça, enfin, ils entravent aussi l'accès au terrain.

04:49 Donc, ça empêche le travail ethnographique classique, le travail de terrain empirique.

04:53 Et aussi, cela entrave l'accès aux archives qui permettent d'étudier le passé.

05:00 Cela crée aussi des distances à niveau différent, des distances entre l'expert et l'objet d'étude,

05:07 des distances physiques parce qu'on est positionné géographiquement loin, parfois loin du terrain,

05:16 d'investigation et aussi les distances temporelles avec l'expert d'aujourd'hui,

05:21 donc par rapport aux événements du passé, et aussi les témoins qui ont vécu la violence

05:27 ou leurs proches par exemple, mais qui sont appelés à remémorer tout cela aujourd'hui,

05:34 dans notre époque.

05:35 Et donc, cela crée des régimes différents de discours et de silence,

05:39 parce que les possibles, quand on est à l'intérieur du pays et à l'extérieur du pays,

05:44 parce que les possibilités d'expression ne sont pas les mêmes,

05:48 la formulation d'idées, les échanges sur les idées ne sont pas forcément les mêmes,

05:55 donc il y a les régimes de vérités différents qui s'imposent à l'intérieur et à l'extérieur,

06:00 ce qui nous fait beaucoup d'acteurs qui agissent à l'intérieur et à l'extérieur du pays,

06:08 et qui diffusent des sources aussi variées.

06:12 Sur la page suivante, je vous ai mis juste quelques références,

06:22 mais je n'ai pas le temps d'en parler, parce qu'évidemment notre projet de recherche

06:26 est conceptualisé en fonction et en parallèle avec d'autres initiatives d'analyse et d'approche conceptuelle.

06:39 Il y avait quelques références dans le PowerPoint.

06:42 Mais l'importance est que, à l'intérieur et à l'extérieur du pays,

06:46 nous avons beaucoup d'acteurs qui produisent et qui produisent les sources aujourd'hui,

06:52 qui conservent, collectent, donnent accès à des sources, avec la technologie numérique,

06:58 ce qui nous fait aussi les formes de sources qui sont disponibles et qui sont très différentes.

07:04 Très brièvement, juste trois exemples.

07:09 Nous avons d'abord tout un ensemble d'acteurs qui agissent à l'intérieur du pays.

07:14 Je n'ai pas mis ici le titre, mais nous les appelons archives.ir,

07:17 parce que nous n'avons pas physiquement accès à ces archives,

07:21 parce que nous faisons partie des gens qui écrivent des choses et qui produisent des discours

07:29 qui ne s'alignent pas forcément avec quelques impératifs vraiment importants

07:33 pour les acteurs politiques qui sont actuellement en place à l'intérieur du pays.

07:39 Donc nous avons affaire vraiment à des institutions archives.ir

07:45 qui mettent beaucoup de documents d'archives historiques vraiment précieux,

07:50 identifiables comme sources potentielles importantes pour notre recherche,

07:54 mais qui sont disponibles sous forme de représentations numériques,

07:59 à quelles nous avons affaire.

08:02 Et après l'analyse que nous avons faite dans l'environnement numérique,

08:06 ces substituts numériques sont souvent contextualisés de façon intellectuelle, artificielle,

08:12 avec une ignorance importante du contexte documentaire original.

08:16 Next slide please.

08:19 Donc en parallèle avec ça, à l'extérieur de l'Iran,

08:24 nous avons un faisceau d'acteurs qui agissent dans un régime de vérité totalement différent.

08:30 Ce sont des acteurs, des activistes, des chercheurs, les ONG, associations,

08:36 qui collectent des témoignages et les mettent aussi en ligne,

08:41 de façon partielle, à cause de sensibilité, d'extrême sensibilité de ces données,

08:46 souvent sous forme de transcription nativement numérique.

08:50 Next slide please.

08:52 Donc juste troisième exemple,

08:55 et évidemment nous avons les archives physiques,

09:00 nous avons livres, nous avons rapports,

09:02 qui pressent, qui sont conservés sur des supports non numériques

09:05 par les centres de recherche, par les institutions,

09:08 par les centres d'archives ou les archives privées.

09:11 Next slide please.

09:13 Donc nous avons conçu une base de données complexe pour présenter tout cela.

09:18 L'ensemble d'acteurs, des entités, des ressources,

09:22 les acteurs qui jouent des rôles différents,

09:24 les ressources dont les types sont différents,

09:27 et au moment où nous avons entamé ce travail,

09:30 il y avait encore la toute première draft, je pense, de RIC,

09:35 et donc nous avons examiné la possibilité

09:38 d'utiliser les standards évoques et bullaires classiques,

09:41 Dublin Core, ISA-J, ISAAR, ISDIA,

09:44 et là, évidemment, le problème était qu'aucun de ces standards

09:48 évoques et bullaires ne permettaient pas de présenter

09:50 l'ensemble des entités et ressources auxquelles nous avons pensé,

09:53 et donc j'ai vraiment apprécié la remarque de Meryl Girlings,

09:57 des archives municipales d'Amsterdam,

09:59 qui pointait justement notre problème que, par exemple,

10:02 l'ISA-J ne permet pas de décrire les sources nativement numériques.

10:05 Donc, techniquement aussi, en plus,

10:09 nous n'étions pas certains de pouvoir réunir ces anciens standards

10:12 ensemble en une seule base de données,

10:14 et à ce moment-là, il y avait aussi la question du budget,

10:19 qui était importante en fait, parce qu'il fallait calculer tout ça,

10:21 et à ce moment-là, nous nous sommes tournés

10:24 vers le modèle conceptuel du RIC,

10:25 et nous avons vraiment apprécié beaucoup d'aspects.

10:28 J'ai mis un cours résumé ici,

10:30 mais tout brièvement, le vocabulaire vraiment abstrait,

10:33 donc pour nous, c'était une solution énorme,

10:35 parce que ça nous permet de traiter l'ensemble d'acteurs et de ressources

10:39 en utilisant le même type de métadonnées.

10:42 Le nombre de relations, qui est impressionnant en fait,

10:46 et aussi, pour certaines relations,

10:49 le choix de les présenter de façon aussi souple,

10:53 comme par exemple "has provenance", qui est très général,

10:56 et dans notre cas de figure, c'est très utile,

10:58 parce qu'en fait, souvent, on ne comprend pas

11:01 le rôle concret qu'un tel acteur joue

11:04 dans la diffusion d'une telle ou telle source.

11:06 Donc "has provenance", c'est très large,

11:08 et c'est une solution pour nous.

11:10 Certains attributs qui permettent de discuter de façon analytique

11:14 question d'authenticité, intégrité, c'est crucial,

11:16 et enfin, justement, cette différence établie entre RIC et instantiation,

11:21 ces instantiations en fait,

11:23 qui est importante, parce que ça nous permet

11:25 de traiter les cas de figure difficiles,

11:27 comme par exemple, nous n'avons simplement pas accès

11:30 à l'instantiation authentique, toute première,

11:33 et nous ignorons même si ça existe,

11:37 mais nous avons affaire à des institutions instantiations

11:41 numériques, ou nativement numériques,

11:45 même peut-être les transcriptions d'un REC,

11:47 qui existait apparemment dans les années 80,

11:49 qui existe peut-être quelque part.

11:51 Donc, si j'ai le temps, après,

11:54 je vais donner un exemple très concret,

11:56 mais ce sera après l'intervention de Maël,

11:58 parce que, qui va présenter justement EURIST,

12:01 parce que, nous, notre équipe a décidé de faire intégrer

12:06 le modèle conceptuel de RIC dans EURIST,

12:08 et nous l'avons fait parce que vraiment,

12:10 enfin, ça c'est juste un partage d'expérience,

12:13 nous avons trouvé que c'est un outil simple

12:16 et pratique dans l'usage,

12:18 et nous avons voulu simplement participer

12:20 au développement de cet outil,

12:22 dans l'espoir que les autres équipes de recherche,

12:24 et peut-être éventuellement les archivistes,

12:26 puissent en servir. Maël, je te passe la parole.

12:28 Donc, je vais vous parler brièvement d'EURIST

12:37 et vous vous dire un peu ce que c'est.

12:39 En fait, EURIST, c'est un système de construction,

12:41 de gestion et de partage de bases de données

12:43 qui a été conçu à l'origine pour et par la recherche

12:45 en sciences humaines et sociales.

12:47 C'est développé, entre autres, par Ian Johnson,

12:49 comme une boîte à outils,

12:51 et ça a été vraiment développé au fur et à mesure,

12:53 et ça continue d'être développé

12:55 en lien avec tout un tas de projets de recherche

12:57 qui viennent nous voir et nous disent "Nous, on voudrait ça,

12:59 on voudrait ça, on a besoin de ça".

13:01 Et donc c'est dans ce cadre-là aussi que Offsite

13:03 est venu et nous a dit "Nous, on voudrait ça

13:05 et surtout, on voudrait utiliser Rixem".

13:07 Ce qu'il y a derrière, c'est un système

13:09 un système hybride de GraphNoSQL

13:11 avec une base MySQL.

13:13 Mais en fait, quand on parle d'EURIST,

13:19 on parle d'une infrastructure

13:21 avec trois composantes distinctes.

13:23 D'abord, une structure,

13:25 une structure SQL qui est derrière

13:27 que les utilisateurs ne voient pas mais qui est

13:29 très flexible et à la fois standardisée.

13:31 Un logiciel EURIST

13:33 qui est open source.

13:35 C'est un outil qui est assez facile

13:37 à prendre en main pour manipuler les bases de données

13:39 et c'est ça que

13:41 les utilisateurs voient.

13:43 Et puis, des serveurs EURIST,

13:45 un ensemble de serveurs dans le monde, mais entre autres,

13:47 en France, c'est hébergé sur les serveurs de Humanoom,

13:49 où on a à la fois

13:51 le logiciel qui est hébergé sur le serveur

13:53 et puis les bases de données qu'on va

13:55 concevoir. Après, si vous voulez,

13:57 c'est aussi possible de télécharger le logiciel

13:59 et de l'installer sur vos propres serveurs

14:01 mais ce sera à vous de le maintenir.

14:03 Je vais venir là-dessus, s'il vous plaît.

14:05 Et donc EURIST

14:07 permet de faire tout un tas de choses.

14:09 Là, vous avez une vision d'ensemble de l'interface.

14:11 La suivante.

14:13 D'autres visions de comment

14:17 on structure

14:19 les données, comment on construit les données.

14:21 La suivante.

14:23 Si ça arrive. Donc, en fait, avec EURIST,

14:29 ce qu'on peut faire, c'est à la fois

14:31 créer notre structure de données, remplir les données

14:33 dans l'interface et puis,

14:35 par la suite, gérer tout un tas

14:37 de requêtes pour pouvoir interroger nos données.

14:39 C'est aussi là que les chercheurs

14:41 sont particulièrement intéressés.

14:43 Je vais bien la suivante. Et puis,

14:45 la dernière chose qu'on n'a pas tellement faite

14:47 avec Offsite, mais c'est qu'on peut

14:49 publier sous forme

14:51 de sites Internet

14:53 des sites qui permettent de requêter les données

14:55 pour le public avec, bien sûr,

14:57 des accès plus restreints

14:59 que ce qu'on peut avoir quand on a accès à l'outil derrière.

15:01 Et donc là, vous avez quelques exemples de sites.

15:07 Qui arrive ?

15:09 Et donc, avec Natalia,

15:11 on a implémenté

15:13 RICCM.

15:15 Vous avez un morceau

15:17 de graphes sur lequel on ne voit, bien sûr,

15:19 absolument rien. Mais en fait,

15:21 on a implémenté chacune des

15:23 entités.

15:25 Sous EURIST, ça fonctionne en termes d'entités,

15:27 de champs,

15:29 attributs et de relations. Du coup, c'était assez simple

15:31 de pouvoir

15:33 mapper. C'est ça qu'on a dû faire.

15:35 C'est ça qui a été le plus long, de mapper l'ensemble

15:37 des entités et des champs pour que ça

15:39 corresponde à des formulaires dans EURIST

15:41 et que ça s'intègre dans la base de données.

15:43 Donc, vous avez...

15:45 Vous pouvez voir ce que ça donne quand on clique sur une visualisation.

15:47 On ne voit pas grand-chose, mais

15:49 au jour d'aujourd'hui, on a

15:51 implémenté l'intégralité

15:53 des entités.

15:55 Pas tous les champs

15:57 parce qu'on partait des besoins

15:59 de off-site et certains champs

16:01 et certaines entités,

16:03 par exemple, mandate, ne sont pas vraiment utiles pour off-site.

16:05 Donc, on ne s'est pas attardé sur ça.

16:07 Mais c'est tout à fait possible de les développer par la suite.

16:09 Et puis, l'intégralité des relations

16:11 ont déjà été mises en place.

16:13 La suivante...

16:15 Et ce qui permet aujourd'hui, pour quelqu'un

16:21 qui voudrait développer une base de données

16:23 en RIC, d'aller très très

16:25 rapidement en créant une nouvelle base

16:27 de données. Donc, si vous allez sur le serveur de EURIST Humanum,

16:29 vous tombez là-dessus. Vous pouvez

16:31 cliquer sur

16:33 "New users" et ça va vous...

16:35 Je veux bien la suivante... Vous tombez assez rapidement

16:37 sur un tout petit formulaire qui vous demande, en gros,

16:39 ce que vous voulez faire.

16:41 Après, vous pouvez cliquer directement

16:43 parce que ça va aller assez vite.

16:45 Et donc, on a ce premier formulaire.

16:47 On enregistre notre base de données. On se retrouve sur une base

16:49 de données relativement vierge.

16:51 Et à partir de là, on peut importer

16:53 l'ensemble de la structure

16:55 RIC CM qu'on a mise en place.

16:57 Et ce qui va importer toutes

16:59 les entités, tous les champs.

17:01 Et donc, vous partez sur une base

17:03 vierge où vous allez pouvoir

17:05 commencer à rentrer des données,

17:07 que ce soit, on a vu, les records,

17:09 les agents, etc., dans des

17:11 formulaires et de faire les liens entre eux.

17:13 Je vais bien la suivante. Et peut-être

17:15 une petite précision, mais je pense que Natalia en reparlera

17:17 rapidement. C'est aussi

17:19 très simple de rajouter des champs. C'est-à-dire que si

17:21 vous avez des champs et des besoins qui sont

17:23 spécifiques, qui ne sont pas d'ENRIC CM

17:25 ou qui ne sont pas d'ENRICO, on peut rajouter

17:27 des champs. On l'a fait pour certains

17:29 parce que ça fonctionnait, parce qu'il y avait les

17:31 besoins. Et c'est très simple de rajouter.

17:33 Donc là, vous avez un exemple de... Après,

17:35 4-5 clics et une petite dizaine de minutes,

17:37 vous avez un formulaire tout prêt

17:39 pour commencer à rentrer des données.

17:41 Il y en a peut-être une dernière

17:43 où on peut voir les relations, mais globalement,

17:45 c'était simplement pour que

17:47 vous puissiez voir un peu à quoi ça ressemble

17:49 visuellement une fois que vous êtes lancé.

17:51 - Grosso modo, ce que

18:01 Maëlle a présenté, nos formulaires

18:03 à nous, on les a

18:05 un peu changés.

18:07 Ce que je veux dire, surtout,

18:09 c'est que c'est assez facile de modifier

18:11 la structure et l'essentiel, c'est que

18:13 vos données restent intactes.

18:15 Je ne vais pas donner un exemple

18:17 concret que je voulais donner, cette différence

18:19 entre RECET et Instantiation et à quoi

18:21 ça peut vraiment servir.

18:23 A nous, ça aide beaucoup.

18:25 Mais il y a d'autres

18:27 captures d'écran

18:29 dans PowerPoint, donc vous pouvez

18:31 les regarder.

18:33 N'hésitez pas à s'adresser

18:35 à nous et surtout à l'équipe

18:37 RIST qui est magnifique

18:39 pour des questions.

18:41 Merci pour votre attention.

18:43 [Silence]

Catégorie

Transcription

Recommandations