• il y a 9 mois
SESSION 3. OUTILS ET SYSTÈMES POUR LES DONNÉES RIC

Le projet Off-Site : vers une configuration de Heurist basée sur RiC-CM par Natalia Pashkeeva (chercheuse associée CERCEC - UMR 8083 EHESS/CNRS, France) et Maël Le Noc (community technical advisor, Heurist)

[English]
SESSION 3. TOOLS AND SYSTEMS FOR RIC DATA

The Off-Site project: towards a RiC-CM based Heurist configuration
by Natalia Pashkeeva (associate researcher, CERCEC - UMR 8083 EHESS/CNRS, France), and Maël Le Noc (community technical advisor, Heurist)
Transcription
00:00 Bonjour.
00:09 Donc, hello.
00:10 Just a few words in English for the English speaking people.
00:13 I will speak French.
00:14 But you have rather detailed information in my PowerPoint in English,
00:20 so you can follow me.
00:21 Donc, j'ai le privilège de représenter ici l'équipe du projet de recherche off-site,
00:28 qui est financée par le Conseil européen de la recherche et qui a été conçu par l'anthropologue
00:35 Shora Makaremi, qui est chercheuse au CNRS et qui n'est pas dans l'auditorium,
00:41 mais qui est normalement avec nous connectée en ligne.
00:45 Donc, du coup, l'équipe du projet est également rattachée au CNRS.
00:50 Le projet s'intéresse à la violence post-révolutionnaire en Iran dans les années 80.
00:56 En fait, c'est la première décennie après la révolution islamique de 1979.
01:01 Et le projet s'intéresse également aux politiques de mémoire par rapport à cette période.
01:08 Donc, on peut peut-être...
01:10 Next slide, please.
01:12 L'équipe se situe au croisement des disciplines.
01:16 On a les anthropologues, les historiens.
01:18 On a aussi les spécialistes de l'art.
01:21 On a aussi des aspects archivistiques et évidemment, une nouvelle technologie dans une triple perspective, je dirais.
01:28 On a d'abord au sens de l'usage des outils technologiques pour rendre accessibles les sources historiques,
01:36 mais aussi, on investigue vraiment la transformation de la source historique sous l'influence de nouvelles technologiques.
01:43 Et enfin, c'est la nouvelle technologie dans le travail de recherche.
01:48 Parmi les buts du projet, il y avait la construction d'une base de données qu'on appelle "contre-archives".
01:55 Et vous allez comprendre très vite pourquoi on utilise ce mot.
01:59 La base de données a été conçue pour représenter une ethnographie des sources disponibles pour étudier la première décennie post-révolutionnaire en Iran.
02:10 Donc évidemment, non seulement les sources, mais les acteurs qui participaient et qui participent aujourd'hui dans la production, collecte, préservation et diffusion des sources en ligne.
02:21 Donc au sein de Offsite, moi j'ai été censée, entre autres tâches, de concevoir la base de données et je dirais de trouver une solution.
02:31 C'est comme ça que j'appelle ça, ma tâche.
02:33 Une solution pour réaliser la base de données, la solution la plus optimale du point de vue de notre conception de la base de données,
02:43 mais aussi au regard du budget et des ressources humaines du projet.
02:48 Donc sous la solution, j'entends évidemment un schéma de métadonnées et aussi comment la réaliser techniquement, la base de données.
02:55 Donc notre choix final, c'est le modèle conceptuel de RIC intégré dans le système de création de bases de données EURIST.
03:05 Je sais que je ne suis pas dans le panel projet de recherche, mais plutôt "tools and systems",
03:10 mais je vais quand même prendre encore un peu de temps pour vous expliquer ce choix,
03:15 parce que pour cela, j'ai besoin de vous vraiment placer brièvement dans le contexte du projet Offsite.
03:20 Donc on a deux grands thèmes, on prend l'exemple de l'éran post-révolutionnaire d'abord pour étudier la violence dans les états répressifs.
03:28 Cela englobe l'étude des mécanismes, des pratiques de la violence, l'évolution de la législation,
03:34 pratiques de tarture, systèmes et acteurs de surveillance et de punition, le fonctionnement des tribunaux
03:44 et aussi, chose importante, c'est comment les gens, les individus vivent tout cela au quotidien.
03:50 Les expériences individuelles et collectives et aussi les effets à long terme, notamment
03:57 les effets sur la politique et les pratiques sociales au sein des sociétés qui ont vécu
04:05 des périodes de violence particulièrement élevées et massives.
04:09 Et donc le deuxième grand thème, et c'est là que nous nous sommes tournés vers l'ontologie,
04:15 vers le modèle conceptuel de RIC, c'est la production et la circulation des connaissances
04:21 académiques et civiques sur tous ces aspects de la violence.
04:25 La question cruciale, c'est comment collectons les données au moment où la violence se produit
04:31 mais aussi postérieurement.
04:33 Parce que les régimes répressifs mettent en place tout un ensemble de barrières législatives
04:39 et administratives qui entravent d'abord tout simplement la sécurité physique des personnes
04:44 et avec ça, enfin, ils entravent aussi l'accès au terrain.
04:49 Donc, ça empêche le travail ethnographique classique, le travail de terrain empirique.
04:53 Et aussi, cela entrave l'accès aux archives qui permettent d'étudier le passé.
05:00 Cela crée aussi des distances à niveau différent, des distances entre l'expert et l'objet d'étude,
05:07 des distances physiques parce qu'on est positionné géographiquement loin, parfois loin du terrain,
05:16 d'investigation et aussi les distances temporelles avec l'expert d'aujourd'hui,
05:21 donc par rapport aux événements du passé, et aussi les témoins qui ont vécu la violence
05:27 ou leurs proches par exemple, mais qui sont appelés à remémorer tout cela aujourd'hui,
05:34 dans notre époque.
05:35 Et donc, cela crée des régimes différents de discours et de silence,
05:39 parce que les possibles, quand on est à l'intérieur du pays et à l'extérieur du pays,
05:44 parce que les possibilités d'expression ne sont pas les mêmes,
05:48 la formulation d'idées, les échanges sur les idées ne sont pas forcément les mêmes,
05:55 donc il y a les régimes de vérités différents qui s'imposent à l'intérieur et à l'extérieur,
06:00 ce qui nous fait beaucoup d'acteurs qui agissent à l'intérieur et à l'extérieur du pays,
06:08 et qui diffusent des sources aussi variées.
06:12 Sur la page suivante, je vous ai mis juste quelques références,
06:22 mais je n'ai pas le temps d'en parler, parce qu'évidemment notre projet de recherche
06:26 est conceptualisé en fonction et en parallèle avec d'autres initiatives d'analyse et d'approche conceptuelle.
06:39 Il y avait quelques références dans le PowerPoint.
06:42 Mais l'importance est que, à l'intérieur et à l'extérieur du pays,
06:46 nous avons beaucoup d'acteurs qui produisent et qui produisent les sources aujourd'hui,
06:52 qui conservent, collectent, donnent accès à des sources, avec la technologie numérique,
06:58 ce qui nous fait aussi les formes de sources qui sont disponibles et qui sont très différentes.
07:04 Très brièvement, juste trois exemples.
07:09 Nous avons d'abord tout un ensemble d'acteurs qui agissent à l'intérieur du pays.
07:14 Je n'ai pas mis ici le titre, mais nous les appelons archives.ir,
07:17 parce que nous n'avons pas physiquement accès à ces archives,
07:21 parce que nous faisons partie des gens qui écrivent des choses et qui produisent des discours
07:29 qui ne s'alignent pas forcément avec quelques impératifs vraiment importants
07:33 pour les acteurs politiques qui sont actuellement en place à l'intérieur du pays.
07:39 Donc nous avons affaire vraiment à des institutions archives.ir
07:45 qui mettent beaucoup de documents d'archives historiques vraiment précieux,
07:50 identifiables comme sources potentielles importantes pour notre recherche,
07:54 mais qui sont disponibles sous forme de représentations numériques,
07:59 à quelles nous avons affaire.
08:02 Et après l'analyse que nous avons faite dans l'environnement numérique,
08:06 ces substituts numériques sont souvent contextualisés de façon intellectuelle, artificielle,
08:12 avec une ignorance importante du contexte documentaire original.
08:16 Next slide please.
08:19 Donc en parallèle avec ça, à l'extérieur de l'Iran,
08:24 nous avons un faisceau d'acteurs qui agissent dans un régime de vérité totalement différent.
08:30 Ce sont des acteurs, des activistes, des chercheurs, les ONG, associations,
08:36 qui collectent des témoignages et les mettent aussi en ligne,
08:41 de façon partielle, à cause de sensibilité, d'extrême sensibilité de ces données,
08:46 souvent sous forme de transcription nativement numérique.
08:50 Next slide please.
08:52 Donc juste troisième exemple,
08:55 et évidemment nous avons les archives physiques,
09:00 nous avons livres, nous avons rapports,
09:02 qui pressent, qui sont conservés sur des supports non numériques
09:05 par les centres de recherche, par les institutions,
09:08 par les centres d'archives ou les archives privées.
09:11 Next slide please.
09:13 Donc nous avons conçu une base de données complexe pour présenter tout cela.
09:18 L'ensemble d'acteurs, des entités, des ressources,
09:22 les acteurs qui jouent des rôles différents,
09:24 les ressources dont les types sont différents,
09:27 et au moment où nous avons entamé ce travail,
09:30 il y avait encore la toute première draft, je pense, de RIC,
09:35 et donc nous avons examiné la possibilité
09:38 d'utiliser les standards évoques et bullaires classiques,
09:41 Dublin Core, ISA-J, ISAAR, ISDIA,
09:44 et là, évidemment, le problème était qu'aucun de ces standards
09:48 évoques et bullaires ne permettaient pas de présenter
09:50 l'ensemble des entités et ressources auxquelles nous avons pensé,
09:53 et donc j'ai vraiment apprécié la remarque de Meryl Girlings,
09:57 des archives municipales d'Amsterdam,
09:59 qui pointait justement notre problème que, par exemple,
10:02 l'ISA-J ne permet pas de décrire les sources nativement numériques.
10:05 Donc, techniquement aussi, en plus,
10:09 nous n'étions pas certains de pouvoir réunir ces anciens standards
10:12 ensemble en une seule base de données,
10:14 et à ce moment-là, il y avait aussi la question du budget,
10:19 qui était importante en fait, parce qu'il fallait calculer tout ça,
10:21 et à ce moment-là, nous nous sommes tournés
10:24 vers le modèle conceptuel du RIC,
10:25 et nous avons vraiment apprécié beaucoup d'aspects.
10:28 J'ai mis un cours résumé ici,
10:30 mais tout brièvement, le vocabulaire vraiment abstrait,
10:33 donc pour nous, c'était une solution énorme,
10:35 parce que ça nous permet de traiter l'ensemble d'acteurs et de ressources
10:39 en utilisant le même type de métadonnées.
10:42 Le nombre de relations, qui est impressionnant en fait,
10:46 et aussi, pour certaines relations,
10:49 le choix de les présenter de façon aussi souple,
10:53 comme par exemple "has provenance", qui est très général,
10:56 et dans notre cas de figure, c'est très utile,
10:58 parce qu'en fait, souvent, on ne comprend pas
11:01 le rôle concret qu'un tel acteur joue
11:04 dans la diffusion d'une telle ou telle source.
11:06 Donc "has provenance", c'est très large,
11:08 et c'est une solution pour nous.
11:10 Certains attributs qui permettent de discuter de façon analytique
11:14 question d'authenticité, intégrité, c'est crucial,
11:16 et enfin, justement, cette différence établie entre RIC et instantiation,
11:21 ces instantiations en fait,
11:23 qui est importante, parce que ça nous permet
11:25 de traiter les cas de figure difficiles,
11:27 comme par exemple, nous n'avons simplement pas accès
11:30 à l'instantiation authentique, toute première,
11:33 et nous ignorons même si ça existe,
11:37 mais nous avons affaire à des institutions instantiations
11:41 numériques, ou nativement numériques,
11:45 même peut-être les transcriptions d'un REC,
11:47 qui existait apparemment dans les années 80,
11:49 qui existe peut-être quelque part.
11:51 Donc, si j'ai le temps, après,
11:54 je vais donner un exemple très concret,
11:56 mais ce sera après l'intervention de Maël,
11:58 parce que, qui va présenter justement EURIST,
12:01 parce que, nous, notre équipe a décidé de faire intégrer
12:06 le modèle conceptuel de RIC dans EURIST,
12:08 et nous l'avons fait parce que vraiment,
12:10 enfin, ça c'est juste un partage d'expérience,
12:13 nous avons trouvé que c'est un outil simple
12:16 et pratique dans l'usage,
12:18 et nous avons voulu simplement participer
12:20 au développement de cet outil,
12:22 dans l'espoir que les autres équipes de recherche,
12:24 et peut-être éventuellement les archivistes,
12:26 puissent en servir. Maël, je te passe la parole.
12:28 Donc, je vais vous parler brièvement d'EURIST
12:37 et vous vous dire un peu ce que c'est.
12:39 En fait, EURIST, c'est un système de construction,
12:41 de gestion et de partage de bases de données
12:43 qui a été conçu à l'origine pour et par la recherche
12:45 en sciences humaines et sociales.
12:47 C'est développé, entre autres, par Ian Johnson,
12:49 comme une boîte à outils,
12:51 et ça a été vraiment développé au fur et à mesure,
12:53 et ça continue d'être développé
12:55 en lien avec tout un tas de projets de recherche
12:57 qui viennent nous voir et nous disent "Nous, on voudrait ça,
12:59 on voudrait ça, on a besoin de ça".
13:01 Et donc c'est dans ce cadre-là aussi que Offsite
13:03 est venu et nous a dit "Nous, on voudrait ça
13:05 et surtout, on voudrait utiliser Rixem".
13:07 Ce qu'il y a derrière, c'est un système
13:09 un système hybride de GraphNoSQL
13:11 avec une base MySQL.
13:13 Mais en fait, quand on parle d'EURIST,
13:19 on parle d'une infrastructure
13:21 avec trois composantes distinctes.
13:23 D'abord, une structure,
13:25 une structure SQL qui est derrière
13:27 que les utilisateurs ne voient pas mais qui est
13:29 très flexible et à la fois standardisée.
13:31 Un logiciel EURIST
13:33 qui est open source.
13:35 C'est un outil qui est assez facile
13:37 à prendre en main pour manipuler les bases de données
13:39 et c'est ça que
13:41 les utilisateurs voient.
13:43 Et puis, des serveurs EURIST,
13:45 un ensemble de serveurs dans le monde, mais entre autres,
13:47 en France, c'est hébergé sur les serveurs de Humanoom,
13:49 où on a à la fois
13:51 le logiciel qui est hébergé sur le serveur
13:53 et puis les bases de données qu'on va
13:55 concevoir. Après, si vous voulez,
13:57 c'est aussi possible de télécharger le logiciel
13:59 et de l'installer sur vos propres serveurs
14:01 mais ce sera à vous de le maintenir.
14:03 Je vais venir là-dessus, s'il vous plaît.
14:05 Et donc EURIST
14:07 permet de faire tout un tas de choses.
14:09 Là, vous avez une vision d'ensemble de l'interface.
14:11 La suivante.
14:13 D'autres visions de comment
14:17 on structure
14:19 les données, comment on construit les données.
14:21 La suivante.
14:23 Si ça arrive. Donc, en fait, avec EURIST,
14:29 ce qu'on peut faire, c'est à la fois
14:31 créer notre structure de données, remplir les données
14:33 dans l'interface et puis,
14:35 par la suite, gérer tout un tas
14:37 de requêtes pour pouvoir interroger nos données.
14:39 C'est aussi là que les chercheurs
14:41 sont particulièrement intéressés.
14:43 Je vais bien la suivante. Et puis,
14:45 la dernière chose qu'on n'a pas tellement faite
14:47 avec Offsite, mais c'est qu'on peut
14:49 publier sous forme
14:51 de sites Internet
14:53 des sites qui permettent de requêter les données
14:55 pour le public avec, bien sûr,
14:57 des accès plus restreints
14:59 que ce qu'on peut avoir quand on a accès à l'outil derrière.
15:01 Et donc là, vous avez quelques exemples de sites.
15:07 Qui arrive ?
15:09 Et donc, avec Natalia,
15:11 on a implémenté
15:13 RICCM.
15:15 Vous avez un morceau
15:17 de graphes sur lequel on ne voit, bien sûr,
15:19 absolument rien. Mais en fait,
15:21 on a implémenté chacune des
15:23 entités.
15:25 Sous EURIST, ça fonctionne en termes d'entités,
15:27 de champs,
15:29 attributs et de relations. Du coup, c'était assez simple
15:31 de pouvoir
15:33 mapper. C'est ça qu'on a dû faire.
15:35 C'est ça qui a été le plus long, de mapper l'ensemble
15:37 des entités et des champs pour que ça
15:39 corresponde à des formulaires dans EURIST
15:41 et que ça s'intègre dans la base de données.
15:43 Donc, vous avez...
15:45 Vous pouvez voir ce que ça donne quand on clique sur une visualisation.
15:47 On ne voit pas grand-chose, mais
15:49 au jour d'aujourd'hui, on a
15:51 implémenté l'intégralité
15:53 des entités.
15:55 Pas tous les champs
15:57 parce qu'on partait des besoins
15:59 de off-site et certains champs
16:01 et certaines entités,
16:03 par exemple, mandate, ne sont pas vraiment utiles pour off-site.
16:05 Donc, on ne s'est pas attardé sur ça.
16:07 Mais c'est tout à fait possible de les développer par la suite.
16:09 Et puis, l'intégralité des relations
16:11 ont déjà été mises en place.
16:13 La suivante...
16:15 Et ce qui permet aujourd'hui, pour quelqu'un
16:21 qui voudrait développer une base de données
16:23 en RIC, d'aller très très
16:25 rapidement en créant une nouvelle base
16:27 de données. Donc, si vous allez sur le serveur de EURIST Humanum,
16:29 vous tombez là-dessus. Vous pouvez
16:31 cliquer sur
16:33 "New users" et ça va vous...
16:35 Je veux bien la suivante... Vous tombez assez rapidement
16:37 sur un tout petit formulaire qui vous demande, en gros,
16:39 ce que vous voulez faire.
16:41 Après, vous pouvez cliquer directement
16:43 parce que ça va aller assez vite.
16:45 Et donc, on a ce premier formulaire.
16:47 On enregistre notre base de données. On se retrouve sur une base
16:49 de données relativement vierge.
16:51 Et à partir de là, on peut importer
16:53 l'ensemble de la structure
16:55 RIC CM qu'on a mise en place.
16:57 Et ce qui va importer toutes
16:59 les entités, tous les champs.
17:01 Et donc, vous partez sur une base
17:03 vierge où vous allez pouvoir
17:05 commencer à rentrer des données,
17:07 que ce soit, on a vu, les records,
17:09 les agents, etc., dans des
17:11 formulaires et de faire les liens entre eux.
17:13 Je vais bien la suivante. Et peut-être
17:15 une petite précision, mais je pense que Natalia en reparlera
17:17 rapidement. C'est aussi
17:19 très simple de rajouter des champs. C'est-à-dire que si
17:21 vous avez des champs et des besoins qui sont
17:23 spécifiques, qui ne sont pas d'ENRIC CM
17:25 ou qui ne sont pas d'ENRICO, on peut rajouter
17:27 des champs. On l'a fait pour certains
17:29 parce que ça fonctionnait, parce qu'il y avait les
17:31 besoins. Et c'est très simple de rajouter.
17:33 Donc là, vous avez un exemple de... Après,
17:35 4-5 clics et une petite dizaine de minutes,
17:37 vous avez un formulaire tout prêt
17:39 pour commencer à rentrer des données.
17:41 Il y en a peut-être une dernière
17:43 où on peut voir les relations, mais globalement,
17:45 c'était simplement pour que
17:47 vous puissiez voir un peu à quoi ça ressemble
17:49 visuellement une fois que vous êtes lancé.
17:51 - Grosso modo, ce que
18:01 Maëlle a présenté, nos formulaires
18:03 à nous, on les a
18:05 un peu changés.
18:07 Ce que je veux dire, surtout,
18:09 c'est que c'est assez facile de modifier
18:11 la structure et l'essentiel, c'est que
18:13 vos données restent intactes.
18:15 Je ne vais pas donner un exemple
18:17 concret que je voulais donner, cette différence
18:19 entre RECET et Instantiation et à quoi
18:21 ça peut vraiment servir.
18:23 A nous, ça aide beaucoup.
18:25 Mais il y a d'autres
18:27 captures d'écran
18:29 dans PowerPoint, donc vous pouvez
18:31 les regarder.
18:33 N'hésitez pas à s'adresser
18:35 à nous et surtout à l'équipe
18:37 RIST qui est magnifique
18:39 pour des questions.
18:41 Merci pour votre attention.
18:43 [Silence]

Recommandations