Le projet ORESM
Un inventaire commun : des données sémantisées
Le projet Œuvres et Référentiels des Étudiants, Suppôts et Maîtres de l’université de Paris au Moyen Âge [ORESM], vise à rassembler et publier différentes ressources documentaires sur la vie universitaire parisienne, du XIIe au XVIe siècle.
Il propose notamment de publier un inventaire qui permettra de reconstituer virtuellement les fonds d’archives issus de l’ancienne université et des collèges parisiens, aujourd’hui répartis entre différentes institutions de conservation.
Il cherche aussi, à travers des analyses poussées faites sur les documents, à constituer un référentiel de personnes physiques ayant séjourné dans ces structures d’enseignement.
Cette journée d’étude présentera les dernières avancées du projet, notamment la progression des travaux de dépouillement des archives des collèges parisiens, la publication en ligne d’un premier inventaire et enfin la transformation des données descriptives archivistiques en données RDF, conformes à la toute nouvelle ontologie Records in Context, qui offrira à terme aux chercheurs des possibilités de recherche encore plus poussées.ORESM est coporté par la Bibliothèque interuniversitaire de la Sorbonne et le Centre Lucien-Febvre (université de Franche-Comté). Ce projet repose sur un partenariat avec des unités de recherche, comme le Laboratoire de médiévistique occidentale de Paris, et des institutions de conservation, comme les Archives nationales qui financent cette journée. Il bénéficie du soutien du LabEx Hastec, de la région Île-de-France (DIM-SCTN) et de CollEx-Persée.
Un inventaire commun : des données sémantisées
Le projet Œuvres et Référentiels des Étudiants, Suppôts et Maîtres de l’université de Paris au Moyen Âge [ORESM], vise à rassembler et publier différentes ressources documentaires sur la vie universitaire parisienne, du XIIe au XVIe siècle.
Il propose notamment de publier un inventaire qui permettra de reconstituer virtuellement les fonds d’archives issus de l’ancienne université et des collèges parisiens, aujourd’hui répartis entre différentes institutions de conservation.
Il cherche aussi, à travers des analyses poussées faites sur les documents, à constituer un référentiel de personnes physiques ayant séjourné dans ces structures d’enseignement.
Cette journée d’étude présentera les dernières avancées du projet, notamment la progression des travaux de dépouillement des archives des collèges parisiens, la publication en ligne d’un premier inventaire et enfin la transformation des données descriptives archivistiques en données RDF, conformes à la toute nouvelle ontologie Records in Context, qui offrira à terme aux chercheurs des possibilités de recherche encore plus poussées.ORESM est coporté par la Bibliothèque interuniversitaire de la Sorbonne et le Centre Lucien-Febvre (université de Franche-Comté). Ce projet repose sur un partenariat avec des unités de recherche, comme le Laboratoire de médiévistique occidentale de Paris, et des institutions de conservation, comme les Archives nationales qui financent cette journée. Il bénéficie du soutien du LabEx Hastec, de la région Île-de-France (DIM-SCTN) et de CollEx-Persée.
Category
📚
ÉducationTranscription
00:00 [Musique]
00:12 Bonjour à tous. Alors je salue tout d'abord les collègues qui sont venus
00:19 assister ce matin à cette journée d'études.
00:21 Je salue également les collègues en ligne qui se sont inscrits et qui suivent
00:26 également ce que nous allons exposer ce matin et je remercie tout particulièrement
00:32 Laurie Aoustet de l'Abis pour l'organisation que nous avons essayé de
00:36 conduire tant bien que mal pour que cette journée d'études puisse se tenir ce matin.
00:39 Alors pour ma part, conformément à ce qui était annoncé dans le programme,
00:43 je vais vous parler des travaux de dépouillement qui ont été effectués
00:47 sur les archives des collèges parisiens et puis comme l'a expliqué Thierry,
00:52 je reprendrai la main en fin de matinée pour remplacer Florence Claveau et
00:56 exposer un peu ce que l'on peut faire avec le format RDF.
01:02 Alors comme Florence n'est pas là ce matin et qu'elle avait une plage de temps
01:07 assez large, on en a lâchement profité pour étendre un peu nos premières
01:12 présentations parce que forcément je serais beaucoup plus rapide que serait
01:15 Florence sur le RDF connaissant moins bien la question qu'elle. Mais je vais
01:18 en profiter dans le cadre de cette séance pour rappeler un peu les
01:21 objectifs du projet Auresm et le périmètre archivistique dans lequel il
01:25 s'inscrit.
01:27 Voilà alors j'espère que tout le monde nous entend bien côté distantiel.
01:38 Alors oui je parle dans le micro parce que c'est pour la vidéo, voilà c'est pour
01:48 la captation et normalement il y a une pieuvre pour ceux qui sont à distance.
01:52 Alors je vais essayer de parler plus fort pour vous qui êtes au fond à ce
01:54 moment là, si c'est ça le problème.
01:58 Alors donc je vais rappeler le périmètre archivistique dans lequel
02:02 s'inscrit le projet, rappeler les objectifs et puis enfin on abordera le
02:07 modèle de données qui a été progressivement affiné au fil de ces
02:10 deux dernières années, puisque à l'épreuve des dépouillements il a fallu
02:14 faire des choix et parfois restreindre certaines ambitions initiales pour
02:18 pouvoir avancer plus efficacement sur les dépouillements, qui est une
02:22 opération toujours très longue et exigeante. Et donc enfin je livrerai un
02:26 petit bilan qualitatif des travaux qui ont été conduits en 2022, travaux qui
02:29 ont été financés par le LABX Aztèque et donc c'est pour ça que nous
02:34 organisons aussi cette journée, c'est parce que nous nous étions engagés fin
02:38 2021 à participer à ce projet financé par le LABX et donc dans nos
02:43 engagements il y avait la tenue de cette journée de bilan pour exposer les
02:47 travaux réalisés avec le financement du LABX. Alors le périmètre archivistique,
02:54 en gros dans quel type de documents nous nous inscrivons, sur quelle période
02:59 chronologique, dans quelles institutions de conservation allons-nous trouver les
03:03 sources qui sont étudiées par le projet Oresm. Ce n'est pas une surprise pour vous
03:07 mais bon pour ceux qui ne connaîtraient moins bien l'histoire des archives de
03:10 l'Université de Paris, des collèges parisiens, je vais faire un petit rappel sur la
03:14 dévolution des fonds à partir de la révolution.
03:16 Nous avons des fonds d'archives qui sont disséminés aujourd'hui dans de nombreuses
03:20 institutions. Alors il y a des principaux gisements.
03:26 La règle théorique c'était qu'effectivement on devait déposer aux archives
03:31 nationales à partir de la révolution les archives des anciennes corporations
03:34 dans lesquelles donc sont incluses les universités et les collèges
03:40 parisiens. Ça c'est le principe théorique avec la
03:44 loi du 7 Messie d'Or en 2. Tous les dépôts publics de titre sortissent aux
03:48 archives nationales comme leur centre commun.
03:49 L'approche très géométrique toujours à la révolution. Dans les faits cette
03:54 concentration aux archives nationales est toute relative pour plusieurs raisons.
03:58 Tout d'abord parce que dans l'esprit de la loi du 7 Messie d'Or en 2, ce qui était
04:03 la priorité c'était plutôt les archives d'essence domaniale parce qu'on était
04:07 dans le contexte de nationalisation des biens du clergé, de revente de ses biens.
04:10 Donc comme le dit l'article 6 de cette loi du 7 Messie d'Or en 2,
04:15 tous les titres domaniaux en quelques lieux qu'ils existent appartiennent aux
04:18 dépôts de la section domaniale des archives. Et il y a sans doute eu une
04:22 priorité de récupération de ces archives domaniales par les archives
04:26 nationales dont c'était le rôle en fait, un des rôles premiers dans l'esprit de
04:31 cette loi du 7 Messie d'Or en 2. Alors il y a eu plusieurs concentrations de
04:37 documents, beaucoup de documents des collèges ont été concentrés en fait, ont
04:42 été regroupés dans l'ancien collège Louis-le-Grand, devenu ensuite à l'époque
04:46 collège Egalité puis Britannée. Il y a aussi eu des dépôts qui ont été
04:50 effectués à l'hôtel de ville et parfois des dépôts directs au sein de la
04:56 section domaniale des archives nationales, avec aussi des
05:00 reconcentrations, c'est à dire des transferts depuis Louis-le-Grand vers
05:03 l'hôtel de ville puis ensuite vers les archives nationales. Alors il y a aussi
05:09 le fait que cette loi du 7 Messie d'Or en 2 se concentrait donc comme je l'ai dit
05:13 sur les archives des sens domaniales et prévoyait de distribuer ou de répartir
05:19 en tout cas entre les bibliothèques les archives qui étaient destinées à
05:22 l'érudition et à l'histoire, c'est ce qui est écrit ici. Les charts et
05:26 manuscrits qui appartiennent à l'histoire, aux sciences et aux arts et qui
05:28 peuvent servir à l'instruction seront réunis et déposés à savoir à Paris, à
05:32 la bibliothèque nationale et dans les bibliothèques départementales, ce qui
05:35 explique que donc certaines bibliothèques ont conservé une partie de ces archives
05:40 issues des collèges et de l'université et qu'il y a aussi eu des transferts à ce
05:46 moment là. Ensuite à partir de la restauration il y a également eu un
05:53 transfert depuis les archives nationales vers une commission d'instruction
05:57 publique d'une partie des fonds de l'université et de quelques collèges
06:00 parisiens parce qu'avec le changement de régime politique il y a eu des nouveaux
06:06 arbitrages donc les archives nationales ont délivré une partie de ces fonds là
06:10 qui ont été ensuite intégrés ou versés, je sais pas comment dire, en 1865 à la
06:16 bibliothèque de la Sorbonne donc c'est le fonds d'archives dont est aujourd'hui
06:20 héritier la bibliothèque universitaire de la Sorbonne.
06:24 Alors il y a aussi eu des mouvements de reconcentration au 19e siècle, tout ça
06:28 est vraiment assez compliqué à démêler mais on sait qu'il y a eu plusieurs
06:32 versements en provenance de certaines bibliothèques vers les archives
06:35 nationales qui entre temps ont aussi changé leur fusil d'épaule puisque les
06:39 archives nationales se sont aussi entendues si je puis dire comme une
06:42 institution de recherche, d'érudition, donc ce rôle n'était plus seulement
06:45 l'apanage des bibliothèques et ce qui explique donc la volonté de
06:48 reconcentrer les archives des différents producteurs.
06:52 Donc il y a eu des échanges de manuscrits notamment entre les archives
06:56 nationales et certaines bibliothèques ou tout simplement des transferts, ça a
07:00 été le cas par exemple pour la bibliothèque Mazarine en 1834, pour la
07:04 bibliothèque nationale en 1862 on a procédé à des échanges de manuscrits
07:07 puisque les archives nationales ayant aussi confisqué les archives des
07:13 églises parisiennes avaient non seulement récupéré les archives mais aussi les
07:17 manuscrits qui se trouvaient dans la bibliothèque de ces églises donc ces
07:20 manuscrits ont servi en quelque sorte de monnaie d'échange pour récupérer en
07:24 retour des archives. Et puis le dernier grand versement a été celui fait par la
07:29 faculté de droit en 1932 qui a versé aux archives nationales les archives qui
07:34 restaient en sa possession notamment des archives du 18e siècle.
07:37 Donc voilà si vous voulez brosser à grands traits ces mouvements de
07:41 dispersion et de reconcentration mais qui vous expliquent pourquoi aujourd'hui on
07:44 trouve des documents d'archives ou des manuscrits dans de nombreuses
07:47 institutions pour l'histoire de l'enseignement à Paris.
07:50 Alors donc avec le projet Oresme nous réalisons enfin le vœu d'Auguste
07:56 Vallée de Viriville qui est un érudit chartiste qui avait écrit une histoire
08:02 de l'instruction publique en France qui avait fait date en 1849 et qui écrivait
08:06 "nous devons espérer que l'autorité publique prendra quelques jours les
08:10 mesures nécessaires pour concentrer définitivement du moins autant que
08:13 possible ces documents qui perdent par leur dispersion une grande partie de
08:17 leur valeur et pour mettre fin à un état des choses aussi contraire à la
08:20 loi qu'à l'intérêt des lettres". Voilà ça c'était un bel argumentaire.
08:23 Donc voilà 150 ans après grâce au financement du LABEX,
08:29 même 170 ans après grâce au financement du LABEX, nous sommes en train de réaliser ce
08:36 vœu au moins virtuellement. Alors les principaux gisements archivistiques qui
08:42 sont visés par le projet Oresme, alors on se concentre vraiment sur la
08:47 période délimitée entre le XIIIe et le XVIe siècle, c'est à dire que le
08:50 projet Oresme ne se concentre pas sur les archives postérieures à 1600, il fallait
08:56 mettre des limites chronologiques.
09:00 Alors aux archives nationales on va trouver trois principaux ensembles
09:06 puisque aux archives nationales aussi au XIXe siècle on a réparti les archives
09:10 non pas par producteurs mais par thèmes, si vous voulez dans un cadre de
09:16 classement méthodique, ce qui explique qu'aujourd'hui les archives de ces
09:19 producteurs sont principalement réparties entre trois séries.
09:21 Tout d'abord la série M, vous avez le titre 2, qui représente un métrage linéaire de 21,4 mètres linéaires.
09:32 Alors cette série qui dépendait de la section
09:38 historique est censée concentrer les actes les plus historiques, les actes de
09:44 fondation, les réglementations, les privilèges, tout ce qui reflète
09:48 l'activité intellectuelle de l'université ou au sein des collèges.
09:52 Mais dans les faits on voit bien qu'en série M on va aussi trouver des actes de
09:56 nature domaniale, fiscale ou financière.
10:01 Alors les archives comptables quant à elles se trouvent en série H, alors c'est
10:07 l'ancienne sous série H3, archives comptables des collèges.
10:10 On va trouver notamment des livres de comptes, des listes de boursiers, de
10:15 pensionnaires, des pièces justificatives de dépenses, différentes quittances.
10:19 C'est une série qui je pense mériterait à moyen terme en tout cas d'être
10:24 dépouillée par rapport au nom de boursier ou nom de personne que l'on peut
10:28 trouver dans ces comptes qui sont assez riches. Et enfin donc le plus gros
10:33 ensemble est constitué par la série S, 56 mètres linéaires, où on va trouver
10:38 les archives et les titres fonciers, notamment les titres de propriété de
10:43 terrain et de maison dans Paris, des beaux, des rentes, des états de revenus mais
10:49 aussi des inventaires d'archives, c'est à dire des inventaires de l'époque
10:54 moderne, principalement du 18e siècle, qui livre pour de nombreux collèges un
11:00 état des archives tel qu'elles étaient au sein de ces établissements.
11:04 Donc cette série me paraît plus intéressante à terme pour étudier
11:09 l'implantation foncière au sein de Paris et aussi en dehors de Paris,
11:14 parce qu'il y a également des terrains qui sont dans des régions périphériques
11:18 à Paris. Donc ce serait intéressant de dépouiller ces séries là pour justement
11:24 estimer cette emprise foncière des établissements d'enseignement.
11:29 Alors du côté de la biotech interuniversitaire Sorbonne, on va
11:34 retrouver la même logique finalement de répartition qu'en série MWM, c'est à
11:39 dire qu'aux archives nationales on a classé d'un côté en série M les
11:42 cartons et les liasses et en série WM les registres.
11:45 Finalement on retrouve cette logique dans les fonds de la biotech
11:50 interuniversitaire Sorbonne où d'une part on va trouver les registres sous
11:54 l'ensemble qui est coté MSAU, Archives de l'ancienne Université de Paris
12:00 registres et puis on va trouver les cartons sous l'ensemble MSAUC.
12:04 Donc pour les inventaires d'archives de la BIS vous avez donc la liste sur
12:12 Calam
12:14 avec un inventaire très fin
12:23 ensuite il y a le temps de chargement
12:28 voilà où notamment vous avez les fonds relatifs à l'Université de Paris
12:41 je vais peut-être agrandir un peu
12:53 avec là encore une logique archivistique de présentation des ressources du plus
13:03 général au plus particulier avec une arborescence structurée. Voilà Archives
13:07 de l'ancienne Université de Paris registres
13:11 on arrive ici jusqu'au niveau du groupe de documents et ensuite des analyses
13:19 progressivement à la pièce où on registre et de même donc pour les cartons
13:27 voilà vous allez trouver ensuite liasse par liasse des analyses de chaque pièce
13:32 contenue dans ces liasses avec les principaux champs de description
13:36 archivistique
13:45 on a également sur Nubis la numérisation de certaines de ces archives en couleur
13:53 par exemple ici vous voyez un document qui rentre pleinement dans le périmètre
14:01 du projet une lettre de Philippe Lebel célèbre adressée donc aux officiers
14:11 interdisant de contraindre par la force les maîtres et étudiants d'université au
14:14 paiement de leurs dettes
14:16 donc une numérisation d'excellente qualité est très agréable à consulter
14:22 donc ils font autant de gisements de données qui seront réutilisés par le
14:26 projet
14:28 alors on s'était également rapproché de la biotech interuniversitaire santé qui
14:33 conserve de son côté neuf registres de commentaires produits par l'ancienne
14:37 faculté de médecine de paris qui est au registre qui sont également décrits et
14:44 consultables sous forme numérisée sur médica et puis il ya encore d'autres
14:49 dépôts d'autres gisements qui sont intéressants pour les actes notariés il
14:55 ya également le minutier central département du ministère central des
14:58 notaires parisiens des archives nationales qui avait lequel département
15:02 a aussi produit une base des actes relatifs au collège donc là aussi c'est
15:08 une mine pour repérer des noms d'étudiants de maître et puis elle
15:14 registre d'insinuation du châtelet dans lequel on enregistre aussi ces actes
15:17 notariés et puis on va le voir il ya également des gisements dans les
15:23 archives départementales principalement des documents d'origine foncière
15:27 puisque comme je l'ai dit tout à l'heure école et université disposés de terrain
15:31 de rente qui était situé en dehors de paris et donc on produisait aussi
15:35 localement sur ces biens des archives qui ensuite ont été versés aux archives
15:40 départementales à la révolution
15:45 alors voici un donc le périmètre archivistique du projet je rappelle ici
15:51 les objectifs d'oresme qui comme cela a été rappelé en introduction des
15:56 objectifs multiples un projet protéiforme premier grand de réalisation
16:03 c'est un inventaire commun à l'ensemble des institutions de conservation de ces
16:07 archives c'est ce qui sera ce qui fera l'objet de la présentation suivante un
16:13 référentiel de personnes alignées donc sur d'autres ressources mais aussi une
16:20 formalisation des données sous forme de graphes rdf pour se représenter
16:24 autrement les données qui sont en notre possession et bien entendu un portail qui
16:31 rassemble l'ensemble de ces ressources pour offrir un accès unifié aux
16:36 chercheurs alors pour alimenter tout ça et bien nous avons besoin de données
16:42 alors par rapport aux données de l'inventaire
16:45 nous sommes partis de l'existant qu'il y avait dans chacune de nos institutions
16:51 comme il s'agit de descriptions d'archives et bien on se moule dans
16:55 différentes normes c'est à dire que les informations sont catégorisées selon la
17:00 norme isat-g qui est la norme de description internationale des archives
17:03 et pour la diffusion de ces informations on se repose sur un formalisme xml en
17:08 utilisant une dtd qui s'appelle donc la dtd ead pour un codé d'archival
17:13 description description archivistique encodé donc ça c'est le principe mais
17:19 dans les faits nous avons affaire à des inventaires qui ont des niveaux de
17:25 précision inégaux c'est à dire que les notices vont être plus ou moins riches
17:31 plus ou moins fournis selon les inventaires et puis le niveau de
17:35 description va être plus ou moins fin c'est à dire que pour l'exemple des
17:40 archives nationales que je connais le mieux en série m on a beaucoup de
17:44 descriptions à la pièce alors que dans la série s par exemple on va rester au
17:48 niveau de la liasse c'est à dire qu'on va pas voir de d'état plus de précision
17:53 sur l'ensemble des pièces qui composent une liasse on va plutôt avoir une liasse
17:57 c'est à dire un ensemble de beaux pour la période allant de temps à temps
17:59 voilà de quoi parle c'est beau de quel bien
18:03 voilà ensuite il faut dépouiller un peu plus finement surtout pour le repérage
18:07 d'éventuels noms de personnes voilà il ya aussi une hétérogénité formelle
18:12 puisque on se rend compte que le format xml ead à l'avantage donc d'être un
18:16 langage commun mais dans les faits quand ce langage est implémenté il ya
18:21 souvent des dtd maisons par exemple aux archives nationales nous avons notre
18:25 propre dtd ead qui est conforme à ce que permet notre système d'information
18:30 archivistique et en fait on se rend compte que selon les éditeurs
18:33 logiciels et bien chacun et implémentent la le ad à sa façon donc ce qui explique
18:38 qu'on ne peut pas s'échanger on peut s'échanger bien sûr des fichiers ad mais
18:42 il faut toujours les retravailler quand on fait le choix d'un système de
18:45 publication commun donc ça suppose là encore des
18:49 transformations d'ordre informatique remouliner autrement les données pour
18:54 qu'elle puisse les publier dans le système cible
18:58 voilà donc par exemple je vous ai montré ici la forme que prennent les
19:03 inventaires de l'abysse sur calam pour ce qui est des archives nationales
19:08 forcément étant donné que les séries ont été gérées par des sections
19:11 différentes au 19e siècle que certaines ont été plus ou moins prioritaire dans
19:15 leur traitement par rapport à d'autres on a des descriptions plus hétérogène
19:19 voilà comme je disais en série m la majeure partie de nos descriptions sont
19:24 à la sont à la pièce mais c'est parfois seulement à l'alias et puis pour les
19:28 séries h et s on est plutôt sur un répertoire numérique c'est à dire qu'on
19:31 reste à la grande à la granularité de la cote
19:34 donc liasse ou description du registre en ce qui concerne la série m il ya eu
19:38 plusieurs étapes de formalisation les le premier inventaire c'est un inventaire
19:43 sur fiches réalisé donc par par doué d'arc et roulant au 19e siècle
19:49 cet inventaire sur fiches et ensuite été formalisé à la fin des années 70
19:55 sous forme d'actilographie et donc là vous avez l'inventaire qui avait
19:58 réalisé jean-pierre babelon ou là on voit bien que l'on a une analyse d'un
20:04 document qui est présenté ainsi lettres de philippe lehardy sur les
20:09 réparations exigées d'abbaye de saint germain des prés pour des essais commis
20:14 contre des écoliers on voit qu'il ya un autre acte c'est une aide de philippe le
20:17 bel qui est à l'une rente sur le châtelet donc en fait on se rend compte
20:20 que là on a deux analyses d'actes qui se trouvent en fait dans un vidimus de
20:25 l'officiel de paris donc aujourd'hui on en tant qu'archiviste on présenterait
20:29 sans doute les choses autrement c'est à dire qu'on dirait qu'on a un vidimus
20:32 produit par l'officiel et que dans ce vidimus on a deux actes qui sont
20:35 reproduits voilà alors que là l'analyse laisse penser que en fait c'est une aide
20:41 de philippe lehardy puis une aide de philippe lebel c'est à la fin qu'on comprend que
20:43 c'est un vidimus cet inventaire de jean-pierre babelon avait été ensuite
20:48 restructuré sous forme bureautique par isabelle aristide en 2004 donc on
20:53 retrouve la même analyse vous voyez avec des précisions supplémentaires sur le
20:57 support parchemin renvoie à des éditions ou des analyses dans du boulet et
21:02 jordain mais vous voyez que la forme de rédaction reste la même aujourd'hui
21:08 quand on passe donc par notre système de description archivistique on présente
21:12 les choses comme je disais autrement c'est à dire que dans l'intitulé analyse
21:15 principale de l'acte on va énoncer que c'est un vidimus de l'officiel de paris
21:19 et dans la description du contenu on va rentrer dans le détail en disant que
21:24 deux actes ont été vidimés dans ce projet un acte donné à poissy en juillet
21:28 1278 par philippe lehardy et un autre en juillet 1286 par philippe lebel
21:33 voilà donc on a retravaillé progressivement la présentation de ses
21:36 inventaires comme ceci
21:40 là encore en répartissant évidemment les informations de manière un peu plus
21:44 structurée dans les différents champs et en essayant de renseigner des
21:47 informations sur l'histoire archivistique du document à la faveur du projet ores
21:51 on repère aussi les anciennes quotations de ces documents là et où est ce dans
21:59 quel inventaire en fait parce qu'on a des inventaires aussi d'archives de
22:03 l'époque moderne dans quel inventaire on va retrouver cette pièce et sous quels
22:05 codes ce qui nous permet là encore de restituer l'épaisseur archéologique
22:08 épaisseur archivistique du document en voyant ces différentes quotations et
22:15 entre les mains de qui le document s'est trouvé précédemment
22:20 donc l'intégration de tous ces ensembles de données ead c'est un travail qui sur
22:26 le papier peut sembler simple mais qui est en fait complexe et donc c'est ce
22:30 que nous présenterons arsène et sébastien dans la présentation
22:33 suivante alors de même on se rend compte que il est nécessaire de faire des
22:40 indexations des descriptions plus fines que ce que l'on disposait au départ du
22:45 moins pour les notices archives nationales notamment en vue de préparer
22:49 la conversion de ces données sous forme de graphes rdf il ya des enrichissements
22:53 à ces notices qui sont nécessaires par rapport à ce que je vous ai montré
22:59 tout d'abord l'un des objectifs du projet comme on l'a dit c'est de réchire la
23:04 liste des individus ayant séjourné dans les structures d'enseignement à paris
23:08 donc ce qui suppose d'effectuer là encore des relevés de noms de personnes
23:13 pour mieux les appareiller avec des ressources déjà existantes et
23:16 évidemment en premier lieu à la base studio parisiennes et on a également
23:22 besoin de repérer des noms de lieux parce que l'on souhaite aussi
23:26 géolocaliser les individus pouvoir retracer leur parcours leur trajectoire
23:31 leur déplacement géolocaliser également les manuscrits dont ils peuvent être les
23:34 auteurs là je renvoie un billet aussi qui a
23:38 été fait à ce sujet sur le carnet au reste avec ici une géolocalisation des
23:43 manuscrits produits par nicolas et puis on s'est dit aussi qu'il était peut-être
23:51 utile pour les chercheurs de retrouver les documents non seulement par leur
23:56 objet alors ça c'est ce qu'on énonce dans les analyses mais aussi par le type
23:59 d'action juridique qu'ils énoncent et leur contexte de production donc là
24:03 aussi ça suppose de faire un relevé des types de documents et des statuts des
24:08 documents qui sont des choses que on ne décrivait pas forcément là encore très
24:13 finement dans les précédents inventaires c'est pour ça donc on a
24:16 essayé de mettre au point aux archives nationales un référentiel des types de
24:20 documents médiévaux et de statut en s'inspirant en grande partie du
24:24 vocabulaire international de diplomatique qui est très complet donc
24:29 on a élaboré pour le projet un référentiel où on distingue le type de
24:34 documents dans leur forme diplomatique et les types de documents dans leur
24:38 action juridique parce qu'on se rend compte que une même action juridique
24:41 peut prendre des formes diplomatiques différentes c'est à dire une lettre
24:44 patente ou un diplôme va peut-être énoncer une même action juridique telle
24:48 qu'une donation donc dans le cadre du projet ce que l'on
24:51 privilégie c'est le type d'action juridique il y a également la notion
24:55 d'état du document c'est à dire qu'on n'a peut-être pas finalement à faire un
24:59 original mais seulement à une copie du 18e siècle une copie érudite ou alors
25:05 que le document en question est en fait vidimé dans un autre acte
25:09 donc c'est bien aussi de pouvoir énoncer le statut de document c'est pour ça
25:13 qu'on a élaboré donc sous forme d'un tableau qu'on a transmis à Florence
25:17 Claveau et dont s'est servi aussi Louise Gousseau, un tableau recensant ces types
25:22 d'actions juridiques et ces catégories de statut voilà par exemple ici vous
25:29 avez tous les types de copies qu'on peut trouver copie authentique copie insérée
25:33 copie informe tout ça c'est dans cette logique en fait de sémantisation
25:38 des données dont on parlera à la fin pour avoir des données particulièrement
25:42 bien qualifiées et donc pour ça on a besoin de se reposer sur des
25:46 vocabulaires contrôlés sur des ontologies en fait qui recensent toutes
25:50 ces notions et tous ces concepts. Alors j'en viens à présent donc au modèle de
25:56 données qui a été élaboré donc on s'est rendu compte que les notices
26:04 existantes et bien elles avaient l'avantage d'exister de décrire en
26:08 majorité des documents à la pièce mais qu'on n'avait pas forcément relevé tous
26:12 ces éléments dont je viens de parler et qu'on a voulu collecter pour les
26:17 besoins scientifiques du projet. Donc on avait un besoin de revenir sur les
26:22 notices descriptives existantes et de les étoffer. C'est pour ça donc qu'on a
26:27 conduit des campagnes de dépouillement à partir des documents originaux
26:31 c'est notamment Louise Gousseau qui a été vacataire à la BIS qui s'est chargée de
26:37 ce travail.
26:40 Elle s'est appuyée pour cela sur des consignes élaborées par un groupe de
26:44 travail dédié aux métadonnées qui en concertation avec le conseil scientifique
26:47 du projet Oresm a élaboré une grille de dépouillement. Alors il y a une première
26:53 grille d'analyse qui a été mise au point pour effectuer le relevé d'informations
26:57 en juin 2021. Cette grille donc a fait l'objet on va dire de tests en condition
27:02 réelle sur le fond du collège des Cholets au deuxième semestre 2021.
27:07 Et donc c'est suite à cette première expérience que l'on a vu le temps que
27:10 cela prenait, on s'est rendu compte que certaines informations pouvaient être
27:15 saisies ultérieurement ou simplifiées. C'est pour ça que cette grille a été
27:19 révisée donc l'année dernière avec la simplification ou la suppression de
27:24 certains champs. Alors la grille d'analyse en fait est alimentée sous
27:30 forme de tableur. Alors je vais essayer de vous en montrer un.
27:35 Donc voilà la forme que peuvent prendre ces tableaux de dépouillement.
27:45 Donc on voit que pour le collège des Cholets ici 284 actes ont été analysés,
27:53 reprenant en partie certains éléments qui étaient fournis dans les inventaires
27:58 préexistants. Donc là par exemple l'inventaire des
28:01 archives nationales mais qu'ensuite donc on a ajouté d'autres informations et
28:07 surtout qu'on les a catégorisées par champs. D'une manière donc beaucoup plus
28:10 structurée même qu'en EAD. Donc en tout il y a 32 champs si je ne me
28:17 trompe pas qui peuvent être remplis. Alors je vais vous les présenter, ce sera
28:22 plus plus explicite. Le but en fait c'est que ces données soient
28:26 retransformées ensuite en EAD pour qu'elles soient injectées d'une part dans
28:30 les notices existantes mais surtout donc dans l'inventaire commun au projet. Et
28:37 également ces données seront transformées en graphe de données RDF
28:40 donc selon l'ontologie "recorded in context" par le lab des archives nationales.
28:44 Donc c'était ce que Florence aurait dû vous présenter ce matin mais donc elle
28:48 m'a dit qu'elle transmettrait ultérieurement une présentation qu'on
28:51 pourra charger sur le carnet de recherche du projet, sur hypothèse. Alors la
28:59 grille d'analyse, 32 champs d'informations qu'on peut répartir si vous voulez à
29:02 grande maille dans les principales catégories d'ISADG, donc dans les
29:07 différentes zones. Tout d'abord l'identification du document. De nombreux
29:12 champs sont relatifs au contenu de ce document. Ensuite il y a tout un ensemble
29:17 d'informations relatives à l'historique de la conservation, des informations pour
29:22 la description matérielle et physique du document et enfin donc tout ce qui
29:25 concerne l'accès et les sources complémentaires.
29:31 Sans oublier bien sûr les informations d'indexation de lieux et de personnes
29:34 que j'ai évoquées tout à l'heure. Alors on va prendre un exemple, ce
29:39 document là, qui est issu du Collège des Cholets. Alors je vous ai reproduit en
29:44 dessous la notice originale des archives nationales
29:47 M112 Collège des Cholets, fondation pieuse, donc un sous-ensemble des archives
29:52 du Collège des Cholets. Acte numéro 11, fondation par Jean Le Caron,
29:55 Chanoine de Noyon, Nanobit et de 14 livres de rente.
29:59 Donc ça c'est en fait ces exécuteurs testamentaires qui exécutent ces
30:03 dernières volontés. Et donc en fait c'est un acte qui en fait vidime un autre acte,
30:09 notamment donc les dispositions testamentaires. Acte dont vous avez ici
30:16 le verso, puisqu'on s'intéresse également aux mentions dorsales contenues sur le
30:20 document. Et donc les informations vont être réparties ensuite comme ceci, c'est
30:27 à dire qu'on va reprendre l'identifiant, on va donner pour le guide commun un
30:32 identifiant unique au document, donc qui n'est pas forcément signifiant mais qui
30:35 permet d'identifier informatiquement de manière unique le document.
30:39 On libelle la cote actuelle en la faisant précéder du nom, enfin de
30:44 l'identifiant de l'institution, donc là en l'occurrence c'est FRAN, donc FR
30:48 Archives Nationales, M112 numéro 1. Ensuite vous avez une analyse synthétique,
30:54 ou si vous préférez un regeste, qui est principalement donc une reprise de ce
30:58 qui avait été déjà rédigé par les archivistes, la date donc sous sa
31:03 forme littéraire et sous sa forme normalisée, et puis un premier ensemble
31:06 d'informations qui sont dédiées au lieu de passage de l'acte. Toujours utile pour
31:10 géolocaliser le document dans son lieu de production.
31:12 Donc ici en l'occurrence ce document est passé à Shawnee, donc on rentre la forme
31:17 du nom, enfin le toponyme, mais aussi également les coordonnées géographiques
31:21 pour pouvoir ensuite représenter cela dans un système cartographique. Un
31:26 identifiant unique du don de lieu qui est l'identifiant INSEE. Si la localité se
31:31 situe hors de la France, avec des limites de la France actuelle, on précise aussi le
31:35 pays. Alors comme je disais, l'acte principal n'est pas toujours forcément
31:40 le plus intéressant. Ce qui est parfois mis en lumière ou en valeur, c'est l'acte
31:44 qui est vidimé, notamment quand il s'agit de privilèges accordés par les
31:48 rois de France qui sont vidimés par leurs officiers.
31:50 C'est bien souvent cet acte là qui est plus important à titre historique.
31:55 Donc chacun de ces actes doit faire l'objet d'une analyse spécifique.
31:59 Donc là aussi on répète selon qu'il s'agit d'un acte inséré ou d'un acte
32:04 vidimé. On va répéter ces informations là, donc en faisant un regeste spécifique
32:09 à l'acte vidimé, et là encore en renseignant son lieu de passage, sa date, et en
32:16 lui donnant une cote, un identifiant. Alors si par ailleurs le document
32:20 vidimé existe toujours par ailleurs, on lui donne sa cote actuelle. Si c'est un
32:24 document qu'on n'a pas retrouvé ou qui a disparu, on lui donne un identifiant
32:26 unique, comme c'est le cas ici. Voilà en l'occurrence l'emplacement de
32:33 l'acte inséré, qui est un acte en latin alors que le reste de l'acte est en
32:37 français. Alors en ce qui concerne l'indexation, donc comme je vous disais on
32:44 va utiliser les types d'actions juridiques d'une part pour qualifier
32:47 l'action, en tout cas du document. De même on va indexer les lieux qui sont cités
32:55 dans l'analyse ou dans le regeste. Donc là c'est vraiment une indexation au sens
32:59 archivistique, c'est à dire qu'on indexe ce qui a été annoncé dans l'analyse.
33:04 Également donc le statut, là aussi on va se référer au référentiel des
33:08 statuts que j'ai évoqué tout à l'heure. Et enfin donc relever des noms de
33:14 personnes, personnes physiques ou morales ayant un lien, notamment un lien de
33:19 production avec l'acte. Donc c'est là où on a fait le choix en tout cas
33:27 d'attribuer des rôles à ces différentes personnes. Donc auteur au sens
33:34 diplomatique, c'est à dire l'auteur du document c'est celui dont l'autorité
33:38 est énoncée par le document, mais c'est pas forcément lui qui s'est
33:42 chargé de le mettre par écrit, ça peut être un tabellion qui s'est chargé de
33:45 cette tâche là, c'est pour ça qu'il y a un rédacteur. Et de même si cet acte est
33:50 produit par une personne morale, on précise que cette institution morale
33:54 est l'auteur de l'acte, c'est à dire que l'acte est produit dans le cadre des
33:57 attributions dévolues à cette institution. Donc on essaie aussi pour ces
34:02 personnages d'ajouter quelques informations d'ordre bibliographique,
34:07 c'est à dire les fonctions qu'ils ont pu assumer, leur date d'existence, mais
34:12 parfois évidemment il est difficile de retrouver ces informations et donc on
34:15 laisse certains champs vides.
34:18 Louise Bousso s'est aussi chargée de préciser s'il y avait des mentions
34:23 dorsales au dos du document. Dans la première version on lui avait
34:27 demandé de transcrire mais on s'est avéré que c'était long et on a fini par
34:32 convenir que c'était pas forcément le plus intéressant, mais en tout cas au
34:34 moins on sait qu'il y en a et que les chercheurs pourront revenir sur ce point
34:39 là. On précise s'il y a des mentions hors teneur également, on précise si la date
34:44 a fait l'objet d'une conversion en nouveau style ou pas pour la critique
34:47 diplomatique, et également il y a une estimation du nombre d'individus
34:53 mentionnés dans le document. C'est à dire qu'on ne fait pas forcément le relevé de
34:56 tous les noms, parce que là aussi ce serait une tâche très longue, mais au
34:59 moins on peut dire aux chercheurs "ben voilà dans ce document vous allez
35:02 trouver un certain nombre de noms, vous allez pouvoir revenir dessus" et là encore
35:06 compléter ses premiers dépouillements. En ce qui concerne la description
35:11 physique du document, on va avoir des informations sur la volumétrie,
35:15 nombre de pièces quand il s'agit du NIAS, évidemment là comme on est sur
35:20 une description à la pièce c'est un document, mais parfois ça peut être deux
35:23 documents attachés ensemble, le support, les dimensions en millimètres, hauteur
35:28 largeur, éventuellement des appréciations sur l'état matériel.
35:32 On s'est rendu compte que le fond des archives du collège de Cornouailles
35:36 était par exemple assez dégradé, donc on subit une campagne de restauration, et puis
35:41 des informations sur le sellement. En ce qui concerne l'historie de la
35:47 conservation, on s'appuie sur les mentions dorsales là aussi, c'est à dire que très
35:51 souvent on retrouve au dos du document des anciennes cotes.
35:55 Le but étant donc de relever ces cotes, d'essayer de les dater, et ensuite
36:00 d'essayer de retrouver dans quel inventaire elles peuvent avoir cette cote.
36:03 Ce qui nous permet ensuite à terme, ce qui nous permettra à terme, de retracer le
36:06 parcours archivistique des documents. Là aussi c'est une des potentialités que
36:11 va nous offrir RDF, c'est de pouvoir reconstituer à la volée le fond
36:14 d'archives d'une institution en fonction de ces informations là, de date, de cote,
36:18 et de type d'inventaire, enfin de l'inventaire dans lequel ces documents
36:22 apparaissent. Sur les conditions d'accès, on précise si la langue des documents
36:27 est en français ou en latin, éventuellement autre, de même s'il y a un
36:32 alphabet autre que le latin, ça nous semble intéressant de le préciser.
36:35 Et enfin, tout un ensemble de champs sont dédiés à ce qu'on appelle les sources
36:39 complémentaires, c'est à dire des ouvrages dans lesquels on va retrouver
36:43 mention du document, ou bien analyse du document dans le cadre inventaire, et puis
36:49 renvoie à d'autres ressources en ligne, renvoie aussi aux documents numérisés
36:53 s'il est également consultable en ligne.
36:58 Voilà, alors en plus dans cet exemple là, on avait Jean Le Caron, la personne qui a
37:04 dépouillé a proposé un appareillement de Jean Le Caron avec cette entrée là, de
37:07 la base Studioum. Donc c'est comme ça aussi qu'on va pouvoir, alors il faut
37:11 vérifier la validité du lien, mais on va pouvoir comme ça connecter nos propres
37:16 données avec les référentiels de noms de personnes déjà existants.
37:22 Enfin, donc pour finir, le bilan des travaux réalisés en 2022 par Louis
37:27 Zegusso. Vous remarquez que le 18 octobre 2022, il y avait déjà
37:32 1000 actes qui avaient été décrits, et bien on en a encore plus aujourd'hui.
37:37 Alors j'ai ici reproduit la liste des collèges parisiens, j'ai sur le nid en
37:43 rouge ceux qui ont fait l'objet d'un dépouillement, avec le nombre d'actes
37:47 recensés par l'avocataire. J'ai précisé donc les cotes qui ont fait
37:53 l'objet d'un dépouillement, donc soit cote AEN, soit cote BIS, soit éventuellement
37:58 cote archive départementale. Et puis les années de dépouillement, donc il y avait
38:03 le collège des Cholets qui a fait l'objet d'un premier dépouillement en 2021, qui a
38:08 été repris aussi en 2022, donc c'est pour ça que j'ai étendu ça sur les deux
38:12 années, et on voit donc qu'il y a 284 actes, compris dans la période chronologique
38:16 qui nous intéresse, je précise 13e-16e siècle, pas au-delà, qui ont
38:20 été, qui ont fait l'objet donc de cette analyse. Vous voyez par exemple pour le
38:24 collège des Cholets, c'est intéressant, on avait 52 actes aux archives de Loise,
38:28 par rapport aux biens qui étaient détenus par ce collège en Picardie.
38:34 Donc ce qu'on peut dire pour la Sorbonne, 69 actes, finalement pas tant que ça.
38:41 Le collège d'Arras, deux actes, vous voyez, ça a été très vite
38:45 pour certains collèges, et puis pour d'autres, on voit que ça a été beaucoup plus dense.
38:49 Ça c'est les hasards après de la conservation. Collège des 18, qui est donc
38:55 quand même le plus ancien, collège donc 88 actes. Le gros morceau, c'est quand même
39:00 le collège de Fortet, 491 unités. 35 donc pour le collège de Huban, qui a ce
39:08 fameux cartulaire qu'on utilise toujours grâce à ses illustrations et ses
39:13 enluminures, représentant les collégiens. Le collège du Cardinal Lemoyne, qui est
39:19 aussi un établissement important, sans carrémenter un acte. On voit qu'il y a 122
39:23 documents quand même pour ce collège-là aux archives de Seine-et-Marne.
39:27 Donc bien plus finalement qu'à l'Abysse ou aux archives nationales.
39:32 Le collège de Lisieux, et enfin donc pour terminer, La Marche, le collège de La
39:36 Marche, c'est le cas de le dire, je l'ai pas fait exprès, je n'avais pas prévu
39:40 cette transition là. 126 actes. Et enfin donc le collège de Navarre, qui est là
39:45 aussi un collège très emblématique par rapport aux fondations royales, 91 actes.
39:50 Voilà, ça ce sont les collèges qui arrivent en fin de liste.
39:54 Donc on peut totaliser, donc 12 collèges dépouillés et donc 1408 actes analysés
40:00 donc de la manière que je vous ai présenté. Donc on va voir à présent
40:05 comment ces données sont intégrées dans l'inventaire commun et puis on
40:09 terminera la matinée sur ce que l'on peut faire avec ces données aussi par
40:12 rapport au format RDF. Voilà, si vous avez des questions sur cette
40:17 présentation, n'hésitez pas.
40:20 Merci, moi j'ai une question sur la série S, donc qui est le gros
40:32 morceau qui serait à faire, je peux le projeter loin dans l'avenir sans doute,
40:37 avec 56 mètres linéaires mais il y a aussi des documents qui ne font pas
40:44 partie du périmètre archivistique de Oresme, du point de vue chronologique.
40:49 Est-ce qu'on pourrait avoir une idée pour les séries qui ne sont pas dépouillées
40:54 justement A, H, S de la part que représenterait Oresme ? Oui, on peut, sachant que
41:04 j'avais fait un premier recensement,
41:08 parce que je travaille aussi sur mon ordinateur personnel, je ne vais pas être là, mais je me
41:14 rappelle que j'avais fait une première recension, c'est à dire j'avais recensé
41:30 tous les dossiers pour la série S qui rentraient en fait dans le champ de la
41:35 période. Alors après évidemment si on veut estimer le métrage plus finement,
41:39 là il faut ouvrir les cartons. Je dirais 75% peut-être, parce que j'avais exclu de la
41:55 liste tous les dossiers qui sortaient de la fourchette chronologique, ce qui en
42:00 faisait déjà un certain nombre. Parfois on se rend compte qu'ici
42:06 par exemple on a une IAS qui est hors périmètre chronologique, mais je ne sais
42:09 pas quel importance matérielle elle peut faire, donc il faudrait calculer le métrage de
42:12 chaque IAS et le retrancher. Mais bon, quand on voit ce qui est en gris clair
42:17 ici, ça fait pas tant que ça finalement, c'est pour ça que j'ai tendance à dire là
42:22 où des beautés 75%. Après ce sont des documents assez génériques, assez
42:29 répétitifs, c'est à dire qu'on va toujours retrouver la même chose, des titres de
42:33 propriété, des beaux, des rentes, sur les différentes maisons par exemple qui
42:40 étaient détenues à Paris, qui sont qualifiées par maison à l'enseigne de...
42:45 Alors ça tombe bien que vous ayez ouvert le dossier Série S parce que d'abord la
42:52 description que vous avez là, c'est parce que moi je ne connaissais de
43:00 l'inventaire de la Série S que c'est un inventaire manuscrit, donc très
43:05 difficile à utiliser et finalement ce que vous avez présenté là, c'est la
43:11 transcription de cet inventaire manuscrit. Alors oui, cet inventaire
43:17 manuscrit a fait l'objet d'une dématérialisation
43:24 qui se trouve en fait en ligne en SIV, mais je n'en fais pas la publicité
43:30 parce que c'est un inventaire qui a été mal dématérialisé, c'est à dire que ça a été
43:35 fait dans une première vague de dématérialisation en 2012 et les codes
43:39 en fait dans l'inventaire ne sont pas facilement repérables.
43:42 Donc en fait pour tout vous dire je suis en train de le retravailler pour que la
43:46 présentation soit plus agréable, mais en fait on peut trouver ces analyses en
43:49 ligne. Et donc effectivement ce que vous avez ici bien c'est la transcription
43:53 de cet inventaire de la Série S. Par ailleurs pour la Série S il y avait un
43:57 inventaire spécifique qui concernait la Sorbonne que j'ai saisi et que j'ai
44:02 structuré dans le SIA des archives nationales et qui rejoindra les archives,
44:07 enfin les autres archives foncières en fait. C'est à dire on va intégrer la Sorbonne
44:11 avec les autres collèges dans une logique de fond.
44:14 Oui parce que en fait cette Série S est doublement intéressante pour le
44:20 projet parce que en réalité c'est vrai comme vous le dites il y a beaucoup
44:23 d'actes qui sont répétitifs qui concernent en fait des types de
44:29 propriétés mais d'un certain côté ça permet comme vous l'avez montré tout à
44:34 l'heure de voir quelle est la cise territoriale du patrimoine des
44:42 collèges et c'est ce qui explique aussi que certains collèges aient beaucoup de
44:45 sources dans les archives départementales parce qu'à ce moment là
44:49 aussi bon. Mais il y a quand même aussi un intérêt pour la prosoprographie
44:52 de l'université de Paris c'est que certains actes sont des actes de
44:55 reconnaissance de propriété par l'institution et on a des listes de
44:59 boursiers. Voilà donc c'est pour ça que ça fait disons un certain temps que l'on
45:03 tourne autour de cette Série S parce que la Série M vous avez montré
45:06 1400 actes alors en partie tirés de l'Abis, d'archives départementales mais
45:12 beaucoup de la Série M mais la Série S est de ce point de vue là extrêmement
45:16 riche vous l'avez là aussi rappelé. Alors ça c'est concernant
45:25 la Série S. Pour les autres séries on va arriver à un moment à
45:34 disons une question de choix parce que pour la Série WM par exemple qui sont
45:38 les registres on a des cartulaires donc qu'est ce qu'on fait puisque eux
45:42 alors pour le coup les actes ne sont pas décrits alors à moins que vous me
45:45 disiez vous avez une... là je me jetterais dessus parce que les actes ne sont pas
45:50 décrits donc dans les cartulaires or on a évidemment un gisement de copies
45:55 médiévales absolument énorme et donc c'est vrai que pour la Série H
46:01 que j'ai beaucoup utilisé pour ma thèse puisqu'on a des listes de boursiers dans
46:06 les comptes là aussi ce sont des horizons qui
46:11 s'ouvrent et qui évidemment n'épuisent pas du tout le sujet.
46:18 Je posais juste merci beaucoup Thierry pour vos remarques et par rapport au
46:22 effectivement aux cartulaires je n'ai pas à vérifier mais je me demande si dans les
46:26 papiers du père Léonard on n'a pas des analyses d'actes faites à partir de ces
46:30 cartulaires mais il faudrait que je regarde. Et c'est sans doute pas exhaustif.
46:35 Moi j'avais une petite chose à ajouter on a oublié un acteur dans ceux
46:40 qui ont favorisé les dépouillements c'est Labesse en fait puisque c'est
46:43 Labesse qui a financé le dépouillement fin des archives conservées à la
46:48 biotech de la Sorbonne. D'accord toutes mes excuses pour cette omission.
46:51 Et Jacqueline Hartier qui a beaucoup beaucoup contribué à ce dépouillement fin.
46:56 On avait une réunion avec Labesse en 2020 sur notamment la façon d'utiliser
47:01 les identifiants. Bonjour, Juliette Gestas du département du manuscrit de l'Abisse.
47:07 J'ai deux questions. Vous avez évoqué des dépouillements du minutier central
47:11 très vite donc j'ai cru comprendre que vous parliez d'une base de données
47:15 spécifiques donc l'intégralité des études auraient été balayées pour
47:21 extraire les actes relatifs au... Pour le 16e siècle. D'accord. Et c'est consultable via la cive ?
47:27 C'est une base SINDOC en fait mais c'est une base SINDOC et je crois que
47:33 Michel Ollion avait travaillé à sa conversion mais je... il faudrait que je vérifie.
47:38 Et en tout cas... Je vous parle en ligne pour l'instant. En tout cas on avait transmis la base à Lucie Vieillon.
47:42 Normalement vous avez une copie de ces données.
47:45 Ma deuxième question c'est à propos des actes vidimés. Je n'ai pas compris si un
47:53 dépouillement des différentes typologies était fait pour les actes décrits, enfin
47:58 évoqués dans les actes de vidimés aussi ? Oui. Et du coup le système de
48:08 graphes permettra de mettre en relation un acte original avec les autres...
48:12 D'accord. C'est à dire qu'on pourra représenter en forme de graphes un acte
48:16 en tant qu'unité et le lien avec un autre document notamment s'il est
48:20 inséré dans un document maître. C'est ça l'intérêt par rapport à une
48:23 visualisation EAD c'est qu'on va pouvoir afficher cette granularité de manière
48:28 encore plus fine, plus facile. C'est à dire que là effectivement si on
48:34 cherche un acte vidimé il faut tenter une recherche plein texte et voir si ça
48:39 ressort dans l'analyse, dans le scope content ou description du contenu alors
48:44 qu'effectivement avec des données RDF on pourra dire "peu importe finalement si
48:48 c'est un acte original ou un acte vidimé je cherche l'acte de telle personne
48:52 produit à telle date" et on aura tout de suite le résultat par exemple. Et on
48:56 pourra voir dans quel contexte il s'insère plus facilement en tout cas.
49:01 Deux questions. Est-ce qu'on connaît les critères selon lesquels une partie du
49:07 fonds a été rétrocédée en 1820 ? Est-ce qu'il y a une logique entre ce qui a été laissé aux
49:10 archives nationales et ce qui a été restitué à la Sorbonne ?
49:15 Alors, j'avais essayé de chercher, j'ai pas trouvé... alors je pense que c'est une
49:21 demande qui venait de cette commission d'instruction publique de
49:25 l'Université des collèges pour obtenir la restitution de ces archives de l'Université des collèges.
49:29 Alors ensuite il y a seulement une partie qui a été rétrocédée mais j'ai pas
49:33 retrouvé de documents internes aux archives nationales en tout cas où on
49:36 aurait résumé ces choix là.
49:39 En fait je crois que ça a été très très mal perçu par les archivistes à
49:43 l'époque. Donc en 1865 c'est arrivé à la Sorbonne, en fait depuis le ministère
49:48 où c'était en fait, voilà dans la commission. Mais le ministère avait tenu, si j'ai bien compris,
49:55 à récupérer ces archives.
49:57 C'est ça, c'est arrivé à la restauration, on a voulu reconstituer je pense le fond et le rétablir dans son environnement de production initial.
50:04 Donc comme à la restauration, on revenait aussi sur ce qui avait été fait à la Révolution.
50:08 Mais voilà, ça explique effectivement, c'est resté au ministère de l'instruction publique,
50:12 il y a un inventaire même qui a été fait à ce moment là et c'est après seulement que
50:16 c'est arrivé à la biotech Sorbonne.
50:18 Mais il y a l'article de l'anglois je crois que tu m'avais signalé,
50:27 où il avait fait la recension de toutes les entrées extraordinaires, dont celle de la Mazarin, dont celle de la BNF,
50:35 où il se plaint dans une note de 20 pages assez assassine, où il dit que ça a été contraire au principe révolutionnaire et qu'on a oublié de le récupérer.
50:43 C'est amusant.
50:45 Si on regarde le fond des actes qui ont été transférés à terme à la bibliothèque de l'université, aux archives de l'université,
50:52 il semblerait que ce soit principalement les archives de la faculté des arts qui aient été finalement extraites des fonds des archives.
51:02 Sachant que les archives de faculté apparemment avaient été conservées par les facultés,
51:09 puisque la faculté de droit avait conservé ces archives qu'elle finit par verser aux archives nationales dans l'ordre de guerre,
51:16 et la faculté de médecine également, puisque la BIUS a conservé les anciens registres de la faculté de médecine.
51:23 Donc les choses n'avaient pas été aussi radicales.
51:26 Et finalement les archives nationales ont conservé l'essentiel des fonds des collèges,
51:33 qui là pour le coup c'est quand même une grosse partie, mais aussi apparemment la faculté de théologie, si je comprends bien.
51:42 Donc il faut imaginer que ces restitutions, ces transferts, tenaient compte aussi de structures institutionnelles de l'université de Paris à la fin du XVIIIe siècle.
51:55 Tout le monde ne conservait pas toutes les archives.
51:57 Oui.
52:04 La grille que tu nous as montrée vaut pour les actes, mais le projet n'entend pas se limiter aux actes.
52:11 Pour ce qui est des documents comptables, il va y avoir une autre grille de description, ou pour les autres typologies documentaires ?
52:18 Oui, c'est possible qu'effectivement on adapte la grille au support de type registre, c'est-à-dire livre de comptes, registre.
52:24 Si on parle sur les cartulaires par exemple, on pourrait reprendre cette grille en analysant chaque acte enregistré dans le cartulaire avec le folio.
52:33 Pour ce qui est des livres de comptes, là j'imagine que oui, on va plutôt se concentrer à mon avis,
52:37 on pourra décrire le compte en tant que tel, sa date, de quoi il traite,
52:43 mais je pense qu'on soignera le relevé des noms de personnes qui sont mentionnés dans le compte.
52:48 Il y aura sans doute une adaptation de cette grille, je pense, oui.
52:52 Quelles sont les conséquences de cette révision ?
52:55 Lorsque nous avons révisé le modèle pour aller plus vite, on s'était rendu compte qu'il y avait un problème de fragilité des financements pour ces dépouillements,
53:09 puisque très peu d'appels à projets permettent de faire des dépouillements fins, c'est un des gros problèmes.
53:17 Donc on s'est dit qu'il était important d'aboutir à une forme de masse critique pour le projet.
53:25 On a abandonné un certain nombre de choses et effectivement il y a des choses qui ont été repoussées à un deuxième temps,
53:30 comme par exemple la géolocalisation.
53:32 Donc là pour le moment on ne le fait plus, on pensait le faire en masse à partir des noms de lieux.
53:42 Donc ça nous semble plus simple de le faire dans un deuxième temps, peut-être même qu'on pourra avoir recours à une IA ou quelque chose comme ça.
53:50 Oui, sachant qu'il existe des outils de géocodage, comme la base d'adresse par exemple,
53:56 où on importe un tableau avec des listes de noms et puis on a le géocodage qui est généré,
54:01 alors qu'il faut vérifier, mais qui marche plutôt bien.
54:05 C'est plus simple que d'aller chercher les coordonnées géographiques à la main.
54:09 Merci, M. François, pour cette belle présentation.
54:22 [Musique]
54:27 [SILENCE]