• l’année dernière
Xerfi Canal a reçu Alain Goudey, Directeur Général Adjoint du Numérique à Neoma Business School, pour parler de l'après ChatGPT. Une interview menée par Jean-Philippe Denis.

Category

🗞
News
Transcription
00:00 Bonjour Alain Goudet.
00:09 Bonjour Jean-Philippe.
00:10 Alain Goudet, vous êtes directeur général adjoint du numérique Neoma Business School.
00:14 Alain Goudet, enseignement, recherche, ce sont les deux missions fondamentales d'une institution
00:20 d'enseignement supérieure. Si on parle recherche après Chadjipiti, j'ai envie de vous poser la
00:25 question brutalement, est-ce que la recherche c'est fini ?
00:27 Alors oui et non. Ça dépend du type de recherche. Je crois qu'une distinction qui commence à émerger,
00:35 c'est justement la distinction entre contenu et connaissance. La recherche vise à produire de la
00:39 connaissance et non pas simplement à produire du contenu, sous-entendu des articles qui ne
00:44 génèrent pas suffisamment de questionnements et donc derrière de connaissances. Si on regarde
00:48 l'impact de l'IA générative et de ces technologies, il est absolument colossal dans le processus de
00:54 recherche. Par exemple, si on considère l'état de revue littérature, ce type d'outils plutôt
01:00 intelligence artificielle et non pas intelligence artificielle générative va par exemple permettre
01:05 d'identifier assez rapidement sur un sujet, sur un concept, sur une méthode O, quels sont les
01:10 articles qui parlent. Et du coup, ta revue littérature va être automatisée et on va
01:18 aussi pouvoir identifier quels sont les attracteurs, c'est-à-dire les articles
01:22 vraiment fondateurs sur lesquels se greffent un certain nombre d'articles, filles ou parents en
01:28 tout cas, de cet article. Donc c'est extrêmement intéressant parce que finalement on va éviter
01:33 le phénomène de passer à côté d'un article absolument important dans un courant de littérature.
01:40 Ça c'est un premier point. Le deuxième point, c'est que, et là pour le coup l'IA générative
01:45 permet de faire ça, on peut aussi imaginer finalement déverser tous ces articles qui ont
01:49 été identifiés pour désormais en tant que chercheurs rentrer en conversation avec l'ensemble
01:55 de ces contenus. Quel est l'intérêt ? Cela permet par exemple de repérer des liens entre des concepts
02:01 qu'on n'a pas forcément identifiés. Donc tous les articles de type méta-recherche sur tel ou tel
02:07 sujet vont être à la fois simplifiés, parce qu'on va pouvoir les opérer beaucoup plus rapidement,
02:12 mais également amplifiés parce qu'on va être beaucoup plus exhaustifs sur la volumétrie
02:17 d'articles qu'on va mobiliser dans ces méta-recherches. Et le dernier point sur cet aspect-là,
02:23 c'est que quelque part on va pouvoir rentrer en conversation avec l'ensemble de ce corpus-là pour
02:29 justement identifier des idées, tester peut-être des hypothèses sur la base de données déjà
02:34 existantes. Donc ça c'est sur la partie vraiment revue littérature. Ce qui est intéressant aussi,
02:39 c'est que les IA génératives, si on regarde par exemple le code interpréteur de OpenAI sur un
02:45 chat GPT, permet de faire quoi ? Ça permet d'éverser en fait les données et lui demander
02:50 une pré-analyse, et lui demander de sélectionner les meilleurs outils statistiques pour sortir
02:56 une data visualisation qui soit la plus pertinente et la plus parlante possible. Donc en fait ce type
03:03 d'outil ne va pas remplacer le chercheur, puisqu'on va être très clair, les IA et les IA génératives
03:08 ne pensent pas par elles-mêmes, elles ne comprennent pas ce qu'elles génèrent. En revanche, ça va être
03:15 en quelque sorte un peu le miroir de la pensée du chercheur, et donc du coup probablement accélérer
03:20 le processus de recherche. Plus que jamais, ça veut dire la qualité des questions posées,
03:25 la qualité des sujets traités, la qualité aussi de voir loin, c'est-à-dire de voir bien au-delà
03:31 de l'IA. Je vous écoutais là, je me disais, je pense à toute l'Open Science, ResearchDucate,
03:36 etc. Tous les articles sont disponibles en Open Access. Ça peut être un vrai piège, parce que
03:41 ça veut dire que tous les contenus disponibles aujourd'hui, JPT les bouline. Tout à fait,
03:45 alors on ne sait pas, puisqu'aujourd'hui, sur notamment le modèle JPT4 de OpenAI, on ne sait
03:52 pas du tout quelles sont les sources de données qui ont été ingérées. Donc aujourd'hui, on ne sait
03:56 pas dire si ResearchDucate a été ingéré et digéré, j'ai envie de dire, par l'algorithme d'IA
04:02 générative. Mais effectivement, tous ces contenus qui sont ouverts et accessibles sur Internet,
04:08 on peut partir du principe qu'effectivement, ils ont été intégrés dans le corpus d'analyse de
04:13 l'IA générative. Typiquement, aujourd'hui, c'est une notoriété publique, Wikipédia représente à
04:17 peu près 0,14% de ce qu'on appelle les tokens. Donc, dans le modèle de données, Wikipédia pèse
04:24 0,14% de l'ensemble des données qui ont été avalées par l'algorithme d'OpenAI. On rappellera
04:30 que JPT est parfois présenté comme co-auteur de papier, dès à présent. Puis deuxième chose,
04:35 il peut se tromper quand même dans les sources, la manière dont il attribue les sources. Donc,
04:40 grande, grande prudence parce que ça peut être un piège aussi.
04:42 Oui, de toute façon, ça c'est une remarque valable pour le chercheur, mais également pour
04:47 le professeur, voire les étudiants. Sur ces outils de création de contenus, il est extrêmement
04:52 important de vérifier le contenu, de vérifier les sources. Pour autant, là aussi, les choses
04:57 évoluent très vite puisque OpenAI a ouvert publiquement les plugins autour de ChatJPT.
05:03 Notamment, il y a des plugins dédiés spécifiquement à la recherche et qui font
05:08 que les résultats générés sont encore plus fiables en termes de sources bibliographiques.
05:13 Donc, en fait, ça ouvre vraiment un potentiel extrêmement large au niveau de la recherche.
05:18 Moment à la fois terrifiant et fascinant. Merci à vous Alain Goudet.
05:23 Je vous en prie. À bientôt.
05:24 [Musique]

Recommandations