• avant-hier
https://www.arcom.fr/actualites/troisieme-journee-detudes-de-larcom-presentation-des-travaux-des-chercheurs-sur-les-medias-audiovisuels-et-numeriques

Category

🗞
News
Transcription
00:00Pour conclure cette session, et en fait cette journée,
00:09nous allons entrer dans une question qui a déjà été adressée dans plusieurs discussions,
00:15en particulier dans la discussion de Rasmus et aussi dans la discussion d'Oana.
00:18Oui, vous pouvez cliquer ici. Je vais vous montrer.
00:22Pour discuter un peu plus, c'est celui-ci pour le slide,
00:27il y a une notion particulière qui est la diversité.
00:30Pour en parler plus en détail, je vais passer à Thierry Haltierman et à John Handley.
00:37Vous êtes tous à Ofcom.
00:39Ofcom est l'office de communication que vous connaissez probablement,
00:42qui est un régulateur du Royaume-Uni dans le domaine du broadcast,
00:47donc télévision, médias et radios.
00:49Donc je pense que ça fait beaucoup de sens d'avoir eux pour conclure la journée ici à Arcom,
00:54qui est aussi un régulateur.
00:57Et vous êtes deux analystes de données à Ofcom,
01:00et votre travail vous aidera à comprendre cette notion de diversité,
01:04parce que vous avez récemment conduit un travail dans lequel
01:07votre objectif est de quantifier et puis d'analyser la diversité des contenus.
01:12Alors, s'il vous plaît, dites-nous quelle est la perspective d'Ofcom sur la diversité des contenus.
01:18Oui, donc merci de nous avoir.
01:20Nous allons terminer par l'anglais.
01:23Je me sens très heureux.
01:25Ce n'est pas quelque chose que j'avais prévu,
01:27mais nous étions très heureux que le professeur Nielsen ait pu nous parler,
01:32ainsi que certains autres participants,
01:34parce qu'en parlant, je me suis rendu compte qu'ils faisaient beaucoup de travail pour nous,
01:38parce que beaucoup des choses que je voulais vous expliquer
01:41document certaines des découvertes qui existent sur la diversité, etc.
01:46Ils ont déjà fait ce travail,
01:47donc il va y avoir un peu de répétition ici, mais gardez-moi à l'esprit.
01:52Donc, c'est le titre de notre discussion,
01:54les intermédiaires en ligne et la diversité de la consommation de nouvelles.
01:58Donc, les intermédiaires en ligne, je pense que si vous avez payé attention aujourd'hui,
02:02vous saurez ce que nous parlons.
02:04Donc, c'est basiquement le milieu qui se trouve entre le producteur de nouvelles
02:09et le consommateur de nouvelles, n'est-ce pas?
02:11Donc, dans le contexte digital,
02:13ce que nous parlons ici, c'est principalement des moteurs de recherche,
02:16des médias sociaux et des agrégateurs de nouvelles.
02:20Il y a probablement maintenant plus d'acteurs dans ce domaine,
02:23mais quand nous avons fait cette recherche, c'est ce que nous nous sommes concentrés sur.
02:29Juste pour vous présenter, avant que vous fassiez n'importe quelle analyse de données sur cela,
02:34si vous deviez imaginer quel serait l'effet d'une augmentation de la reliance
02:39entre les intermédiaires en ligne et la diversité de la consommation de nouvelles,
02:44vous pourriez formuler des hypothèses qui vont de deux façons.
02:48Donc, vous pourriez dire, en mon avis, une augmentation de la reliance
02:52entre ces intermédiaires devrait améliorer la diversité de la nouvelle,
02:57et il y a basiquement deux mécanismes qui ont aussi été touchés aujourd'hui.
03:02L'un, c'est que l'algorithme ne servira que de ce contenu,
03:07et il a déjà détecté que vous étiez intéressé par ce contenu.
03:10Donc, lorsque vous lisez sur le football, je suis sûr que ça vous arrive,
03:15ça m'arrive quand je regarde des vidéos sur YouTube,
03:18le contenu devient très répétitif quand vous voyez ce qu'il y a,
03:22ce que sont les vidéos recommandées.
03:24L'algorithme s'adapte à ce que vous avez lu,
03:26à combien de temps vous avez passé à le lire ou à le regarder,
03:29et il va continuer de vous recommander des contenus similaires.
03:33L'autre, c'est le contenu sur les médias sociaux,
03:36où vous avez toutes ces connexions,
03:39et si ces connexions sont des gens comme vous,
03:42si ils aiment les mêmes choses que vous,
03:45si ils lisent les mêmes choses que vous,
03:48vous pouvez voir qu'il y a un certain mécanisme de renforcement.
03:52Vous ne verrez que les nouvelles que les gens qui sont déjà à votre camp lisent,
03:57et vous cliquez sur ça, vous partagez cette nouvelle,
04:01et ainsi de suite.
04:04Il y a un contre-argument à ça.
04:06L'un, c'est que, par design,
04:11ces intermédiaires en ligne pourraient en fait
04:14construire une certaine diversité dans leur feed de nouvelles
04:18et dans ce qu'ils vous montrent,
04:20juste pour combattre la boredom.
04:22Pour tester aussi parfois,
04:25si peut-être il y a un changement dans vos préférences,
04:28ou s'ils vous intéressent à quelque chose
04:30que vous n'avez peut-être pas exploré jusqu'ici.
04:33L'autre, c'est ce que je pense qu'on appelle
04:36la nouvelle incidentale.
04:38C'est simplement tomber sur la nouvelle,
04:40qui est connectée à votre réseau.
04:43Si vous êtes connecté à beaucoup de gens,
04:45il y aura beaucoup de faibles liens dans cette connexion.
04:48Vous pourrez voir dans le feed de nouvelles
04:51un lien avec le New York Times.
04:53Sur votre propre initiative,
04:55vous n'auriez peut-être jamais ouvert ce journal,
04:57mais vous le voyez là,
04:59il vous attrape l'attention,
05:02et vous cliquez sur le lien.
05:04Cela peut aller de deux façons.
05:10Pour conceptualiser la diversité,
05:12et c'est ce qui va être la clé de notre discussion,
05:15nous avons tous une compréhension intuitive
05:17de la diversité,
05:19mais souvent, comment nous l'opérationalisons,
05:21ou comment exactement nous la définissons,
05:24est probablement dictée par la disponibilité des données,
05:28ce que nous connaissons en fait
05:30du contenu de la nouvelle que les gens consomment.
05:33Traditionnellement,
05:35lorsque nous parlions de diversité ou de pluralité,
05:38je pense que ce que les gens avaient en tête
05:40était plus un type de diversité au niveau du marché,
05:43donc beaucoup plus proche des concepts
05:46comme la dominance du marché,
05:48ou à quel point il y a une famille
05:51ou peut-être une entreprise
05:53qui domine le marché de la nouvelle.
05:56On peut aussi la considérer
05:58en termes de points de vue,
06:00donc il est possible qu'il y ait
06:02beaucoup d'organisations de nouvelles différentes,
06:05mais peut-être qu'elles parient
06:07seulement aux lignes du gouvernement,
06:09ce qui est aussi une situation
06:11où il y a peu de diversité.
06:13Nos capacités de données et d'analyse
06:16nous ont amenés plus près
06:18à regarder la diversité sur le côté de la consommation,
06:21et c'est ce type de diversité
06:23que nous concentrerons sur dans cette discussion.
06:25Vous l'avez déjà vu,
06:27comme l'a démontré le professeur Nielsen,
06:30il y a une analyse de la diversité
06:33en termes de nombre d'outlets que les gens voient.
06:37Je vais vous montrer dans un instant,
06:39je vais vous donner le consensus de la littérature
06:42sur la diversité en termes d'outlets.
06:45Vous pouvez également regarder
06:47la liste de ces outlets,
06:49donc plutôt que de compter
06:51les outlets de nouvelles différentes,
06:54vous pourriez aussi essayer
06:56de mettre ces outlets
06:58à un certain point
07:00entre le spectre gauche-droite,
07:02et vous pourriez voir
07:04si les gens lisent des nouvelles
07:06de différentes sources de nouvelles
07:08sur ce spectre gauche-droite,
07:10ou n'importe quel autre spectre.
07:12Le type de diversité que nous concentrons ici
07:14va être la diversité des sujets,
07:16et ce sera directement lié
07:18à l'article de la nouvelle que les gens lisent.
07:21Le nombre d'outlets est souvent
07:23mesuré au niveau de l'outlet.
07:25Le nombre d'outlets est aussi,
07:27par nécessité, au niveau de l'outlet.
07:30Ce que nous allons faire différemment,
07:32c'est qu'on va regarder la liste de nouvelles
07:34que les gens ont vu,
07:36et on va essayer d'assigner
07:38chaque liste dans ce corpus de textes
07:40à un sujet,
07:42et on verra si les gens
07:44qui utilisent les intermédiaires en ligne
07:46peuvent voir
07:48un plus grand nombre de sujets,
07:50ou un plus éloigné.
07:54Le consensus ici,
07:56c'est quelque chose que vous avez vu
07:58dans notre discours de présentation.
08:01Les gens qui utilisent les intermédiaires en ligne,
08:04qui relient plus aux intermédiaires en ligne,
08:07ils tendent à voir des nouvelles
08:09d'un grand nombre d'outlets,
08:11mais non seulement ça,
08:13ils voient aussi des nouvelles
08:15d'outlets qui couvrent
08:17un plus grand nombre
08:19du spectre de gauche et de droite.
08:21Ce n'est pas que vous lisez
08:23des médias de gauche ou de droite,
08:25non, si vous êtes un conservateur,
08:27vous voyez parfois des articles
08:29de New York Times,
08:31si vous êtes un libéral,
08:33vous voyez parfois des nouvelles
08:35de Fox News ou autre.
08:37Parce que c'est l'après-midi,
08:39j'attends le résultat,
08:41alors que vous avez encore un peu
08:43d'attention à vous,
08:45un résultat que j'aimerais
08:47que vous vous souveniez
08:49de mon discours,
08:51c'est que, oui, nous pouvons
08:53réplicer ce découvert
08:55sur la diversité d'outlets.
08:57Les gens qui utilisent
08:59les intermédiaires en ligne,
09:01relativement aux gens
09:03qui vont directement
09:05à ces sites de nouvelles,
09:07ils apprécient en effet
09:09une consommation de nouvelles
09:11plus diverse en termes d'outlets.
09:13Les résultats sont tous positifs
09:15et significativement aussi.
09:17Mais si nous regardons
09:19la même mesure de diversité,
09:21mais que nous substituons
09:23les sujets pour les outlets,
09:25nous trouvons l'opposé
09:27pour les moteurs de recherche
09:29et pour les médias sociaux.
09:31C'est le résultat basé,
09:33et je passe maintenant
09:35au collègue.
09:37Je vais expliquer un peu
09:39les données que nous avons utilisées
09:41pour la modélisation du sujet.
09:43La clé
09:45pour faire cette analyse
09:47est ceci,
09:49les données de traçage passif,
09:51où nous prenons un certain nombre
09:53d'individus qui ont consacré
09:55et nous traquons
09:57toute leur activité Web
09:59sur leurs appareils,
10:01des ordinateurs, des téléphones,
10:03et ainsi de suite,
10:05pendant une période de temps.
10:07Nous l'avons obtenu dans ce cas
10:09grâce à l'agence IPSOS,
10:11qui nous a fourni
10:13un panel d'environ
10:1512 000 participants.
10:17Ensuite, nous avons fait
10:19quelques transformations
10:21afin de les utiliser
10:23pour cette analyse.
10:25La première,
10:27nous nous concentrons
10:29sur leurs visites
10:31à des sites Web
10:33pour les médias sociaux.
10:35En Allemagne, nous avons
10:37des sites Web
10:39comme le site BBC,
10:41le site Guardian,
10:43le site Daily Mail,
10:45et ainsi de suite.
10:47Nous avons vérifié
10:49chaque fois qu'un utilisateur
10:51est allé à un de ces sites Web
10:53et nous avons fait un effort
10:55en utilisant différents algorithmes
10:57que nous avons développés
10:59à l'intérieur
11:01pour vérifier si cette visite
11:03à un site Web
11:05s'apparaît directement
11:07sur le site Web.
11:09Il y a quelques caveats
11:11importants.
11:13L'un d'entre eux,
11:15c'est que nous ne pouvons pas
11:17observer les nouvelles
11:19que les gens regardent
11:21sur une application.
11:23Si quelqu'un clique sur
11:25l'application Facebook
11:27ou sur l'application Twitter,
11:29nous ne pouvons pas
11:31voir ces visites.
11:33Ce que nous avons fait,
11:35c'est que nous avons pris
11:37toutes ces visites
11:39à des sites Web
11:41que nous avions catégorisé
11:43comme directs ou
11:45d'un intermédiaire en ligne
11:47et nous avons écrit
11:49toutes ces nouvelles
11:51qui sont l'unité de l'analyse
11:53sur laquelle nous avons
11:55modélisé le sujet.
11:57Nous avons décidé
11:59de faire une liste
12:01avec des mots de jargon
12:03pour expliquer ce que nous avons fait,
12:05mais nous pensions que
12:07un exemple simple
12:09pourrait être plus intéressant.
12:11La modélisation du sujet
12:13commence par un pas,
12:15qui est d'assigner
12:17une représentation numérique
12:19à chaque headline
12:21dans le corpus.
12:23Pour ce faire,
12:25nous avons utilisé
12:27un modèle de langage
12:29qui nous donne
12:31un nombre très haut
12:33de dimensions
12:35qui représente
12:37abstractement
12:39le sens d'une phrase.
12:41Dans ce cas,
12:43nous pouvons imaginer
12:45que les headlines existent
12:47en deux dimensions.
12:49L'inquiétude est que
12:51lorsque les headlines
12:53apparaissent près d'un autre
12:55dans ce espace deux-dimensionnel,
12:57il y a une différence.
12:59La prochaine étape
13:01pour trouver des sujets
13:03est d'étudier les distances
13:05entre les paires de headlines
13:07dans cet espace.
13:09L'idée clé
13:11est que le sujet
13:13est une clustre de headlines
13:15qui sont plus similaires
13:17à l'un à l'autre
13:19que les autres headlines
13:21dans le corpus.
13:23Il y a quelques choix
13:25et selon l'algorithme
13:27le nombre de sujets
13:29que vous choisissez
13:31peut faire une grande différence.
13:33Dans ce cas,
13:35si la distance est relativement
13:37réduite,
13:39on peut obtenir
13:41moins de sujets
13:43qui contiennent plus
13:45d'articles
13:47que les autres.
13:49Si la distance est plus
13:51réduite,
13:53on peut obtenir
13:55moins d'articles
13:57qui contiennent plus
13:59d'articles que les autres.
14:01Pour terminer,
14:03je voudrais
14:05vous donner un exemple
14:07de trois sujets
14:09représentatifs
14:11que nous avons trouvé
14:13dans notre analyse.
14:15Pour certains contextes,
14:17les headlines que nous avons
14:19rassemblés sont
14:21les sujets
14:23représentatifs.
14:25Il y a Coronation,
14:27Emmerdale,
14:29EastEnders, Spoilers.
14:31Vous ne pouvez pas
14:33reconnaître ces mots,
14:35mais dans le contexte
14:37américain, ils parlent
14:39d'opéras de soie
14:41qui sont très populaires
14:43depuis longtemps.
14:45C'est un des sujets
14:47les plus importants
14:49que les gens regardaient.
14:51Mais il y a aussi
14:53plus de nouvelles politiques.
14:55Par exemple, il y a un sujet
14:57qui représente l'Afghanistan,
14:59les talibans, le Kaboul, les Etats-Unis.
15:01C'est lié à l'abandon
15:03des Etats-Unis
15:05de l'Afghanistan
15:07qui a commencé
15:09il y a peu de temps.
15:11Enfin, en 2021,
15:13il y a eu des mentions
15:15des vaccins, du coronavirus,
15:17et c'était un sujet
15:19très important
15:21à l'époque.
15:23Je passe maintenant
15:25au collègue Farad
15:27pour discuter
15:29de l'analyse économique
15:31et donner une vue plus détaillée
15:33des résultats qu'il a présentés.
15:39C'est exactement ce que j'ai besoin.
15:41Comme je vous l'ai déjà dit,
15:43il ne reste plus qu'une chose
15:45à faire,
15:47c'est parler un peu
15:49de notre mesure de la diversité.
15:51John a déjà mentionné
15:53notre principale variable indépendante
15:55de l'intérêt,
15:57c'est-à-dire
15:59le nombre de nouvelles
16:01qui viennent d'un intermédiaire
16:03en ligne.
16:05L'outil principal
16:07de l'intérêt
16:09est ce qu'on a déjà entendu
16:11dans le discours du professeur Nielsen,
16:13parce qu'il vient seulement
16:15d'un intermédiaire ou d'un sujet
16:17dont la diversité est relativement basse.
16:19L'intermédiaire au milieu
16:21contient plus de sujets,
16:23donc le consommateur
16:25voit quatre sujets différents,
16:27ce qui est plus diversifiant.
16:29Enfin, si l'on va de la distribution 2
16:31à la distribution 3,
16:33c'est encore plus diversifiant,
16:35car même si le nombre de sujets
16:37est le même,
16:39il n'est pas aussi concentré.
16:41Lors de la distribution 3,
16:43c'est toujours le cas,
16:45mais pas autant.
16:47On va donc scaler notre mesure de la diversité
16:49jusqu'à la minimum observée
16:51et à la maximum observée,
16:53et mettre ça à 0-1.
16:55En termes de qualité,
16:57comme je l'ai dit,
16:59plus de reliance
17:01sur les intermédiaires en ligne
17:03va avec plus de diversité
17:05en termes du nombre
17:07d'outils que l'on voit,
17:09en termes de search engines
17:11et de médias sociaux.
17:13Je peux arrêter ma présentation
17:15maintenant,
17:17si vous voulez.
17:19Quand on a vu les résultats,
17:21on a pensé
17:23que c'était un cool résultat,
17:25un résultat contre
17:27la common wisdom,
17:29mais si on réfléchit
17:31à la façon
17:33de découvrir des nouvelles
17:35dans un search engine,
17:37vous recherchez le sujet
17:39que vous êtes intéressé,
17:41et le search engine vous présente
17:43une liste de nouvelles
17:45qui viennent de différents endroits.
17:47Si vous allez à la BBC,
17:49ou si vous ouvrez Le Monde,
17:51ou Neue Zürcher Zeitung,
17:53c'est une seule sortie,
17:55mais vous verrez plein de choses
17:57que vous pouvez lire,
17:59ce qui est représenté par ça.
18:01Merci.
18:03Merci.
18:05Merci, Jean.
18:07C'était un bon
18:09concours concluant.
18:11Je pense qu'il s'agirait bien
18:13de ce dernier.
18:15On a parlé
18:17du fait que nous devons
18:19s'intégrer à la détection
18:21des modèles cachés,
18:23de la façon dont nous mesurons la diversité
18:25et ce genre de phénomène.
18:27Nous avons le temps
18:29pour quelques questions
18:31de l'audience.
18:33Laura.
18:35Merci beaucoup
18:37pour votre présentation.
18:39C'était très intéressant,
18:41surtout quand nous avons
18:43étudié notre relation
18:45à l'information
18:47pour les Français.
18:49Je pense que votre présentation
18:51a montré la diversité de façons
18:53d'accéder à l'information
18:55et comment l'intermédiaire en ligne
18:57impacte la façon
18:59de recevoir l'information.
19:01Ce matin, nous avons parlé
19:03de la façon dont les gens
19:05deviennent plus conscients
19:07de l'algorithme.
19:09Est-ce que c'est quelque chose
19:11que vous avez étudié
19:13ou que vous planifiez
19:15pour que les gens
19:17puissent s'entraîner
19:19à l'algorithme?
19:21Ma deuxième question
19:23est la suivante.
19:25L'algorithme et la littératie
19:27sont si importants.
19:29Est-ce qu'ils sont disponibles
19:31pour tout le monde
19:33en termes de
19:35vulgarisation
19:37pour aider
19:39l'éducation immédiate?
19:45Qui veut commencer?
19:59Sur l'algorithme
20:01et la littératie,
20:03je suis
20:05une informaticienne.
20:07Ce n'est pas mon domaine
20:09principal. Je ne sais pas
20:11comment le faire, mais je sais
20:13que c'est très important.
20:15En termes de comportement
20:17des gens qui changent,
20:19on a beaucoup vu dans la communauté
20:21de vie privée.
20:23La première conscience
20:25que les gens ont eue,
20:27c'est qu'ils apprennent sur eux
20:29et qu'on est tracé.
20:31J'entends souvent des gens qui disent
20:33qu'ils visitent des sites web
20:35juste pour tromper les algorithmes
20:37qui ne savent pas qui ils sont.
20:39Il y a en moins de façon anecdotique
20:41ce désir
20:43de tromper les algorithmes.
20:45Après, le problème, c'est que
20:47ce n'est pas très efficace.
20:49Les choses que les gens
20:51font ne sont pas très utiles.
20:53La plateforme s'en fout
20:55sur une seule personne.
20:57Si elle apprend mal sur une personne,
20:59ce n'est pas très grave.
21:01L'autre question, c'était sur...
21:03Non, j'ai répondu
21:05les deux.
21:07C'est en lien avec la question
21:09de l'éducation aux médias,
21:11telle que c'était posé.
21:13Je rejoins l'écho
21:15qui est fait par Oana sur l'éducation
21:17à l'informatique en général,
21:19aux algorithmes et la maturité
21:21sur la compréhension de ces phénomènes.
21:23C'est la réponse aux enjeux
21:25qu'on a posés aujourd'hui.
21:27On parle beaucoup de régulation,
21:29de modifier les algorithmes.
21:31C'est aussi une manière
21:33de répondre aux enjeux
21:35que sont la désinformation,
21:37la polarisation, etc.
21:39Et ça passe par l'éducation
21:41en général. L'éducation aux médias,
21:43bien sûr, l'éducation sur l'informatique,
21:45les algorithmes également.
21:47Je pense que c'était ça la question
21:49qui était posée. Comment peut-on
21:51prendre conscience et ce recul
21:53sur les outils tels qu'ils sont ?
21:55On a beaucoup parlé de l'exposition,
21:57de la dépendance à ce lien
21:59qui est fait entre créateur de contenu,
22:01créateur d'informations
22:03et utilisateur in fine.
22:05Il faut aussi réfléchir à ces phénomènes.
22:07Il y a peut-être quelque chose à commenter ici.
22:09Je vois des prises de micro.
22:11Juste une petite...
22:13Pardon. Je sais qu'en France,
22:15je pense que les ministères
22:17d'éducation nationale,
22:19ils commencent à mettre en place
22:21des cours dans les lycées
22:23dans le sens
22:25media literacy. Je ne sais pas
22:27s'ils vont parler aussi d'algorithmic literacy
22:29qui s'avère
22:31un peu plus technique. Mais il y a
22:33au moins beaucoup de volonté dans ces directions
22:35en France. On peut quand même noter...
22:37Pardon. Après, je laisse la parole aux intervenants.
22:39On peut quand même noter en 2019, avec la réforme du bac,
22:41qu'est-ce qu'on pense de la réforme ? Il y a eu l'introduction
22:43de l'enseignement de l'informatique à ce moment-là,
22:45qui s'est dérivé en enseignement disciplinaire
22:47terminal. Ce sont des spécialités sur lesquelles les élèves
22:49passent le bac maintenant. Donc, il faut les choisir.
22:51Et en seconde, il y a un enseignement qui s'appelle
22:53sciences numériques et informatiques.
22:55Non. Si, c'est ça. SNT. Sciences
22:57numériques et technologies. Qui reprend
22:59en partie certains des phénomènes
23:01ici et leur fait, à un certain niveau,
23:03au niveau seconde, très généraliste. Mais tous les
23:05collégiens sont exposés à l'enseignement
23:07sur ces contenus qui est sur certains
23:09domaines, dont notamment un des socs, sur les
23:11cinq socs qui sont informatique et web,
23:13sur lesquels on leur fait prendre conscience, à défaut
23:15de les accompagner, de leur donner la connaissance
23:17qui permet d'avoir la maturité,
23:19la connaissance scientifique,
23:21qui les sensibilise quand même sur ces questions. Et là,
23:23c'est un enseignement qui est à tous les publics
23:25de ce... Pardon. Et puis, je laisse la parole.
23:29Non. Effectivement, il y a beaucoup d'enjeux
23:31là-dessus. Il y a des progrès qui
23:33sont faits. C'est
23:35assez lié à la question de la
23:37transparence des algos, aussi.
23:39Algo de recommandation.
23:41Donc, là, il y a, je pense,
23:43côté économie, c'est des sujets qui commencent
23:45à être vraiment
23:47adressés. En informatique,
23:49ça fait un peu plus longtemps. Donc, on prend le train
23:51un peu plus tard.
23:53Après, se pose... Et là,
23:55c'est plutôt un écho avec le panel précédent.
23:57C'est de
23:59quelle manière
24:01on communique auprès des gens
24:03et, en tant qu'institutionnels,
24:05est-ce que
24:07on ne crée pas la...
24:09Enfin, il y a une partie de la population
24:11qui est méfiante envers
24:13les institutions publiques.
24:15Et comment est-ce qu'on arrive
24:17à contourner ça ? C'est-à-dire
24:19OK, si c'est pour
24:21apprendre à des gens qui baignent
24:23déjà dans un environnement
24:25où on est assez curieux, on regarde ce qui se passe
24:27et on croit ce que les scientifiques
24:29disent, très bien,
24:31il faut le faire. Mais
24:33comment on arrive à
24:35aussi toucher une partie du public qui,
24:37dès qu'il voit un écusson
24:39associé à une université, quelque chose de scientifique,
24:41va dire, ce qu'ils vont me raconter,
24:43c'est faux.
24:45C'est peut-être là où il y a le plus
24:47de challenges. Et, pour le moment,
24:49je n'ai pas forcément vu
24:51de réponse,
24:53mis à part que, quand on arrive
24:55avec le label
24:57public,
24:59on est à la solde du système
25:01et donc, ce qu'on va raconter, c'est faux.
25:03Et donc, on s'en moque.
25:05J'ai juste un commentaire
25:07plus général. Je pense que
25:09plus d'études seront nécessaires
25:11concernant
25:13la DMA
25:15qui prohibit l'utilisation
25:17de l'advertisement,
25:19de la croissance de l'advertisement,
25:21parce que nous avons dit
25:23ici que, aussi,
25:25l'exposition est basée
25:27sur l'advertisement que les utilisateurs
25:29ont accès à.
25:31Donc, peut-être,
25:33je dis ça
25:35peut-être aux scientifiques
25:37des données,
25:39comment c'était avant
25:41l'entrée en force de la DMA
25:43et comment c'est maintenant.
25:45Peut-être que c'est quelque chose qui doit être
25:47investigé si cela change
25:49l'exposition des utilisateurs
25:51à l'advertisement en base de ceci.
25:53Maintenant, c'est en train de se discuter
25:55si c'est possible
25:57d'avoir
25:59cette offre différente
26:01en base d'une fiche.
26:03Mais, parce que les officiers
26:05de protection des données
26:07autour de l'UE disent
26:09que ce n'est pas possible.
26:11Vous devez opter
26:13par le modèle
26:15d'advertisement.
26:17Mais voyons.
26:19Je pense que c'est quelque chose
26:21qui sera important pour l'avenir.
26:23Merci. Nous avons
26:25atteint la limite du temps.
26:27Mais peut-être qu'il y a une dernière question
26:29ou un commentaire.
26:31Merci.
26:33C'était une excellente présentation.
26:35Merci à tous.
26:37Ma question est pour l'équipe d'Ofcom.
26:39C'est l'une des meilleures
26:41présentations.
26:43On a trouvé quelque chose que vous n'aviez pas expérit.
26:45C'est contre la littérature.
26:47Quand vous commencez à y penser,
26:49ça fait beaucoup de sens.
26:51Les résultats de recherche sont très valides.
26:53Pouvez-vous nous expliquer comment vous interprétez
26:55les résultats des médias sociaux ?
26:57Est-ce que c'est un peu moins évident
26:59les mécanismes causés ?
27:01Et la question subsidiaire
27:03de NERD,
27:05combien de spécifications
27:07avez-vous utilisé ?
27:09Dans notre expérience, les méthodes de compétition
27:11ont de très hauts niveaux de susceptibilité
27:13à des niveaux de liberté.
27:15Les résultats sont parfois
27:17très significatifs,
27:19dépendant de la spécification des modèles.
27:21Pouvez-vous nous expliquer comment vous approchez
27:23cette question technique ?
27:27Nous voyons les médias sociaux
27:29comme des liens entre les deux.
27:31L'engin de recherche est l'extrême.
27:33Vous savez exactement ce que vous cherchez,
27:35et vous le trouvez.
27:37Pour les médias sociaux,
27:39ça tombe entre
27:41l'engin de recherche et le résultat nul.
27:43Et je pense que ça a du sens.
27:45Pour moi, intuitivement,
27:47ça tombe entre les deux.
27:49Oui, vous n'y allez pas
27:51sachant que vous cherchez quelque chose,
27:53mais les mécanismes
27:55qui vous serviront comme information
27:57sont toujours très étroites
27:59en termes de vos intérêts précédents
28:01et peut-être les liens
28:03entre votre réseau.
28:07En termes de sensibilité,
28:09vous avez absolument raison
28:11que la choix des paramètres
28:13peut faire une grande différence.
28:15Dans la publication,
28:17nous avons examiné
28:19une grande variété
28:21de spécifications et d'options alternatives.
28:23Il y avait donc
28:25quatre algorithmes différents
28:27pour catégoriser les visites aux médias,
28:29et aucun n'a fait de grande différence.
28:31Et nous avons essayé
28:33une variété de méthodes
28:35pour mesurer les sujets,
28:37des sujets plus traditionnels
28:39comme TFIDF,
28:41des sujets basés
28:43sur les modèles linguistiques,
28:45et des sujets intermédiaires
28:47basés sur Word2Vec.
28:49Et, en gros,
28:51les résultats étaient
28:53consistants avec les uns des autres.
28:55Nous en parlons plus
28:57dans un annexe du rapport,
28:59que nous sommes heureux de partager avec vous.
29:01Mais il y a eu des cas
29:03où cela a fait une différence
29:05à la précision des paramètres
29:07sans vraiment changer
29:09l'image totale.
29:13Merci à tous.
29:15Je pense que c'est le moment
29:17de conclure la journée.
29:19Merci à tous pour votre attention.

Recommandations