Catégorie
🤖
TechnologieTranscription
00:00 Et on ne va pas perdre de temps, on va commencer tout de suite par Nicolas
00:03 Hervé de l'INA qui va nous présenter un papier présidentiel 2022 dans
00:09 l'audiovisuel, l'anomalie statistique Zemmour.
00:14 Tout le monde connaît.
00:16 Voilà.
00:18 Et Nicolas Hervé, donc vous êtes chercheur à l'INA.
00:21 Vos travaux portent sur l'analyse automatique et l'indexation de
00:25 contenus multimédia.
00:26 C'est ça.
00:27 Et je crois que vraiment, c'est particulièrement intéressant dans
00:32 la conjoncture actuelle de vous écouter.
00:35 Merci.
00:36 Merci.
00:39 Je me joins également au remerciement qui ont déjà été à nombreuses
00:43 reprises exprimés envers l'ARCOM pour organiser cette journée.
00:47 Je les réitère et j'appelle de mes voeux des poursuites que cette
00:51 première journée ne soit bien qu'une première journée et que les
00:53 travaux puissent continuer entre les chercheurs des différentes
00:57 disciplines sont représentés et le régulateur.
00:59 J'ai intitulé cette présentation notamment l'anomalie statistique
01:04 Zemmour.
01:05 J'aurais pu choisir l'anomalie statistique TPMP.
01:07 J'aurais pu choisir plein de choses tant on va voir qu'il y a un
01:10 certain nombre de caractéristiques qui ressort du traitement médiatique
01:14 de cette élection présidentielle.
01:15 Ce sont des travaux qui sont toujours en cours.
01:18 Je vous en présente le début.
01:20 Donc le contexte de ces travaux, je ne vais pas m'étendre longuement
01:33 sur le cadre de la régulation de la parole politique dans les médias
01:39 audiovisuels français et de la mission qui est d'évoluer à l'ARCOM
01:44 pour faire en sorte de faire respecter et de contrôler cette régulation.
01:49 Juste rappeler quand même brièvement que les médias audiovisuels
01:53 publics certes, ils ont la liberté d'expression, certes ils ont leur
01:58 liberté éditoriale mais de par le fait que les canaux de diffusion
02:03 anciennement RTIN, FM et maintenant TNT sont en nombre limité.
02:08 Il y a des conventions qui sont passées entre les différentes
02:13 chaînes et l'ARCOM et que donc étant donné que cette ressource de
02:17 diffusion est limitée, il y a pour assurer une diversité,
02:22 une pluralité des opinions dans l'espace audiovisuel public,
02:26 il y a une nécessité de la part de ces différents opérateurs d'assurer
02:31 en interne sur leur chaîne, sur leur station une pluralité des opinions.
02:36 Et donc ça passe parce que les uns et les autres, on connaît tous plus
02:40 ou moins puisque ce sont des données qui sont quand même de manière
02:42 générale assez largement médiatisées.
02:44 Le décompte du temps de parole politique, je ne rentrerai pas dans
02:50 les détails entre le temps de parole, temps d'antenne etc.
02:52 Globalement il y a différents régimes et plus on s'approche d'une
02:55 élection, plus la contrainte sur les temps de parole est relativement
03:02 forte pour essayer de faire en sorte que justement on puisse avoir
03:06 d'un point de vue démocratique une pluralité des opinions qui soient
03:08 exprimées dans les différents médias.
03:12 Donc la question autour de ces données, il ne vous aura pas échappé
03:18 que ce sont des données qui sont largement critiquées en long,
03:21 en large, en travers, surtout énormément instrumentalisées de toute
03:25 part et que quelles que soient les modifications qui soient suggérées
03:32 etc.
03:33 On trouvera toujours quelqu'un pour redire quelque chose à cette régulation.
03:36 L'idée des travaux qui sont là, je passe sur ces chiffres, vous les
03:41 laissez, juste quand même.
03:43 Ce que je vais vous présenter, il y a différentes périodes.
03:47 Là ce sont donc les chiffres pour la campagne 2022.
03:50 Ce sont les chiffres qui sont rapportés par les chaînes et par les
03:54 radios à l'ARCOM qui les contrôlent.
03:56 Donc on a la période d'équité qui commence début janvier puis une
04:01 période d'équité renforcée.
04:02 Donc là j'ai mis quatre chaînes avec les temps d'antenne des
04:06 différents candidats.
04:07 On a la spécificité d'avoir le président en exercice qui est
04:11 allemand candidat et on a la spécificité de la guerre en Ukraine
04:13 qui a apporté médiatiquement quelque chose d'assez particulier.
04:16 Et puis on arrive dans la toute dernière période qui est celle
04:19 qu'on connaît, le temps d'égalité où là les temps déclarés par les
04:23 chaînes sont tout le monde le petit doigt sur la couture du pantalon
04:26 et tout le monde a l'air de respecter comme il faut le temps d'antenne.
04:29 Moi la question que je me suis posée derrière c'est bizarre parce
04:34 que c'est quand même globalement pas ce que les gens ressentent
04:36 quand ils regardent la télé, ils écoutent la radio.
04:41 Donc la question c'est de se dire entre ce qui est prononcé à l'antenne
04:45 et ce qui est mesuré en temps de parole, quelle différence on peut faire.
04:49 Et donc pour ça l'idée est de s'intéresser non pas à qui parle
04:53 mais au contenu de quoi on parle.
04:55 Et donc là il y aurait beaucoup beaucoup de choses à faire et il y a
05:00 beaucoup de choses à faire.
05:01 L'approche qui est proposée là est extrêmement simple voire simpliste
05:05 et je me suis contenté de compter le nombre de fois que les noms des
05:10 candidats, leurs noms de famille sont prononcés à l'antenne.
05:12 Donc c'est quelque chose de très simple en apparence mais qui va donc
05:17 se distinguer des temps mesurés dans le cadre de la régulation où on
05:22 regarde qui parle.
05:23 Là on va regarder de qui on parle.
05:25 Et donc ça veut dire, je préviens tout de suite, on ne regarde pas
05:29 si on en parle en bien ou en mal.
05:31 On ne sait pas si c'est un soutien qui vient soutenir son candidat
05:35 ou si c'est un opposant qui parle d'un autre candidat pour le désinguer.
05:38 On ne sait pas tout ça.
05:40 La seule chose qu'on sait c'est que globalement on va voir qui fait
05:43 l'actualité, qui est sur le devant de la scène d'un point de vue médiatique.
05:47 Être sur le devant de la scène ça peut vouloir dire deux choses.
05:50 Ça peut vouloir dire que certains candidats, certains partis politiques
05:54 arrivent à faire en sorte qu'il y ait un emballement médiatique,
05:57 arrivent à créer de l'intérêt autour d'une candidature et ça fait
06:01 partie des critères qui sont évalués notamment par l'ARCOM sur la période
06:07 d'équité.
06:08 Il y a le poids politique des différents partis, des différents
06:11 candidats mais il y a également la dynamique de campagne qui fait partie
06:13 des critères objectifs qui doivent être pris en compte dans les questions
06:17 de temps de parole.
06:18 Et puis il y a également l'autre aspect qui m'intéresse c'est les choix
06:21 éditoriaux.
06:22 La question c'est en quoi est-ce qu'une chaîne particulière ou une station
06:25 de radio particulière a une influence sur ce qui est prononcé sur son
06:28 antenne.
06:29 Et donc là pour faire ça l'idée a donc été d'utiliser un système
06:34 de transcription.
06:36 On transcrit, on transforme en texte tout ce qui est prononcé à l'antenne.
06:39 Donc globalement les créneaux qui sont utilisés dans cette étude ce sont
06:42 les créneaux de news.
06:43 Donc les chaînes d'info en continu c'est 6 heures du matin minuit et
06:47 puis les JT du soir pour les chaînes historiques, les matinales radio
06:50 et trois créneaux d'infotainment qui vous sont présentés.
06:55 Donc ça ne recouvre pas exactement le même périmètre que celui des
06:59 temps de parole.
07:00 Les patronymes que j'ai regardés sont ceux des candidats.
07:06 L'étude je l'ai commencée en septembre donc dans la période de
07:09 pré-campagne avant la campagne officielle au sens de la régulation
07:14 de l'ARCOM et j'ai donc inclus également les candidats putatifs et
07:17 ceux qui étaient dans les différentes primaires qui ont pu être organisées.
07:20 Je précise qu'il y a deux candidats qui ne sont pas inclus dans l'étude
07:24 pour des raisons techniques.
07:25 Le logiciel de transcription n'étant pas capable de les détecter.
07:28 Donc ils sont de facto éliminés de l'étude même s'ils sont considérés
07:32 comme des petits candidats.
07:33 Je tiens quand même à le signaler.
07:35 Donc qu'est-ce qu'on peut dire de ces données.
07:38 Déjà une première chose c'est quel lien il y a entre le nombre de
07:43 fois qu'on va prononcer le nom d'un candidat et le temps de parole
07:46 tel que les données que vous connaissez.
07:47 Donc pour ça il faut comparer ce qui est comparable.
07:50 J'ai deux points qui me permettent de comparer donc il y a bien sûr
07:52 les données de l'ARCOM et le deuxième point elle aura l'occasion
07:55 de s'exprimer tout à l'heure c'est Claire Sécaille qui elle a refait
07:58 un minutage spécifiquement sur TPMP.
08:01 Donc j'ai deux points de comparaison qui me permettent de voir quel
08:04 lien on peut faire entre le temps de parole et le nombre de fois que
08:09 des patronymes sont prononcés.
08:11 Donc sur le périmètre qui est commun à savoir en l'occurrence les
08:14 chaînes d'infos en continu puisqu'on a le même bornage 6 heures 6
08:19 heures du matin minuit.
08:20 Voilà ce que donnent les corrélations.
08:25 Donc elles sont plus ou moins fortes selon les candidats.
08:27 Donc là chaque point ça représente les différentes périodes
08:30 gérées par l'ARCOM sur les différentes chaînes d'infos en
08:31 continu.
08:32 Donc c'est loin d'être parfait mais on voit que c'est complètement
08:36 loin d'être aléatoire et que donc effectivement plus il va y avoir
08:39 de temps de parole pour un candidat plus il y a de chances statistiquement
08:41 que le nom du candidat soit prononcé.
08:43 On a l'équivalent.
08:46 Là c'est le pendant tout à l'heure c'est pour un candidat là c'est pour
08:48 les différentes chaînes.
08:49 Donc on voit quand même que la corrélation est loin d'être
08:52 négligeable et que même si le décompte du nombre de patronymes
08:56 n'est pas le décompte du temps de parole on voit quand même qu'il y a
08:59 une forte similitude dans ces données.
09:01 Ce n'est pas parfait loin de là.
09:07 Voilà par exemple sur la période d'égalité où tout à l'heure je vous
09:10 rappelle que sur les temps de parole tout était parfaitement aligné.
09:13 Ce sont les quatre mêmes chaînes mais cette fois-ci sur le nombre de fois
09:15 que les patronymes sont prononcés.
09:16 Donc là on voit tout de suite qu'il y a déjà des disparités et que le
09:19 comportement des chaînes n'est pas le même selon les candidats.
09:24 Deuxième jeu de données donc ça ce sont les données de Claire Sécaille.
09:28 Donc cette fois-ci c'est semaine par semaine ce sont des comptes à elle
09:30 du temps politique puisque moi de mon point de vue si je compte le nombre
09:33 de fois que Macron, Jadot, Mélenchon etc.
09:37 sont prononcés si je fais la somme je dis que le nombre total de fois
09:42 qu'on prononce le nom d'un candidat ça va correspondre à ce que moi j'appelle
09:45 le temps politique.
09:46 Et puis après dans ce temps politique on pourra faire les ratios en
09:49 proportion combien chacun d'entre eux est prononcé.
09:51 Donc là c'est la corrélation spécifiquement sur TPMP avec les données
09:55 de Claire et là encore une fois on voit que la corrélation est très
09:58 forte et qu'on a une forte similarité entre le temps d'antenne et
10:05 la prononciation des candidats.
10:07 On regarde dans le temps maintenant ce que ça donne.
10:11 Donc voilà globalement là encore pour les quatre mêmes chaînes on voit
10:15 ça va jusqu'à les deux dernières barres sont les deux semaines entre
10:20 les deux tours.
10:21 Et donc ça commence en septembre.
10:24 Donc on voit qu'il y a des profils différents avec des ampleurs
10:28 différentes selon les candidats.
10:30 La même chose par famille politique mais je vais passer.
10:32 Maintenant la question c'est quid du cadrage éditorial.
10:34 Quel est l'impact des chaînes sur ces questions là.
10:37 Et donc l'hypothèse toute simple et elle est vraiment pour le coup toute
10:41 simple est de se dire qu'on n'a pas de valeur idéale pour le que doit
10:49 être le temps le nombre de fois qu'on va prononcer Macron le nombre de
10:52 fois qu'on va prononcer Zemmour etc.
10:53 Evidemment qu'il n'y a pas de valeur absolue évidemment qu'il n'y a pas
10:56 de valeur idéale.
10:57 Évidemment qu'il y a l'actualité qui joue.
10:58 Et donc voilà donc pour essayer d'éliminer l'effet de l'actualité
11:02 on va se dire on va essayer de regarder quelle est la différence
11:05 chaîne par chaîne qu'il y a entre la moyenne de toutes les chaînes
11:09 et ce que eux ils font.
11:10 Donc en gros est-ce que sur une chaîne on va plutôt avoir tendance à
11:12 prononcer davantage le nom d'un candidat que ce que font toutes les autres
11:16 chaînes.
11:17 Est-ce qu'il y en a qui vont avoir tendance à tirer dans un sens ou tirer
11:19 dans l'autre.
11:20 Donc ça c'est un bête écart à la moyenne.
11:23 Et on met ça en équation.
11:25 Il y a plusieurs manières de faire des régressions avec ces données là.
11:29 Je vais vous présenter la méthode la plus simple parce qu'elle est la plus
11:33 facilement compréhensible et qui est de dire que en gros le pourcentage
11:38 de prononciation du nom d'un candidat est composé de deux composantes.
11:43 Une première composante qui est liée à son actualité semaine par semaine.
11:45 Cette semaine Macron fait l'actualité.
11:49 C'est normal qu'on en parle beaucoup.
11:50 Mais si c'est l'actualité on s'attend à ce que toutes les chaînes et toutes
11:53 les stations en parlent beaucoup parce qu'il se passe quelque chose.
11:56 A l'inverse la deuxième composante c'est la j'allais dire la coïntence
12:01 l'affinité particulière que va avoir un média avec un candidat.
12:04 Et donc c'est ce qui déborde de juste l'actualité.
12:07 Donc ce que ça permet de faire c'est que ça va permettre de gommer les effets
12:12 de l'actualité pour ne garder que la composante qui a priori est l'affinité
12:18 entre une chaîne et un candidat.
12:19 Donc ça c'est l'actualité des candidats.
12:22 Ce sont des points de pourcentage.
12:24 Donc ça c'est ce qui est en gros la moyenne sur tous les créneaux
12:28 confondus.
12:29 Donc il y a des candidats qui ont plus ou moins d'actualité.
12:31 On voit qu'effectivement on parle beaucoup de Macron.
12:32 C'est logique.
12:33 On parle aussi beaucoup de Zemmour.
12:35 Mais ça c'est globalement ce qui est comme à toutes les chaînes.
12:37 Ce qui est intéressant c'est le deuxième tableau.
12:38 C'est la deuxième composante qui est l'affinité particulière.
12:43 Ce sont des points de pourcentage par rapport à la moyenne des chaînes
12:46 et des candidats.
12:48 Donc là bien évidemment, je parlais de Zemmour parce que c'est la ligne
12:51 qui est tout en bas et on voit qu'il a quand même particulièrement
12:53 d'anomalies.
12:55 C'est-à-dire qu'il va surperformer ou sous-performer selon certains
12:59 médias.
13:00 Et là où on va pouvoir voir de manière un peu plus claire,
13:03 sachant que tout ça c'est la même chose que les travaux que Julie a
13:08 présentés ce matin, il n'y a pas de vérité absolue.
13:10 Ce ne sont que des valeurs relatives.
13:12 En l'occurrence ici tous ces chiffres là c'est France 2 qui est pris
13:15 comme référence.
13:16 Donc on considère que France 2 est le maître étalon et on se compare
13:19 par rapport à France 2.
13:20 Et donc si on retrace ça cette fois-ci candidat par candidat,
13:23 on va voir que typiquement sur le premier graphe on a donc les
13:27 coefficients d'affinité entre Zemmour et les différents médias.
13:29 Cette fois-ci la barre verticale, j'ai replacé France 2 qui est à 0
13:33 puisque c'est le maître étalon.
13:34 Et donc on va voir TPMP qui en gros sur cette période là,
13:40 donc c'est l'automne, c'est l'après-campagne,
13:41 va avoir en gros 30% de plus que France 2 une fois qu'on a gommé
13:47 l'effet de l'actualité de Zemmour.
13:50 Et donc ce qui est important sur Zemmour, bon certes 30% TPMP
13:53 c'est énorme, mais c'est l'amplitude puisqu'on va de -10% à +30%.
13:58 Donc il y a 40% d'amplitude entre M6 et TPMP alors que pour les autres
14:02 candidats, typiquement Le Pen en deuxième, vous voyez que l'échelle
14:07 est beaucoup plus faible.
14:08 C'est entre 0 et 9%.
14:10 Pécresse, c'est entre -3 et +1%.
14:13 Donc tout de suite, les effets d'affinité, même s'ils existent
14:16 et qu'on peut classer les chaînes et regarder et voir qu'il y a des
14:19 affinités entre candidats et chaînes, on voit que l'amplitude de la
14:23 déformation liée à des choix que moi je considérais des choix éditoriaux
14:27 est beaucoup plus forte sur Zemmour.
14:30 Donc ça c'est pour la période de pré-campagne, donc de septembre
14:33 à Noël.
14:35 On a les mêmes résultats mais en un peu plus resserré pour la période
14:40 d'équité.
14:41 Donc là, ce que j'ai mis dans l'équité, c'est équité + équité renforcée.
14:44 J'ai gommé la partie égalité.
14:46 Je ne l'ai pas faite parce qu'on n'a que deux semaines et ça fait très
14:49 peu de données et d'un point de vue statistique, c'est un peu plus
14:50 complexe.
14:51 Et donc du coup, on a globalement les mêmes phénomènes mais cette fois-ci
14:57 avec une amplitude un peu plus resserrée.
15:00 Donc ça veut quand même dire que quelque part, parce que la régulation
15:04 entre effectivement pour la campagne qu'au 1er janvier, donc cette période
15:07 d'équité en tout cas a un effet qui est visible ici mais on reste quand
15:12 même avec une forte disparité entre les candidats et les médias.
15:18 Donc du coup, pour terminer, pour dire que cette approche par le
15:22 contenu est une approche qui à mes yeux est complémentaire pour éclairer
15:27 ce qui se passe et ce qui se dit dans les médias par rapport aux
15:30 décomptes du temps d'antenne.
15:32 On voit bien évidemment qu'il y a une disparité.
15:34 Des travaux que je suis en train de mener complémentaires montrent
15:39 clairement même une relativement forte polarisation des médias parce
15:43 que là, je vous ai parlé de Zemmour, mais si on classe les candidats
15:46 sur l'axe droite gauche, on voit très clairement apparaître des
15:48 blocs de ceux qui vont favoriser clairement l'extrême droite,
15:51 de ceux qui vont être plus au centre et de ceux qui vont être plus à gauche.
15:55 Tout ça étant relatif, un des gros enjeux reste celui qu'on a déjà
16:01 parlé ce matin, c'est quel est le point de référence.
16:02 Il n'y a bien évidemment pas de point de référence, il n'y a pas de vérité
16:05 absolue de ce que doit être, de ce que devraient idéalement être ces
16:09 chiffres, mais de dire que même si on ne peut pas fixer de valeur
16:12 absolue, ils sont quand même je pense intéressants et ils éclairent
16:15 sur la manière dont les médias font des choix dans le traitement
16:20 de l'information politique.
16:21 Je vous remercie.