Comment les IA répliquent-elles les voix ?

  • l’année dernière
Aujourd'hui, Nalla vous montre par l'exemple comment les IA s'y prennent pour calquer les voix ! Bluffant non ?
Transcript
00:00 Vous avez sûrement dû voir passer ces vidéos sur internet récemment
00:02 et vous avez dû vous demander "mais comment on fait pour copier une voix à ce point ?"
00:06 Et d'ailleurs, qu'est-ce qui fait que notre voix est aussi reconnaissable ?
00:09 Et qu'elle est... notre voix, quoi.
00:11 *tousse*
00:12 Notre voix.
00:12 Le paramètre principal, ça va être notre timbre.
00:14 Aaaaaah.
00:15 Et cette hauteur-là, elle diffère selon ton âge, ton genre et ton corps.
00:19 Genre, tu peux être plutôt soprano, plutôt bariton,
00:22 et tu auras plus ou moins d'harmoniques aigus ou graves dans la voix.
00:25 Ensuite, va y avoir la prosodie.
00:26 C'est notre manière d'articuler, notre phrasé,
00:29 et ça c'est souvent le résultat de notre environnement et de notre éducation.
00:32 On ajoute à ça les divers accents en fonction de nos origines,
00:35 et on finit sur une voix très spécifique.
00:37 Y'a plus qu'à donner de l'audio de référence à un algorithme,
00:40 des bouts d'interview ou bien des chansons,
00:42 et le modèle est créé.
00:43 Maintenant, on l'applique à une piste de voix a cappella,
00:46 on la réassemble ensuite avec la vidéo ou avec l'instru,
00:49 et le tour est joué.
00:49 Bon, c'est une avancée intéressante,
00:52 mais ça va poser des problèmes en termes de droits d'auteur, ce genre de choses.
00:55 Si t'es d'accord avec moi, abonne-toi, mon petit.

Recommandée