• il y a 10 mois
Transcription
00:00 *Voix de l'autre côté de la scène*
00:02 Regardez bien ça
00:04 Le type est en train de parler
00:06 à son PC
00:08 et son PC lui répond
00:10 parfaitement. Est-ce que ce serait pas ça
00:12 Anagound, le futur
00:14 du jeu vidéo ou en tout cas une des technologies
00:16 par EA qui
00:18 va pas forcément
00:20 tuer le job de
00:22 millions de personnes. Tout à fait c'est la
00:24 bonne avancée de l'EA dans le jeu vidéo. On parle souvent
00:26 les gens sont toujours craintifs quand on parle d'EA
00:28 parce qu'on a l'impression que l'homme va remplacer
00:30 la machine. Non la machine va remplacer
00:32 l'homme. Oui pardon
00:34 On va arrêter les machines, c'est consumer quand tu fais
00:36 à l'amour. C'est comme ça, ben oui.
00:38 Non, que la machine va remplacer l'homme, Skynet
00:40 ça y est, des missiles partout, on va tous
00:42 mourir. Après avec Mick Jorney et compagnie
00:44 ça peut se comprendre, tous les artistes sont
00:46 en fear complet. Il y a du fear
00:48 sur l'utilisation mais il y a aussi des moyens
00:50 de bien utiliser l'EA et ça serait
00:52 bien que ce genre de truc puisse être développé. Bien sûr.
00:54 Parce qu'en fait là on est dans un principe
00:56 où comment ça marche là, ce qu'on est en train de voir.
00:58 Ce qu'on est en train de voir, c'est Nvidia qui propose ça
01:00 c'est le CES en ce moment et ils sont
01:02 revenus sur leur technologie ACE qu'ils avaient
01:04 déjà présentée il y a 7 mois avec
01:06 cette exacte même scène, sauf que là
01:08 on voit un type qui
01:10 interagit avec cette démo.
01:12 Qu'est-ce qu'on y voit dans cette démo ? Ben on y voit que
01:14 en fait, il est capable
01:16 de parler à l'écran, ce qui se passe
01:18 il explique à un moment c'est que ils enregistrent
01:20 ce qui est dit, c'est mis sous forme de texte
01:22 qui est rentré dans un serveur, le jeu
01:24 traduit le texte et réussit à
01:26 analyser comme pourrait faire ChatGPT, réfléchir
01:28 à ce qu'il doit répondre et ensuite
01:30 il refait un texte to speech pour que le personnage
01:32 réagisse et derrière, ils l'ont travaillé
01:34 avec des gens qui font des jeux vidéo derrière
01:36 ce texte to speech est aligné avec
01:38 de la synchronisation labiale
01:40 pour ensuite arriver
01:42 et être directement utilisé par un NPC
01:44 à l'intérieur d'un jeu. Et ça,
01:46 mesdames et messieurs, ça c'est une vraie
01:48 évolution du jeu vidéo. Alors attention, cette vidéo
01:50 ok, elle fait un peu cringe, déjà
01:52 d'une, quand ils répondent "eux" ça fait un peu cringe
01:54 mais même quand le mec pose la question, je me suis dit
01:56 "c'est une IA aussi le mec ?"
01:58 ça fait un peu cringe, la caméra va reculer
02:00 et tu te rends compte que moi aussi je suis
02:02 une IA à faire !
02:04 Ah ! Le mindfuck et tout !
02:06 Mais franchement, ça c'est une vraie révolution
02:08 ça c'est une vraie révolution qui peut changer
02:10 énormément de choses dans les jeux. Parce que dites-vous bien
02:12 que quand vous créez un jeu,
02:14 le fait d'avoir des personnages qui doivent parler
02:16 ça demande énormément
02:18 d'éléments
02:20 de jeu. Pour chaque idée
02:22 que tu as, il faut enregistrer une voix
02:24 c'est pas des choses que tu peux modifier au fur
02:26 et à mesure. Ça prend énormément
02:28 de temps de faire un cinquantenaire. Si tu as un truc qui peut être
02:30 assez automatisé comme ça, ça peut te permettre
02:32 de faire des jeux d'une ampleur absolument
02:34 incroyable, d'amplifier
02:36 on va dire, toutes les interactions
02:38 que tu peux avoir dans ton jeu
02:40 ce qui ne veut pas nécessairement dire que tu vas
02:42 forcément supprimer tous tes personnages
02:44 et toutes tes voix réelles du jeu.
02:46 Ça peut amplifier ce qui est déjà
02:48 très existant. Et en fait, pour vous donner un exemple
02:50 parce que c'est toujours la peur de se dire "ouais mais ça va remplacer
02:52 maintenant il n'y aura plus besoin de voice actors, ils vont pouvoir faire ça
02:54 pour tout le monde". En fait, tu ne peux pas
02:56 vraiment faire ça pour tout le monde parce que soyons clairs, on le voit
02:58 avec cette vidéo, tu n'as pas une qualité impeccable
03:00 au cas où tu dis "c'est écrit, c'est magnifique"
03:02 Pour l'instant, peut-être que
03:04 dans dix ans, ce sera bluffant et il y a plein
03:06 de voice actors qui vont perdre leur taf.
03:08 Le truc c'est que c'est bien si tu veux faire un jeu
03:10 qui est entièrement aléatoire. Tu veux faire un No Man's Sky
03:12 ok, mais tu veux faire un jeu narratif
03:14 comment tu fais un jeu narratif ? Ou c'est Lya qui va décider au milieu
03:16 ce qu'elle va te raconter ?
03:18 Après, c'est aussi peut-être une évolution
03:20 du travail de quest designers,
03:22 dialogue designers, de tous ces gens qui
03:24 travaillent pour faire
03:26 l'enrobage scénaristique d'un jeu
03:28 et qui vont devoir entraîner
03:30 des intelligences, entraîner chacun
03:32 des PNJ pour leur donner
03:34 des envies, des pensées
03:36 et mettre peut-être sur la voix
03:38 le joueur lorsqu'il leur pose des questions.
03:40 Oui, mais tout à fait, c'est un travail
03:42 qui va se faire avec et ils pourront
03:44 l'utiliser. Et pour vous donner une idée,
03:46 si on ne parle pas nécessairement des IA dans ce sens-là,
03:48 mais l'utilisation de l'intelligence
03:50 artificielle pour faire
03:52 du contenu qui peut se développer à l'infini
03:54 parce que créé directement par le jeu,
03:56 ça existe depuis extrêmement longtemps. Vous jouez à
03:58 Banning of Isaac, c'est ce que vous avez.
04:00 Tout ce qui est procédural.
04:02 C'est déjà un ordinateur
04:04 qui va réfléchir avec des données qu'on lui a mis
04:06 pour essayer de te créer des choses supplémentaires.
04:08 C'est pas pour autant que t'as pas des gens
04:10 qui sont en train de bosser et de te faire des trucs
04:12 et de te faire des assets, etc.
04:14 Elder Scrolls et ses missions à l'infini
04:16 par exemple, est aussi un
04:18 exemple. C'est-à-dire que tu peux avoir
04:20 ce développement qui va être infini tout en
04:22 ayant un jeu complet
04:24 avec du fait main qui lui va être ta trame
04:26 narrative principale
04:28 et qui va être poussée. Et ça par contre
04:30 c'est extrêmement prometteur parce que
04:32 pouvoir avoir des univers qui sont
04:34 complets comme ça, No Man's Sky est un excellent
04:36 exemple. T'as tout cet univers procédural
04:38 mais il n'empêche que
04:40 au final, les textes c'est juste des textes qui sont écrits
04:42 comme ça, qui se répètent assez régulièrement
04:44 et au final pour un jeu d'exploration
04:46 tu te retrouves, quand tu
04:48 navigues beaucoup dans le procédural
04:50 à reconnaître les codes du procédural
04:52 et à trouver le système finalement répétitif
04:54 malgré le fait que ce soit procédural.
04:56 Avec un système comme ça, tu peux déjà
04:58 beaucoup plus prolonger le côté
05:00 expérience-découverte où chacun va pouvoir
05:02 vivre une vraie aventure avec des personnages
05:04 directement avec qui ils vont
05:06 répondre, etc. Et augmenter
05:08 cette dimension procédurale en plus
05:10 de ce que les créateurs vont pouvoir faire
05:12 avec le reste. Et ça c'est vraiment une évolution
05:14 vraiment incroyable je pense
05:16 dans le jeu vidéo et dans un futur
05:18 beaucoup plus proche qu'on ne le pense
05:20 parce que autant l'IA
05:22 qui va te créer les jeux en coding
05:24 c'est peut-être un truc qui va pouvoir aider
05:26 on va dire des codeurs dans les années à venir
05:28 autant ça, c'est quelque chose
05:30 qui a été très expérimenté. Tous ces
05:32 textes to speech ça fait des années que ça existe
05:34 tout ce qui est synchronisation labiale
05:36 par rapport à des gens qui parlent ça existe
05:38 tout ce qui est vocaux, les vtubers
05:40 par exemple, c'est déjà ce qu'ils font
05:42 c'est de la synchronisation labiale
05:44 qui se fait sur du texte qui lui arrive
05:46 tous ces éléments existaient
05:48 et le seul truc qui a mis du temps à arriver
05:50 c'est un peu le chat JPT et tout ça
05:52 mais qui est là maintenant depuis un petit temps
05:54 donc voilà, maintenant ça c'est très
05:56 travaillé. C'est très travaillé effectivement
05:58 et là on a vraiment
06:00 un exemple de solution un peu tout en un
06:02 ACE c'est du coup
06:04 ce package fourni par NVIDIA
06:06 qui permet du coup de faire
06:08 en plus de la génération
06:10 de dialogue on va dire, avec des persos
06:12 qui vont avoir une sorte de personnalité
06:14 un petit peu balisée avec
06:16 peut-être des questlines, peut-être tu vas leur dire
06:18 est-ce que vous savez ce qui s'est passé
06:20 sur la scène de meurtre hier soir
06:22 et le perso a été entraîné
06:24 pour être suspicieux
06:26 ou pour apparaître un peu
06:28 chelou. On voit
06:30 dans l'exemple qu'ils mettent
06:32 ils sont en train de remplir le texte
06:34 qui dit ce que l'IA doit dire et le texte
06:36 c'est un peu du chat JPT c'est-à-dire
06:38 c'est un peu du "réponds comme si tu étais
06:40 une femme de 40 ans qui a navigué
06:42 dans ces eaux, qui a fait ça, qui a fait ça"
06:44 ils donnent en gros le background du personnage
06:46 et c'est l'IA qui imagine ce qu'il répondrait sur l'enregistrement
06:48 Et le truc qui est fou c'est que
06:50 du coup le fait de passer par une
06:52 intelligence artificielle va permettre
06:54 d'avoir un peu une infinité
06:56 de possibilités de réponse
06:58 et ils vont toutes être logiques donc on va forcément
07:00 dépasser ce qu'on aurait pu faire
07:02 avec un humain qui calcule
07:04 5 types de réponses
07:06 à chaque fois une agressive, une...
07:08 là tu vas avoir une vraie liberté
07:10 et ce que je voulais dire aussi c'est que
07:12 le package proposé par Ace
07:14 c'est pas simplement créer des dialogues
07:16 c'est aussi, et c'est là
07:18 où on va peut-être un peu entrer dans
07:20 le côté mettre
07:22 en danger des professions
07:24 parce qu'on va automatiser
07:26 beaucoup de choses qui demandent du savoir-faire
07:28 aujourd'hui avec des gens qui sont des
07:30 rigueurs par exemple qui vont faire des rigs
07:32 sur des modèles 3D
07:34 et qui vont permettre à des
07:36 animateurs de venir faire bouger
07:38 chacun des modèles pour créer des animations
07:40 et tout ça. Maintenant on va avoir de l'animation
07:42 générée par l'IA pour des
07:44 modèles 3D et 2D
07:46 où on va juste donner un input par exemple
07:48 de voix et ça va générer de la
07:50 synchro labiale adaptée
07:52 on va avoir aussi des choses très intéressantes
07:54 par exemple du
07:56 texte to speech, du speech
07:58 to speech et aussi de la traduction
08:00 c'est à dire qu'on va pouvoir
08:02 avec une base en anglais
08:04 couvrir un éventail énorme
08:06 de langues et adapter aussi
08:08 la synchro labiale, c'est quelque chose qui a déjà
08:10 été fait sur Cyberpunk
08:12 pour ne citer que lui
08:14 donc en fait c'est plein plein d'éléments
08:16 qu'on va avoir à notre disposition
08:18 lorsqu'on crée des jeux
08:20 avec ce package NVIDIA et qui vont être
08:22 directement injectés, ils travaillent avec
08:24 Unreal Engine et avec les MetaHumans
08:26 les MetaHumans on vous en a déjà parlé
08:28 c'est ces modèles 3D
08:30 hyper réalistes
08:32 qui sont déjà
08:34 prêts à l'emploi on va dire
08:36 avec des animations qui ont l'air vraiment
08:38 ultra folles et donc quand on greffe
08:40 cette possibilité
08:42 d'inventer des personnalités
08:44 et de générer du speech à la demande
08:46 à des modèles hyper réalistes
08:48 et hyper bien animés, prévus pour être
08:50 hyper bien animés, ça ouvre
08:52 des possibilités
08:54 à des RPG qu'on aurait
08:56 simplement osé imaginer
08:58 il y a 5 ans quoi. C'est exactement
09:00 ça, c'est vraiment la possibilité et le truc
09:02 c'est qu'on sait qu'ils ont déjà dit
09:04 qu'ils bossaient avec MiHoYo
09:06 donc les gens Genshin avec Ubisoft
09:08 donc voilà, eux
09:10 en tout cas c'est ce qu'ils ont prévu, après il y en a peut-être
09:12 des éditeurs qui vont essayer de développer ça
09:14 de leur côté directement
09:16 donc NVIDIA Ace est un exemple
09:18 qui s'est déjà présenté mais il y en a certainement
09:20 d'autres qui bossent dessus derrière
09:22 là où il y a quelque chose
09:24 qui peut être paniquant
09:26 effectivement c'est comment les éditeurs
09:28 vont utiliser, ils ont deux choix
09:30 soit ils essayent d'amplifier
09:32 ce qu'ils font, c'est à dire qu'ils vont garder
09:34 le savoir-faire
09:36 qu'ils ont, essayer de booster
09:38 un petit peu tout ce que tu peux faire
09:40 on va dire, créer
09:42 soi-même bien sûr pour raconter quelque chose
09:44 avoir une vraie narration etc. Et derrière
09:46 tu utilises l'IA pour amplifier ton univers
09:48 soit tu fais, et là ça serait
09:50 beaucoup plus mal bien sûr, soit tu te dis
09:52 ok, moi je veux faire ça
09:54 mais plutôt que de le faire par des humains, je vais le faire par les IA
09:56 parce que si tu fais ça par contre, ce qui est sûr et certain
09:58 c'est que le travail fait par l'IA
10:00 sera moins bon que fait par l'humain
10:02 c'est bien pour
10:04 on va dire, améliorer des choses
10:06 que tu ne pouvais pas faire
10:08 donner des voix à des personnages
10:10 que tu ne pouvais pas faire parce que tu n'avais pas le temps
10:12 donc tu vas amplifier ça, tu vas rendre ton jeu meilleur
10:14 par contre si tu remplaces
10:16 ce que faisaient les humains
10:18 ton jeu sera moins bon, il n'y a aucune chance
10:20 qu'une IA fasse mieux qu'un
10:22 humain pour représenter
10:24 un humain, ça n'arrivera jamais
10:26 Je suis assez d'accord
10:28 et effectivement, là on le voit c'est une démo
10:30 qui date de 9 mois
10:32 ça devait être en GDC ou au CES
10:34 sur une démo sur les MetaHumans
10:36 on voit que c'est déjà un niveau assez fou
10:38 avec un scan complet
10:40 de cette actrice du coup
10:42 qui permet d'animer à la volée
10:44 de manière hyper réaliste
10:46 et effectivement, je pense que la question
10:48 ce n'est pas vraiment de savoir aujourd'hui
10:50 est-ce que les IA
10:52 vont être éradiquées
10:54 ou vont dominer totalement
10:56 Ah oui d'accord
10:58 En fait, l'IA dans le jeu vidéo
11:00 c'est à mon avis inévitable
11:02 c'est déjà là et ça va aller
11:04 en s'améliorant
11:06 en étant de plus en plus présent
11:08 la question c'est de savoir comment est-ce qu'on met des limites
11:10 et comment on respecte
11:12 le travail des employés pour
11:14 faciliter leur taf
11:16 les former pour qu'ils utilisent aussi
11:18 l'IA et que leur travail
11:20 devienne encore plus spécialisé
11:22 encore plus stylé et qu'on arrive à faire
11:24 évoluer le jeu vidéo
11:26 le but c'est vraiment pas de
11:28 remplacer tout ce qui est
11:30 facteur humain dans les studios
11:32 parce que ça c'est une horreur
11:34 ce serait une catastrophe, le but
11:36 c'est qu'en mélangeant
11:38 l'oeil humain, le savoir-faire humain
11:40 et la facilité
11:42 d'usage des IA et leurs
11:44 possibilités aussi pour faire, comme on l'a vu avec
11:46 NVIDIA, des dialogues générés procéduralement
11:48 et avec une certaine logique
11:50 en fonction de la personnalité du PNJ
11:52 ça serait une véritable évolution
11:54 pour le jeu vidéo et on pourrait atteindre
11:56 des niveaux jamais égalés auparavant
11:58 dans tout ce qui est roleplay et tout ça
12:00 Et voilà, il suffit que vous ayez joué un peu au jeu vidéo
12:02 dans votre vie pour que vous commenciez
12:04 déjà à imaginer toutes les possibilités
12:06 de jouer au jeu, vous vous êtes dit
12:08 "ouais, je faisais des trucs répétitifs, je faisais des trucs chiants
12:10 quand j'allais en side, il se passait pas grand chose
12:12 dès que tu sors de la quête principale
12:14 c'est à dire que c'est ça qui sera amélioré
12:16 plus que ta quête principale
12:18 au final quoi, là ce qu'on vient de voir
12:20 si c'était ta quête principale, machin
12:22 c'est pas plus impressionnant que ce qu'on a déjà
12:24 en fait, c'est absolument pas plus impressionnant
12:26 que ce qu'on a déjà, sauf si on sait que c'est fait par un animateur
12:28 et qu'on se dit "ouah, mais passer ce truc là"
12:30 il y a un moment où tu regardes ton jeu, tu préfères quand même
12:32 ça a été écrit par des mecs qui sont fun, qui ont envie de faire des trucs
12:34 une écriture à la GTA, fait par une IA
12:36 je te dis pas le carnage
12:38 Après il y a un autre truc aussi, c'est que ce niveau
12:40 de facilité d'usage pourra permettre
12:42 à des devs tout seuls par exemple
12:44 d'avoir une qualité dans
12:46 l'utilisation des modèles 3D
12:48 et en fait d'avoir un niveau de prod
12:50 à peu près similaire à ce que faisaient
12:52 des triple A avec des centaines d'employés
12:54 il y a peut-être 5 ou 10 ans
12:56 tu vois, il y a ça aussi qu'il faut se dire
12:58 c'est que ça va faire un step up énorme
13:00 sur le jeu indépendant
13:02 et qu'il y a d'ores et déjà
13:04 avec un téléphone
13:06 équipé d'un lidar
13:08 ces capteurs de profondeur
13:10 qui permettent de capter un mouvement
13:12 un visage, de scanner des visages
13:14 on peut d'ores et déjà faire
13:16 du travail qui aurait été
13:18 jugé il y a 10 ans de professionnels
13:20 de très très haut niveau
13:22 on arrive à ce
13:24 niveau de
13:26 qualité sur des prod 1D
13:28 et sur des prod
13:30 un peu plus colossal on va pouvoir
13:32 utiliser à bon escient l'intelligence
13:34 artificielle générative pour améliorer
13:36 les jeux et les faire atteindre
13:38 des niveaux qu'on n'aurait jamais soupçonné
13:40 en termes de dialogue, l'important c'est de
13:42 respecter bien sûr le travail
13:44 des humains et de mettre
13:46 les bonnes barrières pour éviter que
13:48 on se retrouve avec des studios 100%
13:50 staffés en IA
13:52 On vous regarde les éditeurs
13:54 et puis quand on voit par exemple les vœux
13:56 de certains
13:58 géants, il y a Square Enix par exemple
14:00 qui a dit qu'il fallait miser à fond
14:02 agressivement sur l'intelligence artificielle
14:04 voilà il faut voir comment c'est fait
14:06 et il faut voir si on respecte le travail
14:08 humain. En tout cas cette question
14:10 est brûlante, n'hésitez pas à nous dire vous
14:12 ce que vous en pensez, quelles sont les barrières à fixer
14:14 de votre côté et est-ce que vous seriez intéressé
14:16 de jouer à par exemple un RPG
14:18 où chacun des PNJ en fait
14:20 n'a pas des quêtes écrites par
14:22 un humain mais à des quêtes conditionnées
14:24 par un humain qui a entraîné une IA
14:26 à vous répondre d'une certaine manière, n'hésitez pas à nous dire
14:28 ce que vous en pensez dans les commentaires, nous on vous remercie
14:30 de nous avoir regardé, on vous fait des gros bisous ! Allez, ciao !
14:32 Bisous !
14:34 [Musique]
14:36 [Musique]
14:38 [Musique]
14:40 [Musique]
14:42 [Musique]