• il y a 10 mois
SORA la nouvelle fonction de Chat GPT te permet de créer des vidéos IA
Transcription
00:00 Cette vidéo n'est pas un extrait de d'une deux.
00:15 Mais une vidéo créée par le nouveau modèle IA d'OpenAI, Sora.
00:19 OpenAI a annoncé l'arrivée prochaine de son générateur texte ou vidéo, Sora.
00:24 Un générateur IA capable de créer des vidéos allant jusqu'à 1 minute.
00:28 Une durée impressionnante, surtout quand on compare aux autres générateurs texte
00:32 ou vidéo qui existent déjà, par exemple RunwayML ou Pika.art, et qui proposent généralement
00:37 des durées allant de 10 à 15 secondes maximum.
00:40 Et ces courtes durées, normalement, elles s'expliquent par le fait que générer une
00:44 vidéo IA, si on veut le faire sur une longue durée, on rencontre généralement un problème
00:48 de stabilité.
00:49 Et peu de modèles arrivent à conserver une bonne stabilité dès qu'on dépasse les
00:52 10 ou 15 secondes de vidéo.
00:54 Justement, OpenAI revendique avoir résolu ce gros problème de stabilité, et le modèle
01:00 IA d'OpenAI, Sora, est capable de garder la stabilité de la vidéo et du sujet de
01:05 la vidéo pendant près d'une minute.
01:08 En plus de ça, et avec l'expérience qu'OpenAI a sur GPT ou DALI, on a un modèle qui comprend
01:13 parfaitement les promptes.
01:14 Et donc le résultat, c'est des vidéos ultra réalistes, ultra stables, et donc des résultats
01:19 qui se confondent avec des vidéos réelles.
01:21 On va regarder d'un peu plus près les vidéos mises en avant par OpenAI avec les promptes
01:26 associées.
01:27 Donc la vidéo qu'on a vue en intro, si on traduit le prompt, ça donne une bande annonce
01:30 d'un film présentant les aventures d'un spationaute de 30 ans portant un casque de
01:34 moto tricoté en laine rouge, ciel bleu, désert de sel, style cinématographique, tourné
01:39 sur du 35mm.
01:40 Et en effet, on a tous ces détails qui sont présents dans la vidéo.
01:45 Impressionnant.
01:46 Un autre exemple avec cette vidéo qui simule le plan d'un drone.
01:49 Alors là, on a un prompt encore plus détaillé.
01:52 Je ne vais pas le lire en entier, mais on voit comment le modèle arrive à prendre
01:55 en compte un prompt complexe.
01:57 Là, on a un autre exemple avec une vidéo plus dans un style animé.
02:00 Et ça nous permet de voir également la stabilité du sujet pendant toute la vidéo.
02:05 Alors sur celle-ci, on a un prompt beaucoup plus simple qu'on pourrait traduire par un
02:09 monde en papier représentant un récif de corail en regorgeant de poissons colorés
02:14 et de créatures marines.
02:15 Alors celle-là, c'est sûrement une de mes vidéos préférées.
02:17 Donc le prompt, c'est vidéo photoréaliste en gros plan de deux navires pirates s'affrontant
02:23 alors qu'ils naviguent dans une tasse de café.
02:25 Et l'effet des vagues avec le café, c'est juste superbe.
02:28 Là, on a une autre vidéo.
02:30 Donc un jeune homme de 20 ans qui est assis sur un nuage dans le ciel et qui est en train
02:35 de lire un livre.
02:36 Et ce qui est marrant, c'est que ça ressemble beaucoup à une vidéo qu'on peut retrouver
02:39 dans les banques vidéo libre de droit.
02:40 Donc il y a plein d'autres exemples sur la page.
02:43 Je ne vais pas tous les montrer.
02:44 Si jamais tu veux tous aller les voir, tu peux les retrouver sur openai.com/sora.
02:48 Je remettrai le lien en description de la vidéo.
02:52 Après attention, on est sur une page de présentation.
02:55 Les vidéos données en exemple sont soigneusement sélectionnées et même OpenAI met en garde
03:00 sur le fait que leur lien ne sera pas parfait et que les résultats peuvent être fluctuants.
03:05 Mais il faut quand même le dire, les vidéos créées par OpenAI et mises en avant sont
03:10 impressionnantes.
03:11 Avec ce problème de stabilité résolu par OpenAI et avec l'expérience qu'ils ont
03:15 sur DALI et ChatGPT, ils ont réussi à créer un modèle texte ou vidéo qui a l'air d'être
03:22 tout simplement le meilleur modèle qui n'a jamais été créé.
03:25 Après, il faudra l'essayer pour en être sûr.
03:27 En plus du texte ou vidéo, OpenAI a également annoncé qu'il sera possible de créer une
03:31 vidéo à partir d'une image ou encore de créer l'extension d'une vidéo existante.
03:36 Soran est disponible pour l'instant que pour un groupe d'utilisateurs limité.
03:40 Il faudra donc sûrement patienter quelques semaines pour pouvoir le tester, aucune date
03:44 de précisé pour l'instant.
03:45 Et il faut s'attendre à ce que Sora soit disponible pour les abonnés de ChatGPT+.
03:49 On connaît maintenant la façon de fonctionner de ChatGPT qui favorise toujours les abonnés
03:54 de ChatGPT+.
03:55 OpenAI conclut en indiquant que Sora constituera une étape importante pour atteindre l'AGI,
04:01 l'Artificial General Intelligence, en d'autres termes une IA capable d'effectuer et d'apprendre
04:07 pratiquement n'importe quelle tâche.
04:08 En tout cas, dès que Sora sera disponible, on n'hésitera pas à l'essayer et à faire
04:13 un test sur le Labo des Réseaux.
04:15 Et si l'IA t'intéresse, n'hésite pas à t'abonner à notre newsletter, le lien
04:18 est en description et en commentaire épinglé.
04:20 Merci et à bientôt sur le Labo des Réseaux.

Recommandations