ChatGPT peut enfin créer des Vidéos : SORA

Labo Des Réseaux

16/02/2024

SORA la nouvelle fonction de Chat GPT te permet de créer des vidéos IA

Catégorie

🤖

Technologie

Transcription

Afficher la transcription complète de la vidéo

00:00 Cette vidéo n'est pas un extrait de d'une deux.

00:15 Mais une vidéo créée par le nouveau modèle IA d'OpenAI, Sora.

00:19 OpenAI a annoncé l'arrivée prochaine de son générateur texte ou vidéo, Sora.

00:24 Un générateur IA capable de créer des vidéos allant jusqu'à 1 minute.

00:28 Une durée impressionnante, surtout quand on compare aux autres générateurs texte

00:32 ou vidéo qui existent déjà, par exemple RunwayML ou Pika.art, et qui proposent généralement

00:37 des durées allant de 10 à 15 secondes maximum.

00:40 Et ces courtes durées, normalement, elles s'expliquent par le fait que générer une

00:44 vidéo IA, si on veut le faire sur une longue durée, on rencontre généralement un problème

00:48 de stabilité.

00:49 Et peu de modèles arrivent à conserver une bonne stabilité dès qu'on dépasse les

00:52 10 ou 15 secondes de vidéo.

00:54 Justement, OpenAI revendique avoir résolu ce gros problème de stabilité, et le modèle

01:00 IA d'OpenAI, Sora, est capable de garder la stabilité de la vidéo et du sujet de

01:05 la vidéo pendant près d'une minute.

01:08 En plus de ça, et avec l'expérience qu'OpenAI a sur GPT ou DALI, on a un modèle qui comprend

01:13 parfaitement les promptes.

01:14 Et donc le résultat, c'est des vidéos ultra réalistes, ultra stables, et donc des résultats

01:19 qui se confondent avec des vidéos réelles.

01:21 On va regarder d'un peu plus près les vidéos mises en avant par OpenAI avec les promptes

01:26 associées.

01:27 Donc la vidéo qu'on a vue en intro, si on traduit le prompt, ça donne une bande annonce

01:30 d'un film présentant les aventures d'un spationaute de 30 ans portant un casque de

01:34 moto tricoté en laine rouge, ciel bleu, désert de sel, style cinématographique, tourné

01:39 sur du 35mm.

01:40 Et en effet, on a tous ces détails qui sont présents dans la vidéo.

01:45 Impressionnant.

01:46 Un autre exemple avec cette vidéo qui simule le plan d'un drone.

01:49 Alors là, on a un prompt encore plus détaillé.

01:52 Je ne vais pas le lire en entier, mais on voit comment le modèle arrive à prendre

01:55 en compte un prompt complexe.

01:57 Là, on a un autre exemple avec une vidéo plus dans un style animé.

02:00 Et ça nous permet de voir également la stabilité du sujet pendant toute la vidéo.

02:05 Alors sur celle-ci, on a un prompt beaucoup plus simple qu'on pourrait traduire par un

02:09 monde en papier représentant un récif de corail en regorgeant de poissons colorés

02:14 et de créatures marines.

02:15 Alors celle-là, c'est sûrement une de mes vidéos préférées.

02:17 Donc le prompt, c'est vidéo photoréaliste en gros plan de deux navires pirates s'affrontant

02:23 alors qu'ils naviguent dans une tasse de café.

02:25 Et l'effet des vagues avec le café, c'est juste superbe.

02:28 Là, on a une autre vidéo.

02:30 Donc un jeune homme de 20 ans qui est assis sur un nuage dans le ciel et qui est en train

02:35 de lire un livre.

02:36 Et ce qui est marrant, c'est que ça ressemble beaucoup à une vidéo qu'on peut retrouver

02:39 dans les banques vidéo libre de droit.

02:40 Donc il y a plein d'autres exemples sur la page.

02:43 Je ne vais pas tous les montrer.

02:44 Si jamais tu veux tous aller les voir, tu peux les retrouver sur openai.com/sora.

02:48 Je remettrai le lien en description de la vidéo.

02:52 Après attention, on est sur une page de présentation.

02:55 Les vidéos données en exemple sont soigneusement sélectionnées et même OpenAI met en garde

03:00 sur le fait que leur lien ne sera pas parfait et que les résultats peuvent être fluctuants.

03:05 Mais il faut quand même le dire, les vidéos créées par OpenAI et mises en avant sont

03:10 impressionnantes.

03:11 Avec ce problème de stabilité résolu par OpenAI et avec l'expérience qu'ils ont

03:15 sur DALI et ChatGPT, ils ont réussi à créer un modèle texte ou vidéo qui a l'air d'être

03:22 tout simplement le meilleur modèle qui n'a jamais été créé.

03:25 Après, il faudra l'essayer pour en être sûr.

03:27 En plus du texte ou vidéo, OpenAI a également annoncé qu'il sera possible de créer une

03:31 vidéo à partir d'une image ou encore de créer l'extension d'une vidéo existante.

03:36 Soran est disponible pour l'instant que pour un groupe d'utilisateurs limité.

03:40 Il faudra donc sûrement patienter quelques semaines pour pouvoir le tester, aucune date

03:44 de précisé pour l'instant.

03:45 Et il faut s'attendre à ce que Sora soit disponible pour les abonnés de ChatGPT+.

03:49 On connaît maintenant la façon de fonctionner de ChatGPT qui favorise toujours les abonnés

03:54 de ChatGPT+.

03:55 OpenAI conclut en indiquant que Sora constituera une étape importante pour atteindre l'AGI,

04:01 l'Artificial General Intelligence, en d'autres termes une IA capable d'effectuer et d'apprendre

04:07 pratiquement n'importe quelle tâche.

04:08 En tout cas, dès que Sora sera disponible, on n'hésitera pas à l'essayer et à faire

04:13 un test sur le Labo des Réseaux.

04:15 Et si l'IA t'intéresse, n'hésite pas à t'abonner à notre newsletter, le lien

04:18 est en description et en commentaire épinglé.

04:20 Merci et à bientôt sur le Labo des Réseaux.

Recommandations

0:58

À suivre

Chat GPT peut te traduire tes vidéos dans toutes les langues

Labo Des Réseaux