• l’année dernière
Transcription
00:00 Ces IA apprennent à jouer à cache-cache et à exploiter le jeu toute seule.
00:02 Le jeu est simple, les rouges doivent attraper les bleus.
00:04 Ils font des centaines de millions de parties en étant juste récompensés s'ils gagnent.
00:08 Alors au début ils font n'importe quoi, puis les bleus comprennent vite que s'ils ne veulent pas se faire chopper,
00:12 ils doivent bloquer les points d'accès avec les cubes.
00:14 Ce comportement est récompensé et c'est maintenant aux rouges de s'adapter.
00:17 Et vous avez vu cette rampe là, elle n'est pas là par hasard,
00:19 les rouges comprennent évidemment qu'ils doivent s'en servir pour escalader le mur.
00:22 Mais les bleus contre-attaquent et comprennent qu'ils ont un court moment au début pour aller se cacher
00:26 et qu'ils peuvent utiliser ce temps pour aller simplement voler la rampe. Mais ça s'arrête pas là.
00:30 Les rouges se rendent compte quand ils n'ont pas le droit de bouger les rampes
00:32 qu'ils peuvent s'en servir pour monter sur les cubes et exploiter un bug de physique
00:36 pour se déplacer sur le cube et aller choper les bleus.
00:38 Ou qu'ils peuvent se propulser en l'air et atteindre les bleus.
00:41 Donc là l'IA a trouvé un glitch dans le jeu en fait.
00:43 Cette méthode c'est l'apprentissage autonome.
00:45 L'IA n'apprend pas avec une base de données comme ChatGPT mais en jouant contre elle-même.