Ces IA apprennent à jouer à cache-cache

Regardez Ces IA apprennent à jouer à cache-cache - stream theory sur Dailymotion

Transcript

00:00 Ces IA apprennent à jouer à cache-cache et à exploiter le jeu toute seule.

00:02 Le jeu est simple, les rouges doivent attraper les bleus.

00:04 Ils font des centaines de millions de parties en étant juste récompensés s'ils gagnent.

00:08 Alors au début ils font n'importe quoi, puis les bleus comprennent vite que s'ils ne veulent pas se faire chopper,

00:12 ils doivent bloquer les points d'accès avec les cubes.

00:14 Ce comportement est récompensé et c'est maintenant aux rouges de s'adapter.

00:17 Et vous avez vu cette rampe là, elle n'est pas là par hasard,

00:19 les rouges comprennent évidemment qu'ils doivent s'en servir pour escalader le mur.

00:22 Mais les bleus contre-attaquent et comprennent qu'ils ont un court moment au début pour aller se cacher

00:26 et qu'ils peuvent utiliser ce temps pour aller simplement voler la rampe. Mais ça s'arrête pas là.

00:30 Les rouges se rendent compte quand ils n'ont pas le droit de bouger les rampes

00:32 qu'ils peuvent s'en servir pour monter sur les cubes et exploiter un bug de physique

00:36 pour se déplacer sur le cube et aller choper les bleus.

00:38 Ou qu'ils peuvent se propulser en l'air et atteindre les bleus.

00:41 Donc là l'IA a trouvé un glitch dans le jeu en fait.

00:43 Cette méthode c'est l'apprentissage autonome.

00:45 L'IA n'apprend pas avec une base de données comme ChatGPT mais en jouant contre elle-même.