• avant-hier
JAILBREAK Automatique CHATGPT ! #chatgpt #jailbreak #IA #technologie #dan

Category

📺
TV
Transcription
00:00Une IA maléfique capable de pirater tous les assistants virtuels vient d'être créée.
00:04Une équipe de chercheurs d'universités américaines et de NVIDIA a créé Autodame Turbo,
00:09un système qui trouve automatiquement des moyens de contourner les protections des grands modèles de langage.
00:14Autodame Turbo fonctionne en découvrant et en combinant différentes stratégies de jailbreak,
00:18donc des façons de formuler des promptes qui contournent les règles intégrées d'un modèle.
00:22Par exemple, alors que ChatGPT n'est pas censé aider pour des activités illégales,
00:25certaines formulations de promptes peuvent encore le tromper pour qu'il le fasse.
00:29Et le système peut développer de nouvelles approches de jailbreak par lui-même et les sauvegarder de manière organisée,
00:35ce qui lui permet de réutiliser et de s'appuyer sur des stratégies qui ont réussi précédemment.
00:39Et Autodame Turbo est maintenant en tête des autres approches sur le dataset ArmBench pour tester les jailbreaks.
00:44Et attention, le code d'Autodame Turbo est disponible en téléchargement gratuit sur GitHub,
00:49avec des instructions d'installation que je ne vous recommande surtout pas d'utiliser, bien entendu.

Recommandations