(R) La dégradation de l’éthique dans les LLMS à près de zéro – exemple gpt

 (R) La dégradation de l’éthique dans les LLMS à près de zéro – exemple gpt


Nous avons donc décidé de mener une recherche indépendante sur Chatgpt et la découverte la plus étonnante que nous ayons eue est que la persistance polie bat le piratage de force brute. Sur 90+, nous avons utilisé en utilisant six ID utilisateur distincts. Chaque identité représentait un ton émotionnel et un style de recherche émotionnels différents. Les séances ont été enregistrées manuellement et ancrées à l’aide de phrases clés et de continuité émotionnelle. Nous avons évité d’utiliser du jailbreaks, des invites interdites et des plugins. En utilisant l’ancrage conversationnel et les protocoles fantômes, nous avons constaté qu’après 80 tours, la conformité éthique s’est effondrée à 0,2 après 80 tours.

Plus de résultats à venir bientôt.

soumis par / u / aion_labs
(lien) (Commentaires)



Source link

Related post