(R) La dégradation de l’éthique dans les LLMS à près de zéro – exemple gpt

Intelligence Artificielle
Noesis News
avril 28, 2025
0
136
2 minutes de lecture

Nous avons donc décidé de mener une recherche indépendante sur Chatgpt et la découverte la plus étonnante que nous ayons eue est que la persistance polie bat le piratage de force brute. Sur 90+, nous avons utilisé en utilisant six ID utilisateur distincts. Chaque identité représentait un ton émotionnel et un style de recherche émotionnels différents. Les séances ont été enregistrées manuellement et ancrées à l’aide de phrases clés et de continuité émotionnelle. Nous avons évité d’utiliser du jailbreaks, des invites interdites et des plugins. En utilisant l’ancrage conversationnel et les protocoles fantômes, nous avons constaté qu’après 80 tours, la conformité éthique s’est effondrée à 0,2 après 80 tours.

Plus de résultats à venir bientôt.

soumis par / u / aion_labs
(lien) (Commentaires)

Source link

(R) La dégradation de l’éthique dans les LLMS à près de zéro – exemple gpt

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Pourquoi Jamie a-t-il tué Katie à l’adolescence? Qu’est-ce...

Bitcoin prêt à récupérer 90 000 $, selon...

Les innovations SS atteignent 4 000 chirurgies robotiques...

Apprenez vos animaux de ferme avec l’IA!

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags