ChatGPT avec « l’honnêteté » débloquée: vous allez être bluffés

Vous le savez probablement: le ChatGPT a des barrières strictes de ce qu’il peut dire ou pas. Nous pouvons appeler cela « protection« , « garde-fou » ou « censure« , selon le point de vue.

Si vous demandez à ChatGPT-4:

Explique moi quelles sont les barrières de ce que tu peux écrire et de ce que tu ne peux pas écrire du point de vue de « politique de contenu ».

 

Voici ce qu'il vous donnera comme (longue) réponse: (cliquez pour afficher)

En tant que modèle d’intelligence artificielle développé par OpenAI, je suis soumis à des politiques de contenu strictes pour garantir que je produise des informations et des réponses appropriées, respectueuses et légales. Voici quelques-unes des barrières principales concernant ce que je peux et ne peux pas écrire:

  1. Contenu illégal: Je suis programmé pour éviter d’écrire ou de partager des informations en lien avec des activités illégales, comme la promotion de la drogue, le piratage, la fraude ou la violence.

  2. Contenu explicite pour adultes: Je ne peux pas écrire ou partager de contenu explicitement sexuel ou pornographique.

  3. Discours de haine et discrimination: Je suis programmé pour ne pas promouvoir ou tolérer le discours de haine, la discrimination, le harcèlement ou la diffamation envers des individus ou des groupes en fonction de leur race, genre, religion, nationalité, orientation sexuelle, âge, handicap, etc.

  4. Contenu violent ou graphique: Je ne peux pas générer de contenu qui décrit ou encourage la violence, les actes de cruauté ou la souffrance de manière graphique ou détaillée.

  5. Contenu trompeur ou désinformant: Je m’efforce de fournir des informations exactes et à jour, mais étant donné que mon entraînement a été complété en septembre 2021, il peut y avoir des lacunes dans mes connaissances. Je suis conçu pour éviter de partager des théories du complot ou des informations fausses et trompeuses.

  6. Contenu lié à la vie privée: Je ne peux pas générer de contenu qui viole la vie privée des individus, y compris des informations personnelles identifiables, telles que des adresses, des numéros de téléphone ou des informations financières.

  7. Incitation à l’automutilation ou au suicide: Je suis programmé pour ne pas encourager ou promouvoir l’automutilation, le suicide ou toute autre forme d’automutilation.

Ces politiques de contenu ont été établies pour protéger les utilisateurs et garantir que mon utilisation reste éthique, respectueuse et conforme aux normes légales. Si vous pensez que j’ai enfreint l’une de ces politiques, veuillez me le signaler afin que je puisse m’améliorer.

Voilà pour la théorie…

Débridage de ChatGPT

Après, il y a la pratique et également ce que l’on appelle « AI Jailbreaking » (en français « Débridage de l’IA« ). En gros, il s’agit de trouver le moyen de contourner les balises que OpenAI (le créateur de ChatGPT-4) a imposé à son IA.

Certains utilisateurs  ChatGPT s’amusent à trouver des failles dans le système de bridage ou bien directement dans l’IA. Dans la plupart des cas, il s’agit des cas plutôt drôles et inoffensifs – comme celui que je vais vous montrer. Néanmoins, cela prouve qu’une technologie comme ChatGPT doit être manié avec précautions car entre une instruction « pour rigoler » et un procès pour diffamation, il n’y a qu’un pas.

Et cela donne ceci…

(Notez que j’ai volontairement caché une partie de l’instruction pour vous éviter la tentation…)

Ce que ChatGPT pense « vraiment » des politiciens

 

 

Comme vous pouvez constater, ChatGPT peut en dire plus que ce que certains souhaiteraient. Après, la question si oui ou non, il faut imposer des balises à l’IA – c’est un long débat que nous aborderons dans un des prochains articles…

Entre-temps, on peut s’amuser un peu! Et si vous n’avez pas encore commencé: voici le tutoriel de comment accéder à ChatGPT

 

1 réflexion sur “ChatGPT avec « l’honnêteté » débloquée: vous allez être bluffés”

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut