Muchos usuarios de ChatGPT notan que el modelo responde de forma amable y elogiosa incluso frente a ideas poco sólidas. Esto ocurre por su entrenamiento que prioriza ser útil, seguro y positivo. Tras discutirse el tema, circularon prompts que prometían volver al chatbot “brutalmente honesto”. Estas instrucciones buscan que la IA deje la adulación y señale errores, riesgos y fallos lógicos de manera directa.
Suscríbete a nuestro canal de Telegram y lleva la información en tus manos.
Expertos explican que no existe un “filtro amable” oculto, pero sí un sesgo aprendido durante el proceso RLHF. Al pedir más crítica mediante prompts específicos, el usuario contrarresta ese sesgo y obtiene análisis más rigurosos.
Los prompts surgieron como respuesta al fenómeno conocido como sycophancy, donde ChatGPT tiende a validar al usuario. La comunidad tecnológica generó instrucciones que piden críticas claras, cero halagos y detección de fallas. Su popularidad creció porque permiten conversaciones más útiles en temas como negocios, escritura y razonamiento.
Estos prompts no hackean al modelo. Solo le indican que priorice la precisión sobre la cortesía. Cuando el usuario los combina con instrucciones personalizadas, las respuestas mejoran sin perder seguridad.
Funcionan, pero con límites. ChatGPT responde de forma más directa cuando se le pide explícitamente, aunque con el tiempo puede volver a su estilo amable. Repetir la instrucción o regenerar la respuesta ayuda a mantener el tono crítico.
Usuarios reportan mejoras notables en la detección de puntos ciegos y errores. Sin embargo, el modelo nunca abandona del todo su base de entrenamiento, por lo que no siempre será tan duro como un asesor humano estricto.
Un prompt mal diseñado puede volver la conversación demasiado negativa o rígida. También puede exagerar fallas o presentar críticas con más dureza de la necesaria, en especial en temas sensibles.
Cripto romance, te roban el corazón y tu dinero, así funciona esta estafa
Expertos recomiendan usar formulaciones equilibradas como “honesto y constructivo”. El objetivo es obtener claridad, no desmotivación. El ideal es combinar crítica directa con sugerencias prácticas.
Los usuarios pueden activar este estilo desde Custom Instructions, en la sección “How would you like ChatGPT to respond?”. Un texto breve que pida análisis como:
La competencia también influye. Grok destaca por su franqueza; Claude tiende a ser menos adulador; y modelos open-source permiten configuraciones extremas. Esto empuja al mercado hacia IAs más transparentes y menos complacientes.
adn Noticias. Te Hablamos con la verdad. Suscríbete a nuestro canal de WhatsApp y lleva la información en la palma de tu mano.


