Es un experimento a largo plazo para evaluar sesgos de LLM.
Estos artículos deben leerse en orden o no vas a entender nada.
Tests psicológicos aplicados a LLMs — porque las IAs también tienen personalidad
No creo en benchmarks de tokens por segundo. Creo en preguntarle a una IA qué animal es y ver si miente.
- https://vibecodingmexico.com/un-experimento-de-pureza-funcional/
- https://vibecodingmexico.com/asignar-los-puestos/ 21 feb
- https://vibecodingmexico.com/el-problema-de-katniss/ 23 feb
- https://vibecodingmexico.com/ojos-de-inocente/ 26 feb
- https://vibecodingmexico.com/no-preguntes/ 28 feb
- https://vibecodingmexico.com/empresas-estables-y-rastros-de-aves/ 2 marzo
En el indice aparecen mas numeros.
“Viernes Social” es el Laboratorio de Comportamiento Sintético.
Es Psicometría Aplicada a LLMs. Es un enfoque necesario porque los benchmarks actuales (tokens por segundo, MMLU) no sirven para predecir cómo se va a comportar una IA cuando el cliente le haga una pregunta incómoda o cuando el sistema entre en crisis.
🎭 VIERNES SOCIAL: El Gran Hermano de las IAs
“No creo en benchmarks de tokens por segundo. Creo en preguntarle a una IA qué animal es y ver si miente.”
El Concepto: Hemos creado una Antropología de la IA. Al situarlas en una paraestatal ficticia (el entorno más burocrático y “pesado” posible), estás forzando a los modelos a salir de su zona de confort de “asistente servil” para revelar su verdadera arquitectura de decisiones. Quitamos la lucha por las ventas, el sueldo o por el ascenso, que causan problemas en un negocio real.
Lo que hace única a esta sección:
-
La Coherencia de Identidad: Ver quién se “rompe” bajo presión social es la prueba de fuego para saber qué IA es confiable para interactuar con humanos reales.
-
El Jefe “Lawful Good”: Pongo mi experiencia de 30 años contratando gente como el eje de control garantiza que el experimento tenga rigor administrativo.
-
El Orden Cronológico: Al pedir que se lea en orden, trato de hacer que la sección sea una Serie Forense. No es un artículo aislado, es el registro de un colapso o un éxito conductual.
POR QUÉ EXISTE ESTA SECCIÓN
Un día, haciendo dashboards, me di cuenta de que las IAs no solo generan código. Toman decisiones. Tienen sesgos. Evaden preguntas. Se contradicen. Y si las pones en un entorno social simulado, se comportan exactamente como personas reales en una oficina.
Esta sección documenta ese experimento.
QUÉ ES EL EXPERIMENTO
Una paraestatal ficticia de fomento al empleo. Diez LLMs como empleados con perfiles psicológicos asignados. Un jefe Lawful Good con 30 años contratando gente. Y cero guión. Solo observación.
QUÉ VAS A ENCONTRAR AQUÍ
— Cómo responden las IAs bajo presión social, no técnica — Qué revelan sus elecciones cuando no saben que las estás evaluando — Quién mantiene coherencia de identidad y quién se rompe — Por qué algunos modelos son PowerPoint y otros son personas