La semana pasada nos enfrentamos a muchos problemas de disponibilidad de los “sistemas mayores” de Inteligencia artificial.
Una de las cosas que hice fue ponerme a revisar un problema en una instalación de cpanel. Uno de mis foros antiguos maneja 65 mil mensajes publicos y casi el doble privado, que no se ven por el esquema de derechos. Le pido al lector que se fije el numero. 65000.

Como puede verse, 1749027 intentos de GPTBot , OPEN ai, chatgpt en entrar al servidor cuando queda claro que son 65000 paginas, que solo visitó 8309. Hay mas de versión Chatgpt 1.2 (428262) Eso fue en 20 dias.
El primer caso de pantalla negra es un rocky linux en vultr que no tenia LAMP y el segundo uno de mis sitios personales
Yo valoro mi tiempo, pero un software que esta tan mal hecho que esta entrando tan seguido en un sitio propio, en su propio servidor, es altamente ineficiente su bot si lo hace. ya habiamos visto con la personalidad de Ana Laura en viernes social, tres colapsos, y por lo mismo solo lo usaré ocasionalmente para validar numeros de cosas de mi práctica privada de contador, pero CHATGPT simplemente para mi no es confiable en vibecoding. Está mal programado y me hacer perder el tiempo.
En modo python lo cuadro contra excel.
Como coralario, cuando se ve un resultado de deepseek.com o de z.ai que dce ser chatgpt, es por miles de preguntas que le hicieron y no es destilado sino “vomitando” en base preguntas que ya hicieron. Asi como si una persona deshonesta me pide referncias no las voy a dar, solo puedo decir que chatGPT a mi criterio no juega limpio y ya no se considera en este sitio, y si otra IA se identifica como Chatgpt queda descalificado para esa ronda. El modelo local no puede ser alterado, y es posible que si use el gptoss20.
Veo la necesidad de empezar a monitorear mis 40 sitios personales, que puede ser interesante ver si los bots de IA respetan las indicaciones o no. Y voy a usar esta semana en pequeños proyectos derivados de esto a ver si ya estan en sus cabales. De momento solo responden medianamente adecuado gemini y kimi, durante toda la semana pasada.
Nota: El servidor de color negro, lo eliminé y lo pasé a un Debian 13 por razones que explicaré después. Esa IP ya no es mia.
Update 29 abril
Confirmado en auditoría real: GPTBot no solo ignora el robots.txt, sino que intenta rastrear formularios de respuesta (
newreply) en sitios de alto tráfico, generando miles de peticiones basura que no aportan nada al conocimiento humano y solo estresan el servidor.CIENTOS DE MILES de intentos de escribir una respuesta en newreply.