Enfocarse en lo que funciona

Enfocarse en lo que Sí funciona. – Resumen quincenal abril 2026

Asunto 1: Avatar y Viernes Social

Antes del problema de quedarme sin internet día y medio, terminé para viernes social el sistema de quests tipo Ultima IV. Lo que hicieron Grok y Gemini (modo razonamiento) para aplicar el universo de preguntas estaba mal. Gemini todo era pastor, y el algoritmo de Grok tenía sus fallas. En ese momento Claude lo hizo en una pasada.

Usé a lo largo de los días siguientes el modo “Haydee”, diseñador gráfico de Gemini en una segunda cuenta. El problema que tuve fue que solo me hacía 3 imágenes por día. Son ocho avatares, de cada género hombre o mujer. Ya las tengo, las imágenes de mujer están basadas en una artista “Julie Bell”, creo, que es parecida a Boris Vallejo, y en el caso de los hombres los hice tomando como base a Boris Vallejo en estilo, con look parecido a Karl Urban. Pero en este momento llevo prácticamente un mes en donde no han respondido por una razón u otra los modelos LLM a las preguntas. Como son ocho preguntas se colapsan. ¿Tiene sentido estadístico aplicarlo solo a unos modelos? No.

Así que hasta que Grok y Kimi estén de humor para contestar ocho preguntas seguidas sin que me digan que estan ocupados no puedo seguir la sección. Aviso que noté que Deepseek busca un poco complacer y debo seguir revisando el modelo de rol, pero algo no está bien. Sin embargo, en modo analítico no programación sí funciona.

Asunto 2: Grok y Claude

Grok no está manejando muchas cosas de gráficos y regresó en modo “pensar” a como estaba a principios de año. Desde mi punto de vista se perdió de momento el “junior autodidacta brillante”. Y Claude, con el nuevo modelo gasta más tokens y se cansa más rápido. Sí, en modo Sonnet. Ejemplo: empecé a manejar hoy tres preguntas relacionadas con la idea de hacer un plugin de WordPress, y no eran complicadas. A la tercera me dijo que regresara en cinco horas. No me contestó demasiado, ahora, perdonen la expresión, la “stamina” de Claude lo llevó a “viejo cansado”, en lugar de “senior maduro”. Y no voy a hacer tres preguntas cada cuatro horas en trabajo real. Igual, veo posibilidades de que haya causas económicas atrás, pero sí veo mucho descontento.

Asunto 3: Tres Gemini y Copilot

Gemini no pudo hacer la semana pasada algo que le pedí dos veces en una instancia mía y en una de mi esposa que estaba abierta en su cuenta de Gmail y quise probar. Le pasé un texto para convertirlo de texto escrito en Notepad a Markdown para pegarlo en un readme.md y lo que me dio fue Canva, no hubo manera de que me diera el # con texto. Sigue le problema que le paso un código de 120 lineas o mas para uerme haga una mejora, y me da algo que mide 10 borrando toda la funcionalidad. No puede iterar en cosas medianas. Mucho ojo con los números de lineas entregados y recibidos.

Y en el caso de Copilot, a todo me dijo “¿te gustaría que lo separe en párrafos o que te ordene en listas?” cuando era texto que no podía yo modificar. O sea, si estoy haciendo un resumen de la ley que ya viene en viñetas para un texto a un cliente y quiero ortografía, ¿para qué me sirve eso? Gemini reescribe y Copilot va para allá. Literalmente tuve que checar una ortografía… ¡en Word!

Repuesta de cajón de copilot “¿Quieres que también te lo devuelva en formato más limpio tipo guía segmentada (con viñetas y subtítulos) para que sea más fácil de leer en tu sitio, o prefieres mantenerlo tal cual como mensaje testimonial?
Y eso te lo da aunque venga en viñetas.
Trata de ser Servicial pero literalmente ya parece retraso mental. Siendo políticamente correcto usaría “regresión cognitiva” o “incapacidad funcional”. Mantiene el veneno pero suena más a diagnóstico de ingeniería.
No puedes hacer un cisne estirándole el cuello a un pato.

Asunto 4: Proyecto ELGOI

En estos días subí mucha información de código, pero no bases de datos, al repositorio ELGOI sobre control de EVE Online y ese proyecto. Nada es “nuevo”, son cosas que hice el mes anterior. Las cosas que hice en meses anteriores con los mismos prompts, Gemini y Claude me regresan algo que no funciona, demasiado extenso o demasiado confuso. Lo que puse es temporal y funcional, pero está pasando como hace meses en factura electrónica. La información que lo hizo posible ya no está disponible, y así como buscar hooks en Rust, o CFDI 4.0 desde diseño, no hay información en internet, en los módulos que me consta que hice con apoyo de Claude o Gemini, ya no dan un resultado viable.

Framework sobre framework. Estoy acostumbrado a hacer sistemas “en lenguaje C”, es decir, vigilando los detalles para que no haya problemas, pero Claude ignora el contexto, piensa como una versión de hace un año y medio, y Gemini da información basura en relación a hace ocho meses, pero que todavía es rescatable en iteraciones. Es lo mejor de los que no restringe de momento, pero comete errores que no hacía hace seis meses.

Asunto 5: Problemas de jaulas en hardware / software

De momento tengo varios servidores de uso privado, unos CPanel, otros Rocky Linux, Debian y Arch. La semana pasada tuve un problema medio raro con Rocky Linux 10. Usa una capa de seguridad extra llamada SELinux, pero lo que estaba tratando de hacer de repente ya no me dejó. El software que corre allí genera archivos temporales en carpetas variables. Y empezó a fallar más o menos silenciosamente. ¿Qué pasa? A nivel software SELinux es una especie de “jaula” y los derechos de escritura de archivo se dan en TRES comandos, no en dos. Eso por sí solo es suficiente para que elegir para la paraestatal Rocky Linux no fuera buena idea el año pasado (lo principal era la subida de PDF de 30 sucursales diariamente) y ahora me dio a mí los problemas que tuve el año pasado con la paraestatal. Pero a diferencia de los usuarios de la paraestatal que debían usar Rocky Linux, yo no tengo por qué usar un tenedor para comer una sopa, y en ese caso de uso era mejor Debian, por lo cual creé otro servidor Debian 13 desde cero, pasé la información del Rocky Linux y santo remedio en menos de media hora. El debugging de Rocky Linux fue de unas dos o tres horas, y lo atribuyo a unos cambios en los repositorios de PHP 8.4 “exclusivos” de Rocky.

En el caso de CPanel, que es un panel de control de dominios que usan muchos de mis clientes que tienen correo, han habido algunos puntos las últimas semanas en subida de adjuntos. Eso tiene que ver igual con capas de contención de CPanel. Pero si mis clientes fueran bloggers o que subieran imágenes en wordpress, CPanel me estaría causando problemas. Es ridículo, pero como mis clientes son empresas que suben cuando les da la gana, muy de vez en cuando no pasa nada. Puede rastrearse esto a cambio de versiones de PHP 7.x a 8.x, pero no es normal que lo mejor que se puede hacer a veces es respaldar, borrar y restaurar respaldo.

Literalmente estoy pensando en mover unos 15 a 20 wordpress que tengo a un vultr, desde hace unos dias por este asunto de permisos del cage de fprm de cpanel sobre el directorio uploads.

Como dato interesante hoy se me ocurrió preguntarle a Gemini en un tema pequeño sobre los permisos de /tmp en Linux y CPanel, y ya habíamos visto cosas de Debian. Pues se puso terco en que yo quería poner CPanel sobre Debian y no hubo manera de decirle que eran dos servidores diferentes, de plano borré la conversación.

La semana pasada, por lo mismo, me tuve que enfocar a preguntas CORTAS y exactas para obtener resultados medianamente decentes en Gemini y en otros LLM, y finalmente me empecé a apoyar más en los modelos europeos Mistral (LeChat) y Cohere (canadiense). Hay un artículo reciente en Forbes sobre el financiamiento de Mistral que vale la pena considerar.

A mediano plazo, para mi ritmo de trabajo la tendencia de estas dos últimas semanas indica el uso de Gemini en preguntas cortas y Qwen/Kimi, chinos, para modo más extenso. Falta definir el proceso al 100%, pero no puedo trabajar en el sitio como lo venía haciendo, no me refiero a ritmo sino a que no están disponibles. Es como un sitio de entrevistas en la calle en época de pandemia.

En estas dos semanas El ecosistema de la IA / LLM ha pasado de ser una “plaza pública vibrante” a un entorno restrictivo y vigilado donde obtener una respuesta natural es casi imposible.

RESUMEN:

De momento estoy en una “tregua” de uso y solo usando párrafos cortos. Mi estilo es mediano, trabajar duro y tupido cuatro a cinco horas diarias y siempre he sido un programador diez X, que hago solo y de buena calidad en días lo que otros hacen en meses, pero de momento siento que la IA me esta limitando y aunque hay modos a través de APIS con costo, o con claude code o similares, la realidad monetaria del mexicano promedio, no mía, no se ve buena idea.

Hice varios ajustes a Elgoi a mano. No necesitaba la IA para eso. Como dato curioso desde el 13 de abril en modo web github me daba problemas al guardar o mensajes de error. Prefiero cuando puedo hacer los cambios directo en web para que no quede mi dirección de correo en el commit. Técnicamente en un reporte pondría “leakeo de metadatos en los logs de Git”

Es probable que tengan que revertir el rumbo las ia /llm principales, y espero hoy mismo o mañana hacer un cálculo de servilleta de las razones económicas. Y veo mas probable apoyarme en modelos locales de qwen y gptoss, y en le chat/mistral y cohere en web.

Related Posts

Dos Aliados Viables y un campo minado

Los riesgos de las LLM