Es posible que hayas visto en un momento dado que alguien va al salón de belleza y lo dejan peor, o como alguien hace algo para mejorar que le causa problemas que antes no tenía.
Eso pasa mucho en los LLM. No te digo que le pidas a la fuerza o a Dios que tú respetes que te dé paciencia, pero sí tienes que aceptar que hay cosas de las que debemos dar gracias, y más no podemos hacer.
Poder usar los LLM que no existían en 2024 como tales, es una maravilla y una bendición, pero si los cambian, como es gratis no podemos hacer nada, y aunque cambien el producto tampoco. Un ejemplo: en el año 2001 hice varios sistemas para la Central de Abasto, donde se reciben mercancías para venta en el país. Algunos se manufacturan, otros se cultivan y otros se comercializan. Pero, igual que con el salón de belleza, lo que se comercializa puede ser innecesario, puede tener esperanza o cambiar las reglas de negocio.
Mi país, México, ha sido acosado y castigado por el crimen organizado desde 2005 de manera visible. En 1986-1990/91 viví en Guadalajara, y aunque era una ciudad de descanso para el crimen organizado, los problemas no eran como los de ahora. Todo se desató en 2005 en septiembre. Esto es importante porque algunos estados como Veracruz y Michoacán fueron afectados por la situación nacional, y uno de mis clientes que llevaba años comercializando naranjas de Veracruz (me refiero a unos 40 años o más) de repente tuvo que empezar a vender sandías que tienen una lógica diferente, y supongo que eran más seguras. Ahora, en 2026, no sé cuándo cambió, pero el cliente ahora vende sandías y no naranjas. Así mismo te pueden cambiar tu producto o LLM.
Yo uso computadoras por mi trabajo desde 1991. Allá por 1993 se empezó a notar un cambio muy grande al que se le llamó eternal September o septiembre eterno. Fue el momento donde mucha gente se enteró de que existía internet. Había en aquella época personas que reprobaban a propósito materias de licenciatura en la UNAM para poder seguir teniendo internet gratuito.
Mi mundo en línea estaba conformado por BBS, y las cosas cambiaron. Algunas cosas se echaron a perder, otras mejoraron un poco. Te estoy hablando del tiempo antes de Google. Fui usuario de Hotmail antes de que fuera de Microsoft. Ahora es irreconocible y dejé de usarlo cuando se volvió basura. Lo mismo debes hacer con los LLM, aunque a veces regreses a ellos.
Uso el ejemplo de que Copilot(llm) es como Dory de Buscando a Nemo, tiene amnesia. No puedes hacer un cisne estirándole el cuello a un pato. Inclusive, tener un LLM en tu computadora personal puede ser útil, pero no es lo mismo que lo que tenemos en línea. Es una fotografía, donde tratas de rescatar algo. Tienes que conservarlo con cuidado. Así como tenemos añoranza por ciertas cosas antes de internet, lo mismo va a pasar cuando desaparezcan los LLM. Incluso varias de las medianas van a desaparecer o fusionarse.
Para fines de comparación, al día de hoy los LLM en línea más importantes están de esta manera:
| Orden alfab | Nombre del modelo | Nota |
|---|---|---|
| Orden alfab | Primarios | Nota |
| 1 | Chatgpt | No lo uso, desvaria en terminos legales, es mas bien educativo, muy bueno en matemticas, se sale de rol |
| 2 | Claude | Bueno pero se cansa, excelente para fusionar cosas o análisis profundos, excelente herramienta, numero 2 para mi |
| 3 | Copilot | Sorprendentemente bueno hoy para imágenes y cosas medicas, pero malisimo por contexto pequeño, lo uso para corregir ortografa |
| 4 | Gemini | Bueno por contexto largo, rapido, a veces desvaria y si itera se echa a perder, es mejor a veces crear una nueva conversacion y copia el archivo, por contexto largo probablemente sea tu LLM principal en programación |
| 5 | Grok | No estaba en mi radar hace cuatro meses pero ha subido muchisimo su calidad de codigo |
| 6 | Kimi | Probablemente uno de los tres grandes por contexto y profundidad. |
| Secundarios | ||
| 1 | Cohere | Cosas buenisimas de diseño, pero no es para para proyectos grandes |
| 2 | Deepseek R1 | Parece ser muy bueno en cosas de rol, no puede hacer ciertas cosas proundas, 7 en programacion bueno para cosas cortas |
| 3 | Meta AI – Llama 3 | |
| 4 | Minimax | Excelente en graficos css, no le he probado demasiado en programacion |
| 5 | Mistral | Calidad variable pero se puede probar en cosas chicas |
| 6 | opengpt osss 20b offline | Como dice su nombre, es offline y es muy bueno, uno de los dos mejores |
| 7 | Perplexity | Principalmente conversacional |
| 8 | Qwen | Excelente en muchas cosas en todos sus modelos, pero deficiente en codigo largo en modo online. Punto fuerte es que hay modo offline |
| 9 | qwen30b coder | El lider en rol y Programacion offline para maquinas de 32 gb RAM o menos |
| Desconocidas que deben probarse mas | ||
| 1 | Cerebras AI GPT-4 | |
| 2 | Duck.ai | |
| 3 | Ernie 8.9 | |
| 4 | Step 3.5 Flas h Chino | |
| Malas o no maduras | ||
| 1 | dolphin | |
| 2 | reka | |
| 3 | solar open 100b | |
| 4 | XIAOMI gpot 3.5 no lo uses | Condiciones cambiantes y piden acceso a todos tus contactos y otras cosas de gmail. |
| 5 | yasa | |
| 6 | z.ai (claude sonnet 3.5 ) |
Los nombres y versiones de los LLM cambian constantemente. Esta clasificación no pretende ser técnica ni definitiva, sino un mapa testimonial de cómo se perciben hoy en día. Lo importante es entender que, igual que con otros servicios en línea, algunos modelos desaparecen, otros se fusionan y otros se transforman. Por eso, más que memorizar nombres, conviene aprender a adaptarse.
En el momento actual, siendo un programador de alta velocidad incluso antes de las LLM, puedo decir que las únicas que me siguen el paso y no me detienen son Gemini y Kimi. Es probable que para varios proyectos las use como principales, pero debo definir sobre la marcha. Por mientras trataré de usar a Kimi y Grok para el proyecto de eve online (elgoi), para evaluar su stamina y seriedad. Deepseek y qwen cometieron errores medianos y me hacen ir maslento incluso con código medianamente sencillo.
Desde Abril 2025 LLaMA ha estado un poco “lobotomizada”, Y hoy abril 2026 DeepSeek R1 y Qwen no me siguen el paso aunque falta probarla en rol para Viernes Social. ChatGPT no lo uso por inconstante, Copilot por amnésico y falta probar más a fondo Grok (que empecé a hacer con un sistema de tickets, pero por lo menos es bueno en fase de diseño y despliegue, aunque no sé cómo sea en cosas iterativas o de stamina).
Para trabajo offline, como las fotos, de momento son dos qwen30b coder y openss 20 b , para rol considerar Gemma 3-4 b.
En resumen: tengo que hacer mayores pruebas en Grok y Kimi, pero de momento, es lo que hay.
Esa frase de “es lo que hay” la he oído en contextos imposibles, como un hospital que quería en 2025 un sistema complejo pero sin servidor y con laptops de 2017. En ese caso sí podíamos ir a comprar algo, pero que no tuvieran recursos no significaba que no existiera algo mejor. En mi caso tengo dos PC de 32 GB y varias de 16 GB, pero en cuanto a LLM para las computadoras en México, literalmente estas opciones es lo que hay.