No gastes 20 mil USD con 16 agentes

El viernes salió un artículo en Hacker News (Y Combinator) comentando sobre un compilador de C desarrollado por uno de los ingenieros de Anthropic (los creadores de Claude). Aunque el proyecto tenía sus defectos, el titular llamativo fue que lograron construirlo usando “solamente” 20,000 USD en tokens, operados por 16 agentes de IA trabajando en conjunto.

Fuente : https://arstechnica.com/ai/2026/02/sixteen-claude-ai-agents-working-together-created-a-new-c-compiler/

Bajémoslo a la realidad: 20,000 USD es, aproximadamente, el sueldo anual de un programador middle-senior en muchas empresas de México. Equivale a cuatro años de sueldo de una cajera o a 18 meses de salario de un programador junior.

Constantemente conocidos me buscan para realizar entrevistas técnicas a candidatos. Siempre acepto porque me gusta estar al tanto del mercado laboral, no para cambiar de aire, sino para entender qué está pasando fuera. De 2025 hsta hoy  he visto unas 800 ofertas de empleo que he revisado con sueldos arriba de los $25,000 MXN mensuales, solo UNA ofrecía como prestación una suscripción a IA (ClaudeMAX, para ser exactos) como prestación. https://claude.com/pricing/max

Es un porcentaje mínimo. El acceso a estas herramientas en el entorno profesional real de LATAM es casi inexistente.

Entiendo el deseo de aprender, pero no necesitas gastar 20,000 USD para hacerlo. Un compilador de C es un objetivo técnico importante, pero para el ecosistema de LATAM es, sinceramente, obsoleto. Nuestra región vive de proyectos cortos, del hype del momento y de sistemas de gestión. Desde 1995, es rarísima la empresa de software en México que se dedique a proyectos de infraestructura base que sean realmente útiles.

Nadie en México te va a pagar por hacer un compilador de 20,000 USD. Hay un motivo publicitario detrás de esa noticia que se detecta por puro instinto.

¿Pero en México?

Yo trabajé con C y C++. Me tocó vivir la transición de memoria y adaptaciones desde Zortech C hacia Borland y Microsoft. Al final, en México se dejó de lado C por el tema de los punteros; ese tipo de aritmética e inicialización de variables que se parece a usar fórmulas con $A1 en Excel, pero de forma recursiva.

He construido sistemas que generan hojas de cálculo con fórmulas y variables dinámicas… y es un dolor de cabeza, literalmente.

Se pueden hacer cosas muy útiles con los LLM (principalmente en interfaces de chat) porque tienen una salvaguarda natural: tienen límites y contexto. Eso te obliga a una de dos: o te centras, o te centras.

En México hay problemas obvios que pueden resolverse con LLM y versiones gratuitas, tanto en el gobierno como en la iniciativa privada. Lo que es seguro es que nadie te va a permitir gastar 20,000 USD en algo inútil. En nuestra realidad, a veces tienes que pelear como no tienes idea para que te autoricen una computadora de 1,000 USD; ese dinero prefieren usarlo para el iPhone de la hija del dueño.

Existen reglas y dominios de conocimiento específicos. Por ejemplo, soy muy bueno detectando falacias de razonamiento (lógica formal), y eso lo veo a diario en conversaciones de trabajo, declaraciones o artículos que leo.

Entonces, ¿por qué uno de los creadores de Claude hizo este compilador?

Simple: porque quieren que gastes esos 20,000 USD. Claude se usa en muchos lugares, incluido Microsoft. Mi hipótesis es que esto no se había hecho antes no por falta de capacidad, sino porque a nadie se le había ocurrido:

  1. Gastar 20,000 USD en tokens para eso.

  2. Tener un interés real en el lenguaje C como objetivo abstracto.

¿Por qué no lo hizo un think tank o alguien de peso como Bill Gates o “The Woz” de Apple? Porque el objetivo no es la tecnología, es el consumo.

A lo mejor te preguntas: ¿Qué son los “agentes”?

Vamos a explicarlo en términos de World of Warcraft (WoW). Este es un juego de rol en línea donde puedes tener varios personajes conectados a la vez, incluso en cuentas gratuitas. Los encuentros más difíciles, como las Raids, requieren grupos de 5, 10, 25 o hasta 40 personajes. Cada uno tiene que cumplir una función y tomar precauciones específicas para no morir frente al dragón o al fantasma malvado de turno.

En una Raid, si el Healer se distrae o al Tanque le da lag, todos mueren. En el mundo de la IA, ese error no solo te hace perder la partida, sino que consume tokens reales que salen de tu bolsillo.

Sigamos con esta analogía:

En Warcraft, puedes usar personajes de forma gratuita hasta el nivel 20, incluso varios a la vez en Raids pequeñas. Pero si quieres llevar a tus personajes más allá de ese nivel, tienes que pagar, aunque solo pretendas usar a uno.

En Diablo II (antes del remake), solo podías hacer cosas con un personaje a la vez. O tenías otra computadora, o hacías circo, maroma y teatro para intentar crear un juego estable y poder pasarte el botín de un personaje a otro.

En las expansiones de Warcraft, como Warlords of Draenor o Battle for Azeroth, introdujeron el concepto de los ayudantes. Son personajes a los que mandas a realizar misiones automáticas. Son misiones SIMPLES y tú no ves lo que hacen; solo esperas a que regresen con el resultado.

¿Notas el parecido?

Los “Agentes” de IA de 20,000 USD son exactamente como esos ayudantes de la ciudadela. Les das una instrucción, ellos “se van” a trabajar en su propia caja negra y tú solo esperas que vuelvan con algo útil. El problema es que, en la vida real, te están cobrando por cada paso que dan; y si el algoritmo decide que la misión falló, ya quemaste el presupuesto en tokens para obtener un compilador de C que no necesitabas. Es el equivalente tecnológico a comprar el iPhone de cada año.

Mandar a tus ayudantes a la batalla en Warcraft es el equivalente a usar Agentes. Pero hay una realidad física y de gestión: no puede haber un coche con tres volantes a la vez, digan lo que digan los desarrolladores de Spring.

Aquí entra la unidad de mando, una regla que habla de jerarquías bien establecidas. No vas a mandar a una jauría de perros a que ataquen a alguien; eso no es jugar limpio, a menos que esa persona lleve un cuchillo y vaya contra ti. Un perro puede tomar decisiones, salvarte la vida o guiar a un ciego; los perros son maravillosos, pero son perros. Y aun así, como en Blade Runner, toda vida es valiosa y tiene un propósito.

Los chats de LLM actuales funcionan igual: son como mandar a tu perro por algo que tú no puedes alcanzar, o como hablar con tu amigo doctor para que te dé un diagnóstico rápido. Son relaciones de uno a uno que necesitan ser supervisadas y, sobre todo, aprendidas.

Para entender por qué la IA requiere criterio humano, te pongo tres ejemplos de mi época en Warcraft:

  • 1. El Caballero de la Muerte (DK) no ortodoxo: Cuando salió la clase Death Knight, jugaba habitualmente con mi esposa y un conocido. Yo era uno de los DPS, pero sacrifiqué estadísticas para tener “Explosión de cadáveres” y “Gusanos de sangre” a la vez (algo que parecía imposible en ese entonces). Intentaron sacarme de las Raids porque mi estrategia no era la convencional. Hasta dijeron que era trampa y que era imposible. El punto era que, más que un DPS, yo funcionaba como un tanque secundario: mi objetivo no era robarle el aggro al tanque principal, sino simplemente matar y seguir vivo contra todo pronóstico. La IA, como mi DK, necesita una configuración que sirva al objetivo real, no a lo que dice el manual.
  • 2. El “One Button Wonder” en Gnomeregan: En otra ocasión, jugaba como maga arcana en el calabozo de Gnomeregan. El tanque se quedó paralizado y, en medio del caos, empecé a presionar botones hasta que encontré un one button wonder. Descubrí una rotación que me permitió cargar con el peso de la batalla. Al final, el objetivo de todo el grupo cambió: todos debían mantenerme vivo a mí para ganar. A veces, domar la IA es encontrar ese flujo simple que resuelve el desastre cuando el sistema principal falla.
  • 3. El Healer preventivo: Aunque mi preferencia era ser un “Tanque Oso”, una vez nos quedamos sin healer (jugador especializado en curar). Como mi esposa es una excelente tanque, cambié a Healer y empecé a curar de manera preventiva. ¿Curaciones preventivas? Sí. Exactamente igual que el mantenimiento preventivo de una computadora o un coche: actuar antes de que el daño sea crítico.

Actualmente, el modelo de agentes de negocio se mueve en plataformas que en México no podemos probar fácilmente o que son sumamente restrictivas por hardware necesario, precio del servicio y alcance real. Las más importantes son Claude Code, Codex y, hasta cierto punto, Perplexity. Pero hay dos recién llegados: Clawdbot, que ya cambió de nombre tres veces en lo que va de 2026 (y apenas estamos en febrero), y el que probablemente gane por goleada: Google Anti-gravity.

La promesa es que tú generas “ayudantes”. Gracias a nuestras PC multitarea y multiprocesador, podrías usar varios agentes a la vez; como mandar a dos perros tras una sola presa, o enviar a alguien de la oficina por un café y a otro por un pastel. La idea idílica es que, mientras tú descansas, “alguien” trabaja.

Pero, ¿te acuerdas del programador junior al que mandas por una Pepsi y te trae un café?

Los agentes son igualitos.

Sin supervisión, sin esa “relación uno a uno” y sin entender la lógica formal de lo que estás pidiendo, lo único que vas a obtener es una cuenta de 20,000 USD en tokens y una bebida que no pediste. En México, no estamos para desperdiciar ni el dinero ni el café.

Ahora, déjame explicarte el verdadero problema de los agentes: el dinero.

“Bueno, ¿y si tengo dinero?”, dirás. Entonces el problema es la memoria RAM

  • Además la temperatura la dejamos para después pero usar una LLM-IA local quema las laptops y All in one. Piensa mejor en pc de escritorio.

En mi casa tengo, literalmente, 14 computadoras, de las cuales cuatro están en uso constante. Dos tienen 32 GB de RAM y mi “caballito de batalla” es una máquina armada en 2017, también con 32 GB. De las demás, ocho tienen 16 GB y cuatro tienen apenas 4 GB o menos.

No he visto con Clientes de 2017 al dia de hoy una sola computadora con 32 gb de ram. UNA con 16 gb.

La realidad es que tu computadora no va a aguantar el trabajo con agentes. Si tu hija está viendo Instagram o Pinterest, o si alguien en la casa está usando el PlayStation y se come el ancho de banda, olvídate de que los agentes funcionen.

¿Y el precio?

Aquí está el truco: Claude Code tiene restricciones nuevas que lo obligan a operar exclusivamente con su propio motor. Los otros son carísimos. Google Anti-gravity es apenas un bebé, pero probablemente se mantenga gratuito o, si no, su modelo de costo será radicalmente distinto. Por eso mismo, a nivel mundial, para finales de año habrá más usuarios de Anti-gravity que de Claude Code.

Houston, tenemos un problema con los agentes.

Aunque uso juegos multijugador, a mí me conviene, por ejemplo, pagar varias cuentas de Eve Online con dinero del mismo juego. Puedo hacer dungeons de cinco jugadores si quiero con personajes gratuitos de Warcraft nivel 20, sin gastar dinero y sin romper las reglas. De eso se trata: de ser disruptivo y pensar en pequeño. Se trata de hacer lo que te pidieron y hacerlo bien.

Si no tienes dinero, tienes herramientas gratuitas.

Piensa en las encuestas típicas de la oficina: “¿Qué película quieren ver?” o “¿Cuál es su serie preferida?”. Usar las versiones web de los LLM (a veces llamados chatbots) es un poco así. Puede que hoy estés de acuerdo con Claude y mañana con Gemini; son tus conocidos, no tus amigos.

Aquí entra la ética: los que tienen moral se portarán bien incluso después de que les pagues; los inmorales empezarán a chantajearte. Trabajar con agentes es como hacerle una sola pregunta a cinco personas a la vez y luego tener que revisar qué te dijo cada una. No vas a poner en riesgo tu salud, tu vida… o tu dinero por la opinión de los demás. La más sensata la investigas por tu cuenta.

Al final del día, los agentes son como ese perro que a veces te trae basura y, aun así, se sienta a esperar su premio.

Pero ojo, hay un detalle que nadie te dice: los agentes de Claude son todos el mismo. Los de Google, igual. ¿Por qué te lo digo? Porque es muy diferente preguntarle lo mismo a cinco personas distintas, que preguntarle lo mismo a la misma persona cinco veces.

  • Si el modelo base tiene un sesgo o un error lógico, multiplicarlo por 16 agentes solo hace que el error sea 16 veces más caro, no que desaparezca.

A veces mis hijos me mienten. Cuando lo hacen, les digo: “Te creo… pero, ¿a cuál de tus tres versiones le creo? Te voy a castigar por las otras dos”.

Con los LLM estamos interactuando con algo inteligente; o, por lo menos, más inteligente que mi vecino. Pero tienen sus limitaciones. No sabemos cuánto tiempo estarán en el vecindario, ni cuándo cambiarán las reglas del juego, pero hoy ellos pueden enseñarte a volverte ese Death Knight mixto que todos los demás consideran imposible.

  • Los consejos de las LLM son para que te dé las herramientas para crear una estrategia única (no ortodoxa) que tú, como humano, vas a ejecutar.
  • Y adaptar a las leyes, el dinero disponible y las necesidades de seguridad y ética.
  • Una pregunta hecha a cinco agentes diferentes.

¿Cómo aplica esto a la IA y al Vibe Coding?

Haz una sola cosa a la vez. Así de simple. Es parecido a ir poniendo sal al guiso original hasta que obtienes el sabor que buscas.

Related Posts