Vamos a suponer que hay sitios donde vas que les gustan las hamburguesas de arracheras. Si te dijeran que las hamburguesas de arrachera de un puesto son buenas, probablemente irías.
A veces vamos al cine por recomendaciones de conocidos, no por publicidad. Lo mismo pasa con streamings.
Hoy encontré en news.ycombinator dos modelos nuevos que voy a probar, por el mismo principio.
qwen3.5-9b@q4_k_s (HuggingFace link) is the best model I’ve gotten working with a reasonable ~40 tokens per second, thinking enabled, successful tool use, and a 128K context window, running on LM Studio. Compared to a SOTA model, it gets distracted more easily, sometimes it gets stuck in loops, it’ll misinterpret asks etc. But it’s surprisingly good for something that can run on a 24GB Macbook Pro while leaving space for lots of other things running too!
These are the recommended settings for thinking mode and coding work:
Thinking mode for precise coding tasks (e.g., WebDev):
temperature=0.6, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0
Try qwen3.6.35 a3b not qwen3.5 9b. It’s completely different.
Además quiero ver si puedo comprar la i5 dell reconstruida de 16 gb para la prueba de dulces 16, pero eso lo se despues. Por mientras está bajando la información.
EL modelo 9b se tarda casi 7 minutos su respuesta de la pregunta de los perros. Hice una nueva pregunta para verificar y lo revisé contra una neuva orden
“Hazme un script php para mostrar que plugs estan instalados o activos de wordpress. usa los datos de wp-config”
de la version 9b El resultado fueron unos 20 minutos de pensar y un codigo que funciona desde el punto de vista de php qpero que hace varias “asunciones” o asume cosas que no son, por ejemplo, que el prefijo es wp_. Uno de las cosas adicionales que considera que wordpress hace un json cuando l oque hay es ubjeto serialize.
-
Código de Qwen:
$active_plugins = json_decode($active_plugins_json, true); -
y el resultado suiempre va a ser null.
Qwen 3.5 plus, lo mismo, pero en chat me da algo completamente diferente que no comete esos errores. Grok me dijo algo mucho mas compacto y funcional al igual que gemini online.
Lo que me preocupa es que este es un ejemplo simple, que me vino a la mente proque en ciertos casos tengo cargado gutenberg y en vibecodingmexico.com el plugin propio, pero fuera de eso solo el editor clasico. Considero por lo general los plugins un riesgo de seguridad.
Y eso que consideré los detalles de temperatura y emas que por lo general sobran.
Y porque me preocupa ?
Bueno qwen online comenta los riesgos de plugins y nadie mas. Asi que , si se tarda siete minutos para darme una lista de perros, y me da un codigo con por lo menos dos fallas graves, no es tan bueno como parece segun esos comentarios de news combinator. No estoy de acuerdo con el uso de agentics por varias razones pero dejaré de momento el modelo 9b vivo proque dicen que funciona bien con agentics. Esta no es una prueba standard y no tiene caso poner comparativas porque el ucaso de uso es simple, meir cuantos plugisn tienes pero no son m,uchos los que tienen mas de 10 wordpress propios, y segundo, mientras menos plugins mejor.
ese quen 3.6 de 35b 2 minutos y medio…. pero ocupó 6% de tokens
10 minutos para la solución de los plugins. Nuevamente es mucho tiempo pero no comete los errores de qwen de 9b.
De momento dejo las dos en mi disco duro, por una futura prueba de agentics pero me parece mas seguro usar el clasico 3.5 coder 30b