Claude Code gratis con Gemma 4: guía para usar el agente de Anthropic con modelos abiertos en local
Claude Code gratis con Gemma 4: guía para usar el agente de Anthropic con modelos abiertos
Claude Code gratis con Gemma 4 es una de las configuraciones más interesantes para programadores que quieren probar un flujo de desarrollo asistido por IA sin depender siempre de tokens de pago. La idea es simple: usar Claude Code como interfaz de agente y ejecutar Gemma 4 en local mediante Ollama.
Claude Code gratis con Gemma 4: qué significa realmente
La frase “Claude Code gratis con Gemma 4” puede confundirse fácilmente. No significa acceder gratis a los modelos Claude de Anthropic, ni saltarse planes pagos, ni desbloquear funciones comerciales sin permiso. Significa usar la herramienta Claude Code como cliente de desarrollo y redirigir el backend hacia un modelo abierto ejecutado localmente con Ollama.
La novedad es importante porque Ollama ya documenta compatibilidad con Claude Code mediante una API compatible con Anthropic. En la práctica, eso permite que Claude Code hable con un servidor local de Ollama en lugar de llamar directamente a la API de Anthropic. Si ejecutas Gemma 4 en tu equipo, puedes tener un flujo tipo agente para leer, explicar y modificar código sin pagar por cada token del modelo local.
3 claves rápidas
1. No estás usando Claude gratis: estás usando Claude Code como interfaz y Gemma 4 como modelo.
2. El costo baja porque la inferencia se ejecuta en tu máquina, aunque pagas con hardware, energía y rendimiento.
3. La calidad dependerá del tamaño de Gemma 4, la memoria disponible y el contexto configurado en Ollama.
Por qué esta guía se volvió tendencia entre desarrolladores
Claude Code se popularizó porque no es solo un chat: puede leer tu repositorio, proponer cambios, editar archivos y ejecutar comandos bajo tu supervisión. Esa experiencia suele estar asociada a modelos comerciales potentes, pero el ecosistema open model está cerrando distancia rápidamente.
Gemma 4 entra justo en ese punto. Google la presenta como una familia de modelos abiertos con capacidades de razonamiento, multimodalidad y ventanas de contexto largas. En Ollama aparecen variantes como `gemma4:e2b`, `gemma4:e4b`, `gemma4:12b`, `gemma4:26b` y `gemma4:31b`, con distintos tamaños y demandas de memoria. Para código, lo ideal es empezar por una variante que tu equipo pueda mover con estabilidad.
Requisitos antes de empezar
Necesitas tres piezas: Claude Code instalado, Ollama funcionando y una variante de Gemma 4 descargada. También conviene tener Git, una terminal cómoda y un proyecto de prueba que no sea crítico. Nunca empieces probando agentes de código en un repositorio de producción sin control de versiones.
| Elemento | Para qué sirve | Recomendación |
|---|---|---|
| Claude Code | Interfaz agente para leer, editar y ejecutar tareas sobre tu código. | Instalar desde el método oficial de Anthropic. |
| Ollama | Servidor local que ejecuta modelos abiertos y expone una API compatible. | Mantenerlo actualizado. |
| Gemma 4 | Modelo abierto que hará el razonamiento y generación de código. | Empezar con `gemma4:e4b` o `gemma4:12b` si tu equipo lo soporta. |
| Git | Permite revisar y revertir cambios del agente. | Usar una rama de prueba. |
Paso a paso: instalar y conectar Claude Code con Gemma 4
Primero instala Claude Code. Anthropic recomienda el instalador oficial para macOS y Linux, y también ofrece métodos para Windows. Luego instala Ollama, descarga Gemma 4 y lanza Claude Code apuntando al servidor local.
Si prefieres configuración manual, puedes apuntar Claude Code a Ollama con variables de entorno. Esta ruta es útil si quieres depurar mejor qué endpoint estás usando o si tu instalación no reconoce el lanzador directo.
Qué modelo Gemma 4 elegir para programar
La elección del modelo importa. Un modelo pequeño responde más rápido y consume menos memoria, pero puede equivocarse más en refactors largos. Un modelo grande entiende mejor arquitectura, dependencias y contexto, pero puede ser lento o inviable en equipos modestos.
| Modelo | Uso recomendado | Ventaja | Limitación |
|---|---|---|---|
| `gemma4:e2b` | Pruebas rápidas, snippets, documentación. | Más ligero. | Menos fiable para tareas complejas. |
| `gemma4:e4b` | Uso general en laptops compatibles. | Buen equilibrio inicial. | Puede quedarse corto en repos grandes. |
| `gemma4:12b` | Refactors medianos, análisis más serio. | Mejor razonamiento. | Demanda más memoria. |
| `gemma4:26b` / `31b` | Equipos potentes o estaciones de trabajo. | Más capacidad para contexto y tareas difíciles. | Coste local alto en RAM/VRAM. |
Cómo usarlo sin romper tu proyecto
La mejor práctica es tratar este flujo como un copiloto con permisos limitados. Abre una rama nueva, pide primero análisis, luego cambios pequeños y revisa cada diff. Claude Code puede ejecutar comandos, así que conviene mantener supervisión humana y evitar permisos automáticos en repositorios importantes.
⚠️ Importante
No uses opciones que salten permisos en proyectos reales. Un agente de código puede borrar archivos, instalar paquetes, modificar configuración o ejecutar comandos destructivos si le das libertad total.
Ventajas y límites de usar Claude Code gratis con Gemma 4
Privacidad local
El modelo puede correr en tu equipo, reduciendo dependencia de servicios externos para pruebas y repos sensibles.
Menor costo
No pagas tokens del modelo local, aunque sí necesitas hardware suficiente y tiempo de cómputo.
Calidad variable
No esperes siempre el mismo rendimiento que con Claude Sonnet u Opus en tareas complejas de ingeniería.
Problemas comunes y solución rápida
El modelo responde lento
Prueba `gemma4:e2b` o `gemma4:e4b`, cierra procesos pesados y evita prompts gigantes al inicio.
Claude Code no conecta
Verifica que Ollama esté activo en `http://localhost:11434` y revisa las variables `ANTHROPIC_BASE_URL` y `ANTHROPIC_AUTH_TOKEN`.
El agente pierde contexto
Ollama advierte que Claude Code requiere una ventana de contexto grande; usa modelos con contexto suficiente y divide tareas largas.
Los cambios no convencen
Pide primero un plan, luego un diff pequeño. No aceptes refactors masivos sin revisión.
Conclusión: una alternativa gratuita, útil y con límites claros
Claude Code gratis con Gemma 4 es una configuración muy atractiva para experimentar con agentes de programación sin depender siempre de APIs pagas. La clave es entender el alcance: Claude Code aporta la experiencia de agente, Ollama actúa como puente compatible y Gemma 4 realiza el trabajo de razonamiento local.
No es un reemplazo perfecto de los modelos Claude más avanzados, pero sí una opción poderosa para aprender, documentar repositorios, hacer cambios controlados y probar flujos de programación asistida por IA con más privacidad y menor costo variable.
Fuentes consultadas
Ollama Docs: Claude Code con modelos abiertos
Google AI for Developers: ejecutar Gemma con Ollama
🚀 ¿Quieres estar siempre actualizado en IA?
Únete a nuestra comunidad exclusiva donde compartimos diariamente las últimas noticias, herramientas y tutoriales en IA.
📲 Unirme a la Comunidad



Publicar comentario