{"id":32732,"date":"2026-06-26T06:46:00","date_gmt":"2026-06-26T09:46:00","guid":{"rendered":"https:\/\/www.neolo.com\/blog\/?p=32732"},"modified":"2026-05-21T18:47:32","modified_gmt":"2026-05-21T21:47:32","slug":"como-instalar-un-llm-local","status":"publish","type":"post","link":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php","title":{"rendered":"C\u00f3mo Instalar un LLM local"},"content":{"rendered":"<span class=\"span-reading-time rt-reading-time\" style=\"display: block;\"><span class=\"rt-label rt-prefix\">Tiempo de lectura:<\/span> <span class=\"rt-time\"> 10<\/span> <span class=\"rt-label rt-postfix\">minutos<\/span><\/span>\n<p>Un <strong>LLM local es un modelo de lenguaje<\/strong> que se ejecuta en tu propio servidor, sin depender de servicios en la nube. Esta gu\u00eda explica qu\u00e9 son los principales modelos disponibles (Ollama, DeepSeek, Gemma, Llama), c\u00f3mo instalarlos paso a paso y por qu\u00e9 un <a href=\"https:\/\/www.neolo.com\/esp\/vps-hosting\/\">VPS<\/a> es la opci\u00f3n m\u00e1s pr\u00e1ctica para hacerlo. <\/p>\n\n\n\n<p>Si quieres privacidad real, control total y costos predecibles<strong>, ejecutar un LLM en tu propio servidor <\/strong>es hoy una alternativa concreta y accesible.<\/p>\n\n\n\n\n\n<h2 class=\"wp-block-heading\" id=\"que-es-un-llm-local\">\u00bfQu\u00e9 es un LLM local y por qu\u00e9 instalarlo?<\/h2>\n\n\n\n<p>Un <strong>LLM<\/strong> (Large Language Model, o modelo de lenguaje grande) es el tipo de modelo de inteligencia artificial que est\u00e1 detr\u00e1s de herramientas como ChatGPT, Gemini o Claude. Estos modelos procesan texto, responden preguntas, generan c\u00f3digo, resumen documentos y mucho m\u00e1s.<\/p>\n\n\n\n<p>La diferencia entre usar un LLM en la nube y uno local es fundamental: cuando usas <a href=\"https:\/\/www.neolo.com\/blog\/gemini-claude-o-chatgpt.php\">ChatGPT<\/a>, tus consultas viajan a los servidores de OpenAI y son procesadas all\u00ed. Cuando instalas un LLM en tu propio servidor, todo ocurre dentro de tu infraestructura, sin que ning\u00fan dato salga al exterior.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-1 wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/www.neolo.com\/esp\/vps-hosting\/\">VPS AL MEJOR PRECIO<\/a><\/div>\n<\/div>\n\n\n\n<p><\/p>\n\n\n\n<p>Esto tiene implicaciones directas para:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Privacidad<\/strong>: los datos de tus clientes, documentos internos o conversaciones confidenciales no abandonan tu servidor.<\/li>\n\n\n\n<li><strong>Seguridad<\/strong>: eliminas la dependencia de terceros y los riesgos asociados a filtraciones de proveedores externos.<\/li>\n\n\n\n<li><strong>Autonom\u00eda<\/strong>: no dependes de cuotas, l\u00edmites de API, cambios de precios ni decisiones de una empresa ajena.<\/li>\n\n\n\n<li><strong>Costos predecibles<\/strong>: pagas por el servidor, no por cada consulta.<\/li>\n<\/ul>\n\n\n\n<p>Para desarrolladores, pymes con datos sensibles, abogados, m\u00e9dicos, educadores o cualquier profesional que trabaje con informaci\u00f3n confidencial, tener un LLM propio no es un lujo t\u00e9cnico: es una decisi\u00f3n estrat\u00e9gica.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Si te interesa profundizar en c\u00f3mo este tipo de herramientas puede impactar en tu negocio, el art\u00edculo sobre <a href=\"https:\/\/www.neolo.com\/blog\/implementar-ia-empresa.php\">c\u00f3mo implementar la IA en una empresa<\/a> ofrece un buen punto de partida.<\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"principales-llm\">Principales LLM de c\u00f3digo abierto: qu\u00e9 es cada uno y qui\u00e9n lo cre\u00f3<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">Ollama<\/h3>\n\n\n\n<p><strong>Ollama<\/strong> no es un modelo en s\u00ed mismo: es una herramienta de gesti\u00f3n que permite descargar, ejecutar y administrar distintos modelos de lenguaje en un servidor Linux, macOS o Windows de forma simple. Es el equivalente a un gestor de paquetes, pero para LLMs. Desarrollada por la empresa Ollama Inc., se ha convertido en el est\u00e1ndar de facto para correr modelos locales gracias a su interfaz de l\u00ednea de comandos intuitiva y su compatibilidad con docenas de modelos.<\/p>\n\n\n\n<p>Lo que hace Ollama en la pr\u00e1ctica: descarga el modelo, lo cuantiza (reduce su tama\u00f1o para que consuma menos RAM), lo mantiene en ejecuci\u00f3n y expone una API REST en el puerto 11434 para que otras aplicaciones puedan consultarlo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Meta Llama (Llama 3, Llama 3.1, Llama 3.2)<\/h3>\n\n\n\n<p><strong>Llama<\/strong> es la familia de modelos de c\u00f3digo abierto desarrollada por <strong>Meta<\/strong> (la empresa detr\u00e1s de Facebook e Instagram). Con el lanzamiento de Llama 2 en 2023 y Llama 3 en 2024, Meta posicion\u00f3 esta familia como una de las m\u00e1s capaces del ecosistema open source. Llama 3.1 en su variante de 8B par\u00e1metros es uno de los modelos m\u00e1s equilibrados para correr en un VPS con 16-32 GB de RAM: ofrece respuestas coherentes, soporte de razonamiento y capacidad para m\u00faltiples idiomas incluyendo espa\u00f1ol.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">DeepSeek<\/h3>\n\n\n\n<p><strong>DeepSeek<\/strong> es un modelo desarrollado por la empresa china <strong>DeepSeek AI<\/strong>, que sorprendi\u00f3 al mundo a principios de 2025 con un rendimiento comparable a modelos propietarios de primera l\u00ednea, pero con un costo de entrenamiento y ejecuci\u00f3n significativamente menor. DeepSeek R1 es especialmente destacable por su capacidad de razonamiento paso a paso, y en su versi\u00f3n destilada (7B o 14B par\u00e1metros) se puede ejecutar en hardware modesto sin GPU dedicada.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Para entender en detalle qu\u00e9 es DeepSeek y sus casos de uso, puedes consultar la <a href=\"https:\/\/www.neolo.com\/blog\/que-es-deepseek-para-que-se-usa-y-como-instalarlo.php\">gu\u00eda completa sobre DeepSeek<\/a> que explica sus variantes y diferencias.<\/p>\n<\/blockquote>\n\n\n\n<h3 class=\"wp-block-heading\">Google Gemma<\/h3>\n\n\n\n<p><strong>Gemma<\/strong> es la familia de modelos de c\u00f3digo abierto de <strong>Google DeepMind<\/strong>, lanzada en 2024. A diferencia de Gemini (el modelo cerrado de Google), Gemma est\u00e1 disponible para descarga y uso local. Sus versiones de 2B y 7B par\u00e1metros son especialmente eficientes: Gemma 2B puede correr en servidores con apenas 8 GB de RAM y ofrece respuestas de calidad sorprendente para su tama\u00f1o. La versi\u00f3n Gemma 2 (9B y 27B) mejor\u00f3 considerablemente la coherencia y el soporte multiling\u00fce.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Mistral y Mixtral<\/h3>\n\n\n\n<p><strong>Mistral AI<\/strong> es una startup francesa fundada en 2023 que se convirti\u00f3 r\u00e1pidamente en un referente del ecosistema open source europeo. Sus modelos Mistral 7B y Mixtral 8x7B (una arquitectura de mezcla de expertos o MoE) ofrecen un rendimiento muy por encima de lo esperado para su tama\u00f1o. Mistral es especialmente reconocido por su capacidad de seguir instrucciones complejas y generar c\u00f3digo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Microsoft Phi<\/h3>\n\n\n\n<p>La familia <strong>Phi<\/strong> de <strong>Microsoft Research<\/strong> representa una apuesta por modelos peque\u00f1os pero altamente capaces. Phi-3 Mini (3.8B par\u00e1metros) y Phi-3 Medium (14B) est\u00e1n dise\u00f1ados para tareas de razonamiento y pueden ejecutarse en hardware con recursos limitados. Son una opci\u00f3n excelente para proyectos que priorizan la eficiencia por encima de la versatilidad.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"tabla-comparativa\">Comparativa de LLM locales<\/h2>\n\n\n\n<figure class=\"wp-block-table has-small-font-size\"><table class=\"has-fixed-layout\"><thead><tr><th>Modelo<\/th><th>Creador<\/th><th>Tama\u00f1o m\u00ednimo recomendado<\/th><th>RAM m\u00ednima (VPS)<\/th><th>Razonamiento<\/th><th>Multiling\u00fce<\/th><th>Ideal para<\/th><\/tr><\/thead><tbody><tr><td>Llama 3.1 8B<\/td><td>Meta<\/td><td>8B<\/td><td>16 GB<\/td><td>Alto<\/td><td>S\u00ed<\/td><td>Uso general, espa\u00f1ol<\/td><\/tr><tr><td>DeepSeek R1 7B<\/td><td>DeepSeek AI<\/td><td>7B<\/td><td>16 GB<\/td><td>Muy alto<\/td><td>Parcial<\/td><td>An\u00e1lisis, l\u00f3gica<\/td><\/tr><tr><td>Gemma 2 9B<\/td><td>Google DeepMind<\/td><td>9B<\/td><td>16 GB<\/td><td>Medio-alto<\/td><td>S\u00ed<\/td><td>Uso general, eficiencia<\/td><\/tr><tr><td>Mistral 7B<\/td><td>Mistral AI<\/td><td>7B<\/td><td>16 GB<\/td><td>Alto<\/td><td>S\u00ed<\/td><td>Instrucciones, c\u00f3digo<\/td><\/tr><tr><td>Mixtral 8x7B<\/td><td>Mistral AI<\/td><td>47B<\/td><td>64 GB<\/td><td>Muy alto<\/td><td>S\u00ed<\/td><td>Tareas complejas<\/td><\/tr><tr><td>Phi-3 Mini<\/td><td>Microsoft<\/td><td>3.8B<\/td><td>8 GB<\/td><td>Medio<\/td><td>Parcial<\/td><td>Recursos limitados<\/td><\/tr><tr><td>Gemma 2B<\/td><td>Google DeepMind<\/td><td>2B<\/td><td>8 GB<\/td><td>B\u00e1sico<\/td><td>Parcial<\/td><td>Pruebas, desarrollo<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Nota sobre la columna RAM<\/strong>: estos valores corresponden a la versi\u00f3n cuantizada (Q4) del modelo, que Ollama aplica autom\u00e1ticamente. Sin cuantizaci\u00f3n, los requisitos se duplican o triplican.<\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"requisitos\">Requisitos para instalar un LLM local en un VPS<\/h2>\n\n\n\n<p>Antes de ejecutar el primer modelo, es importante entender qu\u00e9 necesita el servidor.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Sistema operativo<\/h3>\n\n\n\n<p>La opci\u00f3n m\u00e1s compatible y documentada es <strong>Ubuntu 22.04 LTS<\/strong> o <strong>Ubuntu 24.04 LTS<\/strong>. Debian 12 tambi\u00e9n funciona sin problemas. Se necesita acceso root o un usuario con privilegios <code>sudo<\/code>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">RAM<\/h3>\n\n\n\n<p>Este es el recurso m\u00e1s cr\u00edtico. La regla pr\u00e1ctica es:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Modelos de 7-9B par\u00e1metros (cuantizados): m\u00ednimo <strong>16 GB de RAM<\/strong><\/li>\n\n\n\n<li>Modelos de 13-14B par\u00e1metros: m\u00ednimo <strong>32 GB de RAM<\/strong><\/li>\n\n\n\n<li>Modelos de 70B par\u00e1metros: <strong>64 GB o m\u00e1s<\/strong>, idealmente con GPU<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">CPU y almacenamiento<\/h3>\n\n\n\n<p>Sin GPU, el modelo corre completamente en CPU. Esto es funcional para consultas ocasionales o desarrollo, pero no para alta concurrencia. Un VPS con 4-8 n\u00facleos reales ofrece un rendimiento razonable.<\/p>\n\n\n\n<p>El almacenamiento depende de cu\u00e1ntos modelos se descarguen. Cada modelo pesa entre 4 GB (Phi-3 Mini cuantizado) y 40 GB (Llama 3.1 70B cuantizado). Un disco de <strong>50-100 GB<\/strong> es suficiente para 2-3 modelos medianos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Conectividad<\/h3>\n\n\n\n<p>No se necesita ning\u00fan puerto abierto especialmente, a menos que quieras exponer la API de Ollama hacia afuera (lo cual no se recomienda sin autenticaci\u00f3n).<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Un <a href=\"https:\/\/www.neolo.com\/esp\/vps-hosting\/\">hosting VPS de Neolo<\/a> con 16 o 32 GB de RAM cubre sin problemas los requisitos para ejecutar modelos de 7B a 14B par\u00e1metros, y es la base sobre la que est\u00e1n pensados los ejemplos de esta gu\u00eda.<\/p>\n<\/blockquote>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/www.neolo.com\/esp\/vps-hosting\/\"><img decoding=\"async\" src=\"http:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/03\/vps-hosting-claude-code.png\" alt=\"Hosting VPS para Claude Code en Neolo\"\/><\/a><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"instalar-ollama\">C\u00f3mo instalar Ollama en un VPS Linux paso a paso<\/h2>\n\n\n\n<p>Los siguientes comandos est\u00e1n probados en Ubuntu 22.04 y 24.04 con acceso root.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 1: Actualizar el sistema<\/h3>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\napt update &amp;amp;&amp;amp; apt upgrade -y\n\n<\/pre><\/div>\n\n\n<h3 class=\"wp-block-heading\">Paso 2: Instalar Ollama<\/h3>\n\n\n\n<p>Ollama ofrece un script de instalaci\u00f3n oficial que detecta el sistema y configura el servicio autom\u00e1ticamente:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\ncurl -fsSL https:\/\/ollama.com\/install.sh | sh\n\n<\/pre><\/div>\n\n\n<p>Este script instala el binario en <code>\/usr\/local\/bin\/ollama<\/code> y crea un servicio <code>systemd<\/code> que arranca autom\u00e1ticamente con el servidor.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 3: Verificar que el servicio est\u00e1 activo<\/h3>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nsystemctl status ollama\n\n<\/pre><\/div>\n\n\n<p>La salida debe mostrar <code>active (running)<\/code>. Si no est\u00e1 activo:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nsystemctl enable --now ollama\n\n<\/pre><\/div>\n\n\n<h3 class=\"wp-block-heading\">Paso 4: Confirmar que la API responde<\/h3>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\ncurl http:\/\/localhost:11434\n\n<\/pre><\/div>\n\n\n<p>Deber\u00edas ver el texto: <code>Ollama is running<\/code><\/p>\n\n\n\n<p>Ollama ya est\u00e1 instalado. Ahora se pueden descargar modelos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"ejecutar-modelos\">C\u00f3mo ejecutar modelos con Ollama: DeepSeek, Gemma, Llama y m\u00e1s<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">Descargar y ejecutar un modelo<\/h3>\n\n\n\n<p>El comando <code>ollama run<\/code> descarga el modelo si no existe localmente y abre una sesi\u00f3n interactiva:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama run llama3.1\n\n<\/pre><\/div>\n\n\n<p>Para DeepSeek R1 en su versi\u00f3n destilada de 7B:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama run deepseek-r1:7b\n\n<\/pre><\/div>\n\n\n<p>Para Gemma 2 de 9B:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama run gemma2:9b\n\n<\/pre><\/div>\n\n\n<p>Para Mistral 7B:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama run mistral\n\n<\/pre><\/div>\n\n\n<p>Para Phi-3 Mini (ideal si el VPS tiene 8 GB de RAM):<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama run phi3:mini\n\n<\/pre><\/div>\n\n\n<h3 class=\"wp-block-heading\">Listar modelos descargados<\/h3>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama list\n\n<\/pre><\/div>\n\n\n<h3 class=\"wp-block-heading\">Eliminar un modelo para liberar espacio<\/h3>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nollama rm gemma2:9b\n\n<\/pre><\/div>\n\n\n<h3 class=\"wp-block-heading\">Usar la API REST desde una aplicaci\u00f3n<\/h3>\n\n\n\n<p>Ollama expone una API compatible con el formato de OpenAI en <code>http:\/\/localhost:11434<\/code>. Para hacer una consulta desde la terminal:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\ncurl http:\/\/localhost:11434\/api\/generate \\\n  -d &#039;{\n    &quot;model&quot;: &quot;llama3.1&quot;,\n    &quot;prompt&quot;: &quot;Explica qu\u00e9 es una red neuronal en 3 oraciones.&quot;,\n    &quot;stream&quot;: false\n  }&#039;\n\n<\/pre><\/div>\n\n\n<p>Esta API permite integrar el modelo en aplicaciones web, bots de Telegram, pipelines de automatizaci\u00f3n con n8n o cualquier script que haga peticiones HTTP.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exponer la API de forma segura con un proxy inverso (opcional)<\/h3>\n\n\n\n<p>Si se necesita acceder a Ollama desde fuera del servidor, lo correcto es usar un proxy inverso como Nginx con autenticaci\u00f3n b\u00e1sica. <strong>No exponer el puerto 11434 directamente a internet.<\/strong><\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nserver {\n    listen 443 ssl;\n    server_name ollama.tudominio.com;\n\n    ssl_certificate \/etc\/letsencrypt\/live\/ollama.tudominio.com\/fullchain.pem;\n    ssl_certificate_key \/etc\/letsencrypt\/live\/ollama.tudominio.com\/privkey.pem;\n\n    location \/ {\n        auth_basic &quot;Restringido&quot;;\n        auth_basic_user_file \/etc\/nginx\/.htpasswd;\n        proxy_pass http:\/\/127.0.0.1:11434;\n    }\n}\n\n<\/pre><\/div>\n\n\n<p>Esto a\u00f1ade una capa de autenticaci\u00f3n antes de llegar al modelo.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"ventajas\">Ventajas de instalar un LLM local: privacidad, seguridad y autonom\u00eda<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">Privacidad de datos<\/h3>\n\n\n\n<p>Al usar un LLM en la nube, cada consulta puede ser almacenada, analizada o usada para mejorar el modelo del proveedor (dependiendo de los t\u00e9rminos de servicio). Con un modelo local, los datos no salen del servidor. Esto es especialmente relevante para:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Despachos legales que procesan contratos<\/li>\n\n\n\n<li>Cl\u00ednicas o consultorios que manejan historiales<\/li>\n\n\n\n<li>Empresas que trabajan con informaci\u00f3n financiera confidencial<\/li>\n\n\n\n<li>Desarrolladores que quieren mantener el c\u00f3digo fuente privado<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Sin dependencia de terceros<\/h3>\n\n\n\n<p>Los servicios de IA en la nube pueden cambiar sus precios, sus pol\u00edticas de uso, sus l\u00edmites de velocidad o directamente discontinuar modelos. Un LLM local funciona independientemente de lo que decida cualquier empresa externa.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Costos predecibles<\/h3>\n\n\n\n<p>Con un VPS de capacidad adecuada, el costo mensual es fijo. No hay costo por token, no hay sorpresas al final del mes si el equipo us\u00f3 el modelo intensamente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Personalizaci\u00f3n total<\/h3>\n\n\n\n<p>Se puede hacer fine-tuning del modelo con datos propios, ajustar par\u00e1metros de generaci\u00f3n, encadenar m\u00faltiples modelos o integrarlos en flujos de trabajo complejos. Algo que no es posible con APIs cerradas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Disponibilidad sin l\u00edmites<\/h3>\n\n\n\n<p>No hay l\u00edmites de velocidad, no hay colas en horarios pico, no hay degradaci\u00f3n del servicio cuando el proveedor est\u00e1 saturado. El modelo responde mientras el servidor est\u00e9 en pie.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Si te interesa entender c\u00f3mo act\u00faan los agentes de IA que puedes construir sobre estos modelos, el art\u00edculo sobre <a href=\"https:\/\/www.neolo.com\/blog\/como-actua-un-agente-de-ia-2.php\">c\u00f3mo act\u00faa un agente de IA<\/a> explica el funcionamiento interno con claridad.<\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"errores-comunes\">Errores comunes al instalar LLM locales<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">El modelo no responde o la descarga se interrumpe<\/h3>\n\n\n\n<p>Ollama descarga los modelos en trozos. Si la conexi\u00f3n es inestable, la descarga puede fallar a mitad. La soluci\u00f3n es volver a ejecutar <code>ollama run [modelo]<\/code>: retomar\u00e1 desde donde se interrumpi\u00f3 si el archivo parcial sigue en disco.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">El servidor se queda sin RAM y el proceso muere<\/h3>\n\n\n\n<p>Esto ocurre cuando se intenta cargar un modelo demasiado grande para la RAM disponible. El sistema operativo termina el proceso sin aviso. La soluci\u00f3n es verificar la RAM disponible con <code>free -h<\/code> antes de descargar el modelo y elegir una versi\u00f3n cuantizada m\u00e1s peque\u00f1a.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">La API no responde desde fuera del servidor<\/h3>\n\n\n\n<p>Por defecto, Ollama escucha solo en <code>127.0.0.1<\/code>. Para que escuche en todas las interfaces (necesario si se usa detr\u00e1s de un proxy), hay que modificar la variable de entorno del servicio:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nsystemctl edit ollama\n\n<\/pre><\/div>\n\n\n<p>En el archivo que se abre, a\u00f1adir:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\n&#x5B;Service]\nEnvironment=&quot;OLLAMA_HOST=0.0.0.0:11434&quot;\n\n<\/pre><\/div>\n\n\n<p>Luego reiniciar el servicio:<\/p>\n\n\n<div class=\"wp-block-syntaxhighlighter-code \"><pre class=\"brush: plain; title: ; notranslate\" title=\"\">\nsystemctl restart ollama\n\n<\/pre><\/div>\n\n\n<p>Recuerda proteger el acceso con el proxy inverso mencionado anteriormente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">El modelo responde muy lento<\/h3>\n\n\n\n<p>Sin GPU, la velocidad de generaci\u00f3n depende de los n\u00facleos de CPU y la memoria RAM disponible. Un modelo de 7B en un VPS de 4 n\u00facleos genera aproximadamente 5-15 tokens por segundo, lo que es aceptable para uso interactivo pero puede no serlo para alta concurrencia. Si el caso de uso requiere velocidad, la opci\u00f3n es migrar a un servidor con m\u00e1s n\u00facleos o agregar una GPU.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Conflictos de versiones con libc o dependencias del sistema<\/h3>\n\n\n\n<p>En sistemas Ubuntu 20.04 o anteriores, Ollama puede fallar por incompatibilidad con versiones de <code>glibc<\/code>. La soluci\u00f3n m\u00e1s directa es usar Ubuntu 22.04 o superior. Si no es posible, se puede ejecutar Ollama dentro de un contenedor <strong><a href=\"https:\/\/www.neolo.com\/blog\/hosting-docker.php\">Docker<\/a><\/strong>.<\/p>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe loading=\"lazy\" title=\"\u00bfQu\u00e9 Hosting usar con Docker?\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/vhE3PBuWKJQ?feature=oembed&#038;enablejsapi=1&#038;origin=https:\/\/www.neolo.com\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"resenas\">Lo que dicen los clientes de Neolo<\/h2>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>\u2605\u2605\u2605\u2605\u2605 <strong>Fernando<\/strong><br>\u00abHace muchos a\u00f1os que tengo web hosting en Neolo, y la verdad es que no tengo interrupciones en el servicio. Nuestras webs est\u00e1n siempre activas, y alguna vez cuando aparece alg\u00fan inconveniente de origen externo y ajeno a ellos, la gente de Neolo corre a solucionarlo. Excelente servicio recibido, en lo t\u00e9cnico y en lo humano.\u00bb<\/p>\n\n\n\n<p>\u2605\u2605\u2605\u2605\u2605 <strong>Bruno Balzani<\/strong><br>\u00abCliente desde 2009. Neolo lo que tiene es la mejor atenci\u00f3n, pero por lejos.\u00bb<\/p>\n\n\n\n<p>\u2605\u2605\u2605\u2605\u2605 <strong>P\u00fcert\u00e4 \u00d6ndr\u00ebj<\/strong><br>\u00abUna empresa comprometida con la calidad, con unos servicios a un costo insuperable.\u00bb<\/p>\n<\/blockquote>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"faq\">Preguntas frecuentes<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfPuedo instalar un LLM local sin GPU?<\/h3>\n\n\n\n<p>S\u00ed. Todos los modelos que maneja Ollama pueden correr completamente en CPU. La GPU acelera considerablemente la generaci\u00f3n de texto, pero no es imprescindible para uso personal o desarrollo. En un VPS sin GPU, un modelo de 7B genera entre 5 y 15 tokens por segundo, lo que es suficiente para la mayor\u00eda de los casos de uso individuales o de equipos peque\u00f1os.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 diferencia hay entre Ollama y ejecutar un modelo directamente con Python?<\/h3>\n\n\n\n<p>Ollama automatiza la descarga, cuantizaci\u00f3n y servicio del modelo. Si se quisiera hacer lo mismo manualmente con librer\u00edas como <code>llama.cpp<\/code> o <code>transformers<\/code> de Hugging Face, habr\u00eda que gestionar la conversi\u00f3n de pesos, la configuraci\u00f3n del servidor y las dependencias del sistema operativo. Ollama hace todo eso en un solo comando. Para producci\u00f3n, Ollama es la opci\u00f3n m\u00e1s pr\u00e1ctica y mantenida actualmente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfCu\u00e1nto almacenamiento necesito para varios modelos?<\/h3>\n\n\n\n<p>Depende de los modelos elegidos. En versi\u00f3n cuantizada Q4 (la que usa Ollama por defecto):<br>&#8211; Phi-3 Mini (3.8B): ~2.3 GB<br>&#8211; Gemma 2B: ~1.7 GB<br>&#8211; Mistral 7B \/ Llama 3.1 8B: ~4.5-5 GB<br>&#8211; Gemma 2 9B \/ DeepSeek R1 7B: ~5-6 GB<br>&#8211; Llama 3.1 70B: ~40 GB<\/p>\n\n\n\n<p>Para tener 3-4 modelos medianos, 50 GB de almacenamiento es suficiente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfEs seguro exponer la API de Ollama a internet?<\/h3>\n\n\n\n<p>No directamente. El puerto 11434 no tiene autenticaci\u00f3n por defecto. Siempre se debe usar un proxy inverso con HTTPS y autenticaci\u00f3n b\u00e1sica o tokens antes de exponer la API al exterior. Nunca abrir el puerto 11434 directamente en el firewall hacia internet.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfPuedo usar un LLM local para entrenar o hacer fine-tuning con mis propios datos?<\/h3>\n\n\n\n<p>Ollama est\u00e1 orientado a inferencia (usar el modelo), no a entrenamiento. Para fine-tuning se necesitan herramientas como <code>Axolotl<\/code>, <code>LLaMA-Factory<\/code> o el ecosistema de Hugging Face <code>PEFT<\/code>\/<code>LoRA<\/code>. Estos procesos requieren m\u00e1s recursos (especialmente RAM y, en la pr\u00e1ctica, una GPU) y est\u00e1n m\u00e1s all\u00e1 del alcance de esta gu\u00eda, pero son factibles en un servidor dedicado con las especificaciones adecuadas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 modelo recomiendan para espa\u00f1ol?<\/h3>\n\n\n\n<p>Llama 3.1 8B es actualmente el modelo m\u00e1s equilibrado para espa\u00f1ol en el ecosistema open source: fue entrenado con un corpus multiling\u00fce amplio y ofrece respuestas coherentes en espa\u00f1ol sin configuraciones adicionales. Gemma 2 9B tambi\u00e9n funciona bien. DeepSeek R1 tiene capacidades de razonamiento superiores pero su soporte en espa\u00f1ol es m\u00e1s irregular.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"conclusion\">Conclusi\u00f3n<\/h2>\n\n\n\n<p><strong>Instalar un LLM local <\/strong>ha pasado de ser un ejercicio t\u00e9cnico para investigadores a una opci\u00f3n real para cualquier equipo o profesional que valore la privacidad, la autonom\u00eda y los costos predecibles. Con Ollama como gestor y modelos como Llama 3.1, DeepSeek R1 o Gemma 2, es posible tener un asistente de IA completamente propio funcionando en menos de una hora.<\/p>\n\n\n\n<p>El \u00fanico requisito real es contar con un servidor con suficiente RAM. Para eso, el <a href=\"https:\/\/www.neolo.com\/esp\/vps-hosting\/\">hosting VPS de Neolo<\/a> es una opci\u00f3n especialmente adecuada: lleva m\u00e1s de 20 a\u00f1os en el mercado, responde el 80% de las consultas en menos de una hora y ofrece garant\u00eda de reembolso de 30 d\u00edas, por lo que puedes probar la configuraci\u00f3n sin riesgo. Para proyectos que combinan LLMs locales con flujos de automatizaci\u00f3n, tambi\u00e9n puedes revisar el art\u00edculo sobre <a href=\"https:\/\/www.neolo.com\/blog\/como-alojar-un-llm-en-un-vps-la-mejor-opcion.php\">c\u00f3mo alojar un LLM en un VPS<\/a> para profundizar en aspectos de configuraci\u00f3n avanzada.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un LLM local es un modelo de lenguaje que se ejecuta en tu propio servidor, sin depender de servicios en la nube. Esta gu\u00eda explica qu\u00e9 son los principales modelos disponibles (Ollama, DeepSeek, Gemma, Llama), c\u00f3mo instalarlos paso a paso y por qu\u00e9 un VPS es la opci\u00f3n m\u00e1s pr\u00e1ctica para hacerlo. Si quieres privacidad [&hellip;]<\/p>\n","protected":false},"author":21,"featured_media":32749,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[351],"tags":[],"class_list":["post-32732","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-desarrollo-web"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.6 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>C\u00f3mo Instalar un LLM local - Neolo Blog<\/title>\n<meta name=\"description\" content=\"Pasos necesarios para instalar un LLM local. Qu\u00e9 VPS debes usar.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"C\u00f3mo Instalar un LLM local - Neolo Blog\" \/>\n<meta property=\"og:description\" content=\"Pasos necesarios para instalar un LLM local. Qu\u00e9 VPS debes usar.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\" \/>\n<meta property=\"og:site_name\" content=\"Neolo Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/neolohosting\" \/>\n<meta property=\"article:published_time\" content=\"2026-06-26T09:46:00+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1920\" \/>\n\t<meta property=\"og:image:height\" content=\"1280\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Leo\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@neolo\" \/>\n<meta name=\"twitter:site\" content=\"@neolo\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Leo\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"12 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#article\",\"isPartOf\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\"},\"author\":{\"name\":\"Leo\",\"@id\":\"https:\/\/www.neolo.com\/blog\/#\/schema\/person\/5fe808bcffd4347c68bc5388a05a5a30\"},\"headline\":\"C\u00f3mo Instalar un LLM local\",\"datePublished\":\"2026-06-26T09:46:00+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\"},\"wordCount\":2741,\"publisher\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/#organization\"},\"image\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg\",\"articleSection\":[\"Desarrollo web\"],\"inLanguage\":\"es\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\",\"url\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\",\"name\":\"C\u00f3mo Instalar un LLM local - Neolo Blog\",\"isPartOf\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg\",\"datePublished\":\"2026-06-26T09:46:00+00:00\",\"description\":\"Pasos necesarios para instalar un LLM local. Qu\u00e9 VPS debes usar.\",\"breadcrumb\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage\",\"url\":\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg\",\"contentUrl\":\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg\",\"width\":1920,\"height\":1280},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Inicio\",\"item\":\"https:\/\/www.neolo.com\/blog\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Desarrollo web\",\"item\":\"https:\/\/www.neolo.com\/blog\/temas\/desarrollo-web\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"C\u00f3mo Instalar un LLM local\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.neolo.com\/blog\/#website\",\"url\":\"https:\/\/www.neolo.com\/blog\/\",\"name\":\"Neolo Blog\",\"description\":\"Blog de Neolo: Dominios, Web Hosting y Marketing Digital\",\"publisher\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.neolo.com\/blog\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/www.neolo.com\/blog\/#organization\",\"name\":\"Neolo\",\"url\":\"https:\/\/www.neolo.com\/blog\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/www.neolo.com\/blog\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2017\/07\/neolo-verde-chico.png\",\"contentUrl\":\"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2017\/07\/neolo-verde-chico.png\",\"width\":392,\"height\":83,\"caption\":\"Neolo\"},\"image\":{\"@id\":\"https:\/\/www.neolo.com\/blog\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/neolohosting\",\"https:\/\/x.com\/neolo\",\"https:\/\/www.instagram.com\/neolodotcom\/\",\"https:\/\/www.linkedin.com\/company\/neolo.com\/\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.neolo.com\/blog\/#\/schema\/person\/5fe808bcffd4347c68bc5388a05a5a30\",\"name\":\"Leo\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/www.neolo.com\/blog\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/279168ad52820892dbc4c5b373d7fec5?s=96&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/279168ad52820892dbc4c5b373d7fec5?s=96&r=g\",\"caption\":\"Leo\"},\"url\":\"https:\/\/www.neolo.com\/blog\/author\/leo\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"C\u00f3mo Instalar un LLM local - Neolo Blog","description":"Pasos necesarios para instalar un LLM local. Qu\u00e9 VPS debes usar.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php","og_type":"article","og_title":"C\u00f3mo Instalar un LLM local - Neolo Blog","og_description":"Pasos necesarios para instalar un LLM local. Qu\u00e9 VPS debes usar.","og_url":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php","og_site_name":"Neolo Blog","article_publisher":"https:\/\/www.facebook.com\/neolohosting","article_published_time":"2026-06-26T09:46:00+00:00","og_image":[{"width":1920,"height":1280,"url":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg","type":"image\/jpeg"}],"author":"Leo","twitter_card":"summary_large_image","twitter_creator":"@neolo","twitter_site":"@neolo","twitter_misc":{"Escrito por":"Leo","Tiempo de lectura":"12 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#article","isPartOf":{"@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php"},"author":{"name":"Leo","@id":"https:\/\/www.neolo.com\/blog\/#\/schema\/person\/5fe808bcffd4347c68bc5388a05a5a30"},"headline":"C\u00f3mo Instalar un LLM local","datePublished":"2026-06-26T09:46:00+00:00","mainEntityOfPage":{"@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php"},"wordCount":2741,"publisher":{"@id":"https:\/\/www.neolo.com\/blog\/#organization"},"image":{"@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage"},"thumbnailUrl":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg","articleSection":["Desarrollo web"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php","url":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php","name":"C\u00f3mo Instalar un LLM local - Neolo Blog","isPartOf":{"@id":"https:\/\/www.neolo.com\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage"},"image":{"@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage"},"thumbnailUrl":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg","datePublished":"2026-06-26T09:46:00+00:00","description":"Pasos necesarios para instalar un LLM local. Qu\u00e9 VPS debes usar.","breadcrumb":{"@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#primaryimage","url":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg","contentUrl":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2026\/05\/pexels-yankrukov-9072322.jpg","width":1920,"height":1280},{"@type":"BreadcrumbList","@id":"https:\/\/www.neolo.com\/blog\/como-instalar-un-llm-local.php#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Inicio","item":"https:\/\/www.neolo.com\/blog"},{"@type":"ListItem","position":2,"name":"Desarrollo web","item":"https:\/\/www.neolo.com\/blog\/temas\/desarrollo-web"},{"@type":"ListItem","position":3,"name":"C\u00f3mo Instalar un LLM local"}]},{"@type":"WebSite","@id":"https:\/\/www.neolo.com\/blog\/#website","url":"https:\/\/www.neolo.com\/blog\/","name":"Neolo Blog","description":"Blog de Neolo: Dominios, Web Hosting y Marketing Digital","publisher":{"@id":"https:\/\/www.neolo.com\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.neolo.com\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/www.neolo.com\/blog\/#organization","name":"Neolo","url":"https:\/\/www.neolo.com\/blog\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/www.neolo.com\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2017\/07\/neolo-verde-chico.png","contentUrl":"https:\/\/www.neolo.com\/blog\/wp-content\/uploads\/2017\/07\/neolo-verde-chico.png","width":392,"height":83,"caption":"Neolo"},"image":{"@id":"https:\/\/www.neolo.com\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/neolohosting","https:\/\/x.com\/neolo","https:\/\/www.instagram.com\/neolodotcom\/","https:\/\/www.linkedin.com\/company\/neolo.com\/"]},{"@type":"Person","@id":"https:\/\/www.neolo.com\/blog\/#\/schema\/person\/5fe808bcffd4347c68bc5388a05a5a30","name":"Leo","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/www.neolo.com\/blog\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/279168ad52820892dbc4c5b373d7fec5?s=96&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/279168ad52820892dbc4c5b373d7fec5?s=96&r=g","caption":"Leo"},"url":"https:\/\/www.neolo.com\/blog\/author\/leo"}]}},"_links":{"self":[{"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/posts\/32732","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/users\/21"}],"replies":[{"embeddable":true,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/comments?post=32732"}],"version-history":[{"count":3,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/posts\/32732\/revisions"}],"predecessor-version":[{"id":32752,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/posts\/32732\/revisions\/32752"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/media\/32749"}],"wp:attachment":[{"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/media?parent=32732"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/categories?post=32732"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.neolo.com\/blog\/wp-json\/wp\/v2\/tags?post=32732"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}