Miguel Ángel Valero
La aparición del nuevo modelo de la startup china Deepseek ha puesto en alerta a las gigantes tecnológicas americanas y ha provocado la mayor caída en la cotización de Nvidia desde la Covid-19 (-17%). La principal disrupción de Deepseek está en la capacidad de entrenar un modelo con las mismas capacidades que el modelo comercial más avanzado de ChatGPT a un coste 30 veces inferior. Sin embargo, los datos de costes son ofrecidos por la propia compañía, en la que hay una elevada opacidad (no se sabe ni siquiera cuantas personas trabajan exactamente en el proyecto y tampoco se sabe sí, como indican, solo se han utilizado los chips H800, la versión disminuida de los H100 de Nvidia que se permitían exportar a China, para el entrenamiento del modelo).
Otro factor interesante es que se trata de una aplicación de código abierto, por lo que sus innovaciones pueden ser replicadas, anulando su ventaja competitiva. Open IA está trabajando actualmente en ChatGPT 5.
La compañía china se enfrenta al reto de evitar morir de éxito y tendrá que escalar el servicio en las próximas semanas. Chat GPT, según cifras de agosto, atiende a 200 millones de usuarios por semana.
Resulta interesante el momento de la aparición de Deepseek: justamente después del anuncio de Stargate y en los días previos a la presentación de resultados de dos líderes en el sector como son Microsoft y Meta.
La aparición del nuevo competidor ha golpeado principalmente a las perspectivas de toda la cadena de valor dentro del mundo de los centros de datos. Esta va desde los fabricante de maquinaría para elaborar microchips como ASML (-7,2%), fabricantes de chips de alto rendimiento como Nvidia o Broadcoam (-17,4%)), así como otros especializados en infraestructura energética como Schneider Electric (-9,6%) o el lado inmobiliario de los centros de datos como Digital Realty (-8,7%).
El momento de pánico del 27 de enero beneficia a aquellos grupos que priorizan el software y la ciberseguridad frente a los semiconductores. El software cayó un -1,7% frente al -5,7% de la tecnología.
También llama la atención que la aplicación china reconociera públicamente que ha tenido que frenar el registro de nuevos usuarios al sufrir un ciberataque.
En cualquier caso, se abre un nuevo capítulo en el despliegue de la inteligencia artificial (IA), incluso si las afirmaciones en costes de Deepseek no son tan extremas. La aparición de más competencia pone el foco en la racionalización del gasto como una nueva variable dentro del desarrollo de la tecnología. No obstante, es muy pronto para saber las consecuencias finales, especialmente cuando la ventaja competitiva del nuevo modelo pueda ser replicada por los otros competidores.
Andbank
“DeepSeek ha conseguido superar a ChatGPT en las tiendas móviles de aplicaciones, y también en pruebas de rendimiento y razonamiento con su modelo R1, y a una fracción del coste de entrenamiento”. Esta frase ha corrido como la pólvora entre los inversores del mundo y ha provocado un auténtico terremoto en los mercados; especialmente en el sector tecnológico occidental. Lo que pone nerviosos a los inversores es la última parte de la afirmación: “a una fracción del coste de entrenamiento”.
"Es necesario saber que la cuestión del menor coste puede tener que ver con algo que no es en absoluto disruptivo. Es posible que DeepSeek, igual que Copilot, no sea un modelo autónomo completo. Copilot (con solo 10 millones de coste de entrenamiento) está entrenado en Codex, un modelo desarrollado con anterioridad por OpenAI y derivado de GPT-3. Significa que cuando Copilot sale a la luz, OpenAI ya había absorbido previamente la mayor parte del coste de entrenamiento del modelo base, dejando a Microsoft el simple trabajo de ajustar el modelo (fine-tuning) para tareas específicas relacionadas con el código. ¿Podemos derivar de ello que el modelo de IA Copilot tiene, al final del proceso, un coste significativamente menor? No. En absoluto", explica un análisis elaborado por AndBank.
Aunque Deepseek sea de código abierto, esta IA podría estar beneficiándose de una casuística similar a la de Copilot, mediante el uso de un modelo base preexistente. DeepSeek podría estar basado en un modelo preentrenado de código abierto, como LLaMA 2, Falcon o incluso GPT-NeoX.Significa que Deepseek está realizando de facto una transferencia de costes, ya que los costes asociados al modelo base habrían sido absorbidos por la organización que desarrolló dicho modelo original. Entonces, DeepSeek, igual que Microsoft, solo tendría que realizar el fine-tuning en un conjunto de datos específicos, que es mucho menos costoso que entrenar un modelo desde cero.
"Esto es bastante plausible, pues hay startups que suelen recurrir soluciones en la nube para entrenamientos específicos basados en modelos preexistentes, lo que reduce el gasto inicial. ¿Cuáles la diferencia entre Copilot y Deepseek? Que Microsoft pagó en 2019 1.000 millones a OpenAI, y en 2023 otros 10.000 millones adicionales. Entiendo que en concepto de esa 'transferencia de costes'. Habrá que esperar y ver, pero se me hace muy difícil pensar que, tras décadas de trabajo en materia de redes neuronales, deep learning y, finalmente la IA, los creadores originales de estos modelos permitirán que esta situación de 'entrenamiento por transferencia' se materialice dando lugar a modelos mejores, sin incurrir en los costes asociados", opina Alex Fusté, economista jefe y director de Inversiones de Andbank.
"Pero ¿puede realmente una empresa como Deepseek poner en jaque a los desarrolladores occidentales? Depende de la capacidad que estos últimos tengan para defenderse. En este sentido, deben saber que los desarrolladores de los modelos base tienen varias estrategias para proteger su trabajo y evitar que terceros creen modelos mejores mediante el uso de un modelo base preexistente", añade.
Estas defensas tienen que ver con restricciones de licencia, protección a través de Patentes y Propiedad Intelectual (que pueden dar lugar a multas billonarias), y con impulsar una innovación continua con modelos en evolución constante: Los creadores originales suelen mantener una ventaja competitiva al lanzar iteraciones constantes de sus modelos, creando una importante barrera técnica para aquellos que intentan competir mediante fine-tuning (o copia). "Esto es lo que probablemente ocurriría en este caso. Al fin y al cabo, la IA que tenemos hoy es la peor que tendremos. ¿Qué importa entonces que un competidor iguale los modelos actuales mediante entrenamiento por transferencia, si en poco tiempo (y como es previsible) aparecerán nuevos modelos más potentes?", subraya este experto.
OpenAI y Google tienen acceso a recursos de hardware y software optimizados que les permite seguir liderando la carrera y crear nuevas versiones. También existen modelos protegidos contra extracción, comotécnicas para dificultar la extracción de conocimiento.
Un aspecto relevante en el análisis del coste reducido de este modelo de IA es el posible efecto de subvenciones gubernamentales, un fenómeno particularmente frecuente en China, especialmente cuando Pekín establece un “Plan Superior” para ciertos sectores, como el de baterías, vehículos eléctricos o paneles solares. "No descartaría la posibilidad de la existencia de fuertes subvenciones que ayudarían a enmascarar los costes", avisa Fusté.
Se ha señalado que el desarrollo de DeepSeek cuenta con el apoyo explícito de un hedge fund denominado High-Flyer, cuando estos vehículos no suelen desempeñar el papel de impulsores principales en el desarrollo de empresas tecnológicas, suelen centrarse en estrategias de inversión que maximizan el retorno financiero a corto o medio plazo, en lugar de asumir los riesgos inherentes al desarrollo tecnológico a largo plazo, que suelen ser costosos, inciertos y de lenta maduración.
Fusté sugiere que el apoyo de un Hedge Fund como High-Flyer actúe como un vehículo para canalizar subvenciones públicas significativas: "Este tipo de dinámica, si se confirmara, podría representar un caso evidente de dumping y prácticas empresariales cuestionables desde el punto de vista ético y comercial. Dicho escenario no solo erosionaría la equidad en la competencia global, sino que probablemente desencadenaría una respuesta formal por parte de las autoridades regulatorias en Occidente y de organismos internacionales como la Organización Mundial del Comercio (OMC). La implicación de fondos públicos ocultos tras intermediarios financieros pondría de manifiesto una estrategia potencialmente desleal, cuya repercusión en el equilibrio comercial y tecnológico sería motivo de escrutinio internacional.
Un aspecto crucial a considerar en la evaluación comparativa de modelos de inteligencia artificial es la amplitud de sus funciones. Si DeepSeek está diseñado para tareas específicas, como búsqueda avanzada o análisis predictivo, es razonable esperar que sus requisitos computacionales sean significativamente menores en comparación con modelos generalistas como GPT-4, cuya arquitectura está optimizada para abordar una amplia gama de tareas. Este enfoque especializado podría explicar diferencias en eficiencia y coste. Sin embargo, una comparación rigurosa requiere un análisis más detallado de sus capacidades y objetivos, ya que actualmente no es evidente si estamos tratando elementos realmente equivalentes.
¿Cuál sería el verdadero riesgo para las tecnológicas occidentales? Una posible explicación para la reducción de costes de entrenamiento puede residir en el uso de hardware de nueva generación, específicamente GPU o TPU desarrolladas en China, que ofrecen un rendimiento superior en métricas clave, mayor capacidad de cálculo una eficiencia energética significativamente mejorada (FLOP por watt) y menores niveles de latencia (el tiempo requerido para procesar unatarea específica).
"Si los menores costes de operación del modelo DeepSeek derivan de la creación de nuevos superchips que superan a las soluciones actuales de Nvidia, esto representaría un desafío fundamental no solo para Nvidia, sino también para el liderazgo tecnológico de Occidente. Tal avance implicaría un cambio significativo en la competitividad tecnológica global y obligaría a un replanteamiento estratégico en la industria de semiconductores", avisa.
La materialización de un riesgo real relacionado con la supremacía de China en semiconductores requeriría evidencia concreta de que dispone de chips avanzados superiores a los actuales estándares de la industria. Sin embargo, el consenso predominante entre los expertos en semiconductores indica que, aunque China ha logrado avances notables en datos y algoritmos, sigue dependiendo de la tecnología extranjera en lo que respecta a semiconductores avanzados.
Por tanto, el gran riesgo asociado al desarrollo de "superchips" en China quedaría, al menos por ahora, significativamente mitigado. Este contexto refuerza la percepción de que, aunque China está avanzando en su ecosistema tecnológico, la supremacía en semiconductores avanzados sigue siendo una barrera estratégica que favorece a EEUU.
En ese sentido, Andbank ha elaborado una tabla que detalla los principales parámetros de eficiencia y coste de los modelos de IA más destacados en el mercado. En relación con el coste de entrenamiento del modelo más reciente de DeepSeek, es una estimación, ya que la empresa china no ha proporcionado información oficial sobre este aspecto. La proyección se basa en varias premisas: uso de chips comercializados y disponibles en el mercado actual, partiendo de unas supuestas capacidades y eficiencia que lo posicionarían como comparable a modelos avanzados como GPT. En estas condiciones hipotéticas, el coste total de entrenamiento para DeepSeek se estima en 150 millones$.
"No obstante, esta estimación deja abiertas dos cuestiones clave: Si DeepSeek emplea hardware innovador y de mayor rendimiento, lo que podría justificar un coste menor y una superioridad permanente. O si su competitividad se debe a una transferencia de costes debido al uso de modelos preentrenados. En tal caso, la presunta superioridad podría ser circunstancial y temporal", concluye el análisis de Andbank.
"Nunca hay que dar por cierto nada. Hace falta evidencias de que China ha superado a Occidente en chips, porque no es nada fácil", subraya Alex Fusté, para quien la situación de pánico en los mercados generada por Deepseek "demuestra los riesgos de las carteras indexadas, frente a las adecuadamente diversificadas y asesoradas". También cree que "se debe convertir el pánico en una oportunidad de entrada en activos a precios más baratos. No vamos a dar la espalda a las tecnológicas, sobre todo si están en las valoraciones adecuadas", zanja el economista jefe y director de Inversiones del grupo Andbank.
Se pone en cuestión el gasto de las tecnológicas de EEUU
La presentación de DeepSeek, una IA generativa china de alto rendimiento y bajo coste, desencadenó un auténtico terremoto en los mercados financieros. Desde los valores tecnológicos hasta las empresas energéticas, todo un ecosistema se derrumbó bajo el peso de una inesperada redefinición de las expectativas y las inversiones. En un contexto de exuberancia propia de los mercados bursátiles rebosantes de entusiasmo, se ha pasado de una atmósfera de "hacia el infinito y más allá" a otra de fin del mundo, sin explorar todos los matices intermedios, con una importante purga entre las empresas expuestas, de un modo u otro, a la inteligencia artificial.
La irrupción de la IA generativa china DeepSeek envió al paredón a un gran número de empresas, cualquiera que fuera su posición en el ecosistema. Cuando el hecho de que se haya desarrollado un modelo de alto rendimiento a menor coste no significa que la inversión en IA vaya a detenerse. Pero este episodio ilustra el peligro del pensamiento único y el sesgo de confirmación en los mercados.
Para los expertos de Portocolom AV: “este acontecimiento ha hecho plantearse a la comunidad inversora si se puede justificar el ingente gasto en el que se han embarcado las compañías tecnológicas estadounidenses”.
“DeepSeek y el varapalo de la tecnología en Bolsa el 27 de enero pone en cuestión el poder tecnológico de EEUU, sobre todo teniendo en cuenta todo el dinero que han estado invirtiendo los últimos años para crear aplicaciones de IA, ahora que los chinos lo han hecho más 'abierto', más barato y en menos tiempo, junto a la alta valoración de las acciones”, alertan desde Activotrade SV.
Para Juan José del Valle, analista de Activotrade: "Lo que pasó el fin de semana y ayer no estaba para nada anticipado. De hecho, el VIX subía cerca de un 50% desde 14 a más de 22 incluso. De todas maneras, en nuestra opinión creemos que el mínimo que hicieron ayer a media mañana los activos puede haber sido un momento generador de oportunidades. No creemos que el liderazgo tecnológico de EEUU se vaya al garete de la noche a la mañana. Las más perjudicadas fueron las compañías relacionadas con IA, ya sean fabricantes de chips, constructores de centros de datos o proveedores de energía que tanto habían subido los meses previos, como Siemens Energy o Constellation Energy -19% y -20,8% mientras que Nvidia cedía cerca de un 17%.”
"Los beneficios de las 7 Magníficas crecen aproximadamente a la mitad de como lo hacían a principios de 2024 mientras que, por otro lado, la ratio de P/S (Precio/Ventas) se ha duplicado desde los mínimos de 2022 desde que el Bloomberg Magnificient 7 Index ha subido cerca de un 260% hasta el cierre del viernes. ¿Preocupante? Nada nuevo que no sepamos", insisten en Activotrade.
Para Antonio Fernández Quesada, director de inversiones de Tesys: "El sector tecnológico es muy amplio y presenta una gran dispersión en modelos de negocios y valoraciones. Dos variables determinarán la rentabilidad futura de las diferentes compañías, que son el precio y las expectativas. Por poner un ejemplo, algunas empresas como Palantir o Tesla, en mi opinión, cotizan con primas de valoración que podrían ser excesivas si no cumplen con las altas expectativas del mercado. Por otra parte, empresas presentes en la cartera de Tesys Internacional, como Amazon, Microsoft, Uber Tech, Paycom Software, Shopify o Salesforce, considero que cotizan a precios razonables. Éstas generan grandes cantidades de efectivo, tienen balances sólidos e invierten fuertemente en nuevas tecnologías. Aunque sus valoraciones actuales puedan parecer altas, en mi opinión son más fáciles de justificar y menos exigentes que las comentadas al principio, por sus sólidas ventajas competitivas y su mayor previsibilidad en el crecimiento futuro de sus ventas. Estas grandes fortalezas hacen que sea difícil encontrarlas en el mercado sin una prima en sus valoraciones y dé la sensación de que siempre están caras. Este argumento no quiere decir que, en el corto plazo, y por resultados trimestrales por debajo de las expectativas de los analistas, se puedan provocar fuertes caídas en sus cotizaciones, lo que, según la compañía y las alternativas de mercado, podría generar oportunidades de inversión para el largo plazo".
Por su parte, Terry Ewing, director de Renta Variable de Mediolanum International Funds, subraya que la aparición de Deepseek, con una eficiencia de computación mucho mayor, representa la primera amenaza potencial tanto para el sentimiento como para los fundamentos en el espacio de la IA. Como resultado, los inversores pueden sentirse más inclinados a cuestionar las valoraciones del sector. La narrativa de la inversión en IA puede cambiar desde quién puede conseguir más unidades de procesamiento de gráficos (GPU) a aquellos cuyos modelos serán los más eficientes.
"Aunque los avances de Deepseek se basan fundamentalmente en el software y son de código abierto, podrían tener implicaciones tangibles para la inversión futura en proveedores de hardware como Nvidia, que podría enfrentarse a cambios de opinión y posibles ajustes de las estimaciones de futuro. Cualquier reducción de los costes de hardware podría acelerar la adopción de la IA, lo que beneficiaría a las empresas que logren una implantación más rápida y una menor carga de costes", argumenta