El diseño mixto del superordenador Colossus 1 de Elon Musk ha resultado insuficiente para entrenar la inteligencia artificial Grok. Debido a problemas de eficiencia derivados de su arquitectura, el sistema está siendo utilizado por Anthropic únicamente para tareas de inferencia, mientras Musk desarrolla el Colossus 2 con un enfoque unificado destinado a entrenamientos complejos.
Limitaciones del superordenador Colossus 1 en el entrenamiento de inteligencia artificial
Colossus 1, el superordenador de xAI compuesto por 220.000 GPUs, fue originalmente diseñado con una arquitectura mixta que busca combinar distintos tipos de procesamiento. Sin embargo, esta solución no ha cumplido con las exigencias del entrenamiento de modelos extensos como Grok, la IA de xAI.
Anthropic, una de las compañías líderes en inteligencia artificial, ha optado por arrendar el supercluster completo Colossus 1 de SpaceX para ejecutar su modelo Claude. Así, logran aliviar los cuellos de botella computacionales que experimentan en sus propios sistemas, pero solo para tareas de inferencia, no para entrenamientos.
Colossus 2: un diseño unificado para entrenamiento avanzado
En lugar de mejorar el diseño mixto, Elon Musk está enfocado en crear el Colossus 2, un superordenador construido bajo una arquitectura unificada orientada específicamente a entrenamiento de inteligencia artificial. Este sistema estará destinado exclusivamente a soportar Blackwell, la próxima generación de modelos de IA en desarrollo.
Lo que Musk no aclara todavía es si este nuevo superordenador estará disponible también para otros usos o acceso externo. En la práctica, esto podría implicar un importante avance en capacidades si logra superar las limitaciones actuales. Además, se especula con que el Colossus 2 podría estar vinculado a una futura salida a bolsa de xAI o alguna entidad relacionada con la infraestructura de IA.
Implicaciones para el ecosistema de IA e infraestructura tecnológica
El hecho de que Anthropic utilice Colossus 1 solo para inferencia y no para entrenamiento no es un detalle menor: esto cambia cómo se entiende la viabilidad de las arquitecturas mixtas en supercomputación para IA.
Habrá que ver si el desarrollo y despliegue del Colossus 2 logra satisfacer las demandas que no alcanzó su predecesor y cómo esto influirá en la competencia dentro del sector. De momento, el alquiler de Colossus 1 a Anthropic también muestra que la gestión y distribución de recursos computacionales es clave para afrontar la complejidad creciente de estos modelos.
Vale la pena esperar a ver el Colossus 2 en condiciones reales para poder evaluar su rendimiento y si realmente justifica la apuesta y los posibles movimientos financieros asociados.
