Astera Labs ha presentado un switch PCIe 6.0 con 320 lanes que, sobre el papel, permite construir dominios de escala muy superiores a los habituales y conectar hasta 80 aceleradores usando únicamente PCIe. La compañía mostró el Scorpio X-Series en Computex y sitúa la pieza en el centro de soluciones para clusters multi-GPU, piscinas compartidas de memoria y desagregación de infraestructuras en centros de datos.
¿Qué ofrece este switch PCIe 6.0?
El Scorpio X-Series aporta 320 lanes PCIe 6.0 y 20 Tbps de ancho de conmutación, frente a los 144 lanes y 9 Tbps de la generación anterior. En la práctica, esto significa dominios de escala mayores: Astera Labs asegura que un único switch puede dar conectividad all-to-all a hasta 80 aceleradores, mientras que los diseños basados en switches de 144 lanes se quedan en torno a 32 aceleradores por unidad.
La arquitectura reduce el número de saltos de switch en clusters grandes. Para despliegues con más de 64 aceleradores, la firma afirma que pasa de hasta tres saltos a uno solo y que el recuento total de switches puede caer entre 4x y 6x, manteniendo topologías con conectividad completa entre dispositivos.
En la demo pública la compañía utilizó tarjetas Intel Arc B70 Pro, aunque admite que despliegues reales aprovecharán hardware más avanzado. El interés del producto es ser agnóstico respecto del proveedor: cualquier acelerador con conectividad PCIe estándar es compatible, ya sea AMD Instinct MI350P, Nvidia RTX 6000 Blackwell u otras tarjetas que no dispongan de enlaces propietarios tipo NVLink.
Tecnologías clave: Hypercast, In-Network Compute y memoria semántica
Una de las funciones más destacadas es Hypercast, un motor de replicación de datos en hardware pensado para patrones de comunicación intensivos en modelos de IA, como los de mezcla de expertos (MoE). Según Astera, MoE genera multicast masivos entre aceleradores y los switches tradicionales acaban repitiendo transmisiones o reconfigurando grupos con lentitud. Hypercast pretende gestionar estos flujos directamente en hardware y reducir la sobrecarga en GPU.
El switch también integra motores de In-Network Compute para descargar operaciones colectivas comunes en entrenamiento distribuido: AllReduce, ReduceScatter, AllGather, AllScatter y todos los intercambios all-to-all. Astera indica que, en ciertos workloads, estas capacidades pueden recortar la latencia de comunicación en más del 50%.
Otra pieza importante es la conectividad con memoria semántica, que permite a los procesadores acceder a recursos adheridos a la red mediante operaciones nativas de carga y almacenamiento, en lugar de transacciones controladas por software. Esto reduce la sobrecarga del host y mejora la eficiencia del tejido a gran escala.
Limitaciones, dudas y contexto real
Lo que Astera Labs no aclara todavía es el rendimiento sostenido en condiciones de producción a gran escala. La compañía recibió los chips de la serie Scorpio X hace solo ocho semanas y aún no ha mostrado un cluster funcional con 80 aceleradores —algo que no es trivial por disponibilidad de hardware y pruebas de integridad.
En la práctica, hay compensaciones: aunque el switch ofrece conectividad all-to-all similar a la de sistemas con redes propietarias (la comparativa que se hace con NVL72 de Nvidia), la compañía reconoce que se conseguirán menor ancho de banda y mayores latencias respecto a interconexiones dedicadas de los fabricantes de GPU. Eso no lo hace inútil, pero sí condiciona el tipo de cargas que se beneficiarán más: tareas que necesitan escala y heterogeneidad de hardware o que priorizan memoria compartida sobre latencia extrema.
Otro punto no menor: la compatibilidad «vendor-agnostic» reduce el bloqueo de proveedor, pero plantea retos operativos. Gestionar pools con decenas de aceleradores distintos exige software de orquestación y control coherente; Astera está muestreando el producto con hyperscalers, pero habrá que ver qué herramientas de gestión y qué soporte de software ofrecen los partners del ecosistema.
La compañía afirma que la producción se rampeará en la segunda mitad de 2026 y que ya está en fase de muestreo con grandes clientes. Hasta entonces, las pruebas de laboratorio y las demos en ferias serán el principal escaparate.
Qué significa para centros de datos y proyectos de IA
En entornos donde las redes propietarias no son viables —por coste, diversidad de aceleradores o necesidades de desagregación—, un switch PCIe 6.0 con 320 lanes abre posibilidades reales: construir pools de memoria compartida para inferencia de gran escala, escalar clusters multi-GPU sin depender de enlaces NVLink propietarios o experimentar con topologías personalizadas para cargas específicas de IA.
En la práctica, esto puede simplificar despliegues donde se busque flexibilidad y reducción de costes a nivel de interconexión. No es un sustituto directo de enlaces de alta velocidad diseñados por fabricantes de GPU para entrenamiento extremo, pero sí ofrece una alternativa interesante para operaciones que valoran la interoperabilidad y la capacidad de mezclar aceleradores.
No es un detalle menor: si Astera logra entregar el rendimiento prometido y un stack de software robusto, proveedores de servicios y centros de datos obtendrían una vía para densificar recursos aceleradores sin recurrir a soluciones propietarias. Pero habrá que ver si las mejoras en latencia y ancho de banda anunciadas son suficientes para cargas reales de entrenamiento distribuido a gran escala.
Vale la pena esperar a verlo en condiciones reales antes de sacar conclusiones definitivas. Por ahora, el Scorpio X-Series es una apuesta técnica sólida sobre el papel: más lanes, más ancho de banda y funciones pensadas para IA. Lo que falta saber es cómo se comportará cuando tenga que mover petabytes de estado y coordinar cientos de aceleradores en un entorno de producción.


