Lexar quiere descargar modelos de IA locales en SSD durante la 'RAMpocalypse'

IA en SSD es la propuesta que Lexar ha puesto sobre la mesa para intentar aliviar la creciente demanda de memoria RAM cuando se ejecutan modelos de lenguaje y otros modelos de IA de manera local. La idea promete reducir la necesidad de ampliaciones de RAM en ordenadores y portátiles, pero levanta dudas técnicas y prácticas que la compañía aún no ha aclarado.

Que empresas de memoria miren hacia el almacenamiento para aliviar la “RAMpocalypse” no es sorprendente; los modelos grandes consumen gigabytes de memoria y el mercado busca alternativas más asequibles y escalables. Lo que Lexar propone, en esencia, es desplazar parte del trabajo de la RAM al SSD.

IA en SSD: cómo funcionaría y por qué importa

El mecanismo al que se refiere esta aproximación es similar a la paginación o al uso de memoria virtual: partes del modelo o sus pesos se mantienen en el disco y se cargan en RAM solo cuando son necesarias. Técnicas complementarias como la cuantización y el uso de modelos más pequeños ayudan a reducir el volumen de datos que debe moverse entre SSD y memoria.

En la práctica, esto significa que un ordenador con menos RAM podría ejecutar modelos locales pesados pagando el coste en latencia y en IOPS del SSD. Si el sistema aprovecha SSDs NVMe de alta velocidad y controladores optimizados, la penalización puede ser limitada para algunas cargas de trabajo, especialmente inferencia con modelos comprimidos.

- Publicidad -

Proyectos y herramientas ya usan enfoques parecidos: cargar modelos mediante mmap, emplear librerías como llama.cpp o formatos optimizados que permiten acceder a pesos desde disco sin tener que cargarlos íntegramente en memoria. Lexar busca posicionar sus SSD como la capa de almacenamiento pensada para este uso.

Limitaciones técnicas, costes y dudas sin resolver

Hay que ser realistas: un SSD, por muy rápido que sea, tiene una latencia y unas características de I/O muy distintas a la RAM. La latencia de acceso y la velocidad de escritura/lectura siguen siendo el principal cuello de botella frente a DRAM. Eso afecta especialmente a modelos que requieren acceso aleatorio frecuente a grandes matrices de pesos.

Lo que Lexar no aclara todavía es cómo planea gestionar la degradación por escrituras, las necesidades de IOPS sostenidos y el impacto en el rendimiento general del sistema cuando el SSD actúa como extensión de memoria. Tampoco hay detalles públicos sobre compatibilidad con frameworks de IA, controladores especializados o si la solución será transparente para desarrolladores y usuarios.

En términos de coste total, trasladar parte de la infraestructura a SSD puede ser una solución más barata que añadir grandes bancos de RAM en determinados equipos, pero no siempre. Los SSD NVMe de alto rendimiento no son económicos y su vida útil puede reducirse si se usan intensamente para swap de modelos.

Además, existen cuestiones de seguridad y privacidad: mantener pesos y datos en disco plantea riesgos distintos a los de tener todo en memoria volátil. Vale la pena esperar a verlo en condiciones reales antes de concluir que es una alternativa viable para despliegues sensibles o críticos.

No es un detalle menor: esto cambia cómo se diseñan las máquinas para IA local. Si los fabricantes apuestan por SSDs como extensión de memoria, podríamos ver configuraciones hardware y BIOS/firmware orientadas a priorizar I/O de modelos, y herramientas de software que gestionen el offloading con más granularidad.

En el lado positivo, para usuarios y jugadores interesados en asistentes locales, mods con IA o NPCs generados en el equipo, la posibilidad de ejecutar modelos sin necesidad de actualizar la RAM a lo grande resulta atractiva. Sin embargo, la experiencia real dependerá del empleo que se haga del modelo, su tamaño y de la infraestructura SSD utilizada.

Habrá que ver si Lexar ofrece ejemplos de rendimiento con modelos concretos, métricas reproducibles y comparativas frente a sistemas con más RAM. Las cifras de latencia por consulta, la tasa de aciertos de caché y el impacto en el resto de aplicaciones son los datos que realmente importan.

En resumen, la propuesta de Lexar sobre IA en SSD apunta a una solución pragmática para el problema de memoria que presentan muchos modelos locales. Es una idea con sentido técnico, pero no exenta de compromisos: latencia, coste de hardware rápido, desgaste del medio y necesidades de integración software robusta.

Lo que la compañía no aclara todavía es el alcance comercial: si será una función para consumidores, una oferta para integradores o un paquete dirigido a OEMs y centros de datos en pequeña escala. Tampoco hay fechas ni especificaciones técnicas públicas que permitan evaluar con rigor la viabilidad.

En cualquier caso, para quien esté considerando ejecutar modelos locales hoy, las alternativas siguen siendo las mismas: cuantización, modelos más pequeños optimizados para CPU, añadir RAM o recurrir a servicios remotos. La IA en SSD puede ser una opción intermedia interesante, pero no elimina por completo la necesidad de memoria y de una infraestructura bien diseñada.

Vale la pena esperar a verlo en condiciones reales y con pruebas abiertas antes de decidir si merece la inversión en SSDs de alto rendimiento para este fin.