Inteligencia artificial
Tecnologías emergentes que están dando forma al futuro del hardware de IA

Un nuevo tipo de computación
Con los últimos años de progreso exponencial en la tecnología de IA, los grandes ganadores han sido los constructores de hardware de IA. Esto se debe a que la IA moderna, que en su mayor parte utiliza tecnología de redes neuronales, emplea la potencia de cálculo de una manera muy diferente a la de los ordenadores clásicos.
En lugar de realizar cálculos complejos con una CPU potente, realizan miles o millones de cálculos más simples en paralelo.
(Puedes aprender más sobre cómo se inventaron y funcionan las redes neuronales en “Invertir en los logros del Premio Nobel – Redes Neuronales Artificiales, la base de la IA”)
Hasta ahora, las tarjetas gráficas, o GPUs (Unidades de procesamiento gráfico), han sido la herramienta preferida para desarrollar IA, impulsando dramáticamente los ingresos y beneficios de los líderes del sector como Nvidia (NVDA ).
Se espera que el mercado de hardware de IA siga creciendo excepcionalmente rápido, con una CAGR del 31,2 % de 2025 a 2035

Fuente: Roots Analysis
Este período también debería ver la aparición de muchos nuevos tipos de hardware de IA, ya que las GPUs reutilizadas para cálculos de IA son reemplazadas progresivamente por chips diseñados específicamente para esta aplicación.
A largo plazo, es probable que formas más exóticas de computación ingresen al mercado de hardware de IA, desde diseños específicos de aplicación hasta chips no de silicio o incluso el uso de neuronas biológicas reales.
Cómo funciona el pensamiento de la IA
La diferencia fundamental entre los superordenadores clásicos y las IAs es cómo se procesa la información. En lugar de resolver cálculos complejos, las redes neuronales crean nodos virtuales conectados en una red. Mientras que la red neuronal inicial contenía apenas unas pocas docenas de nodos, con unas pocas cientos de conexiones, las redes neuronales modernas como las que usa ChatGPT utilizan billones de posibles conexiones, alcanzando niveles de complejidad no muy diferentes al cerebro humano.

Fuente: Nobel Prize
Este método diferente de cálculo requiere hardware capaz de realizar millones de operaciones en paralelo, incluso si la potencia de cálculo dedicada a cada una es relativamente pequeña.
Afortunadamente, este es un tipo de hardware que ya ha estado en operación durante muchos años, como el renderizado gráfico mediante GPUs, mayormente para simulaciones 3D y videojuegos, y también utiliza este tipo de muchos cálculos pequeños en paralelo.
Esto es la razón por la que el ganador inicial (y actual) de la carrera por asegurar suficientes chips de IA ha sido Nvidia, el líder del mercado de GPUs.
GPUs cada vez más rápidas
Con la invención de algoritmos más eficientes y el rápido progreso en la inteligencia artificial que crearon, las aplicaciones potenciales de la IA explotaron en la década de 2020.
Esto llevó a una carrera cada vez mayor por asegurar suficiente hardware, especialmente GPUs de Nvidia en 2023.
Paralelamente, las crecientes expectativas de las aplicaciones potenciales de la IA requieren IAs cada vez más inteligentes, lo que a su vez necesita más potencia de cálculo. Y aunque asegurar más GPUs era una solución, también se necesitaban GPUs mejores.
La industria lo entregó, con un crecimiento de rendimiento de 1 000 × en menos de 8 años.

Fuente: NVIDIA
¿Puede durar?
Hay señales de que el progreso en el rendimiento de las GPUs podría desacelerarse pronto. Primero, todas las mejoras “fáciles”, como hacer GPUs más grandes y con transistores más pequeños y densos, están llegando a su límite. Por lo tanto, la mejora adicional debe provenir de rediseños e innovaciones más radicales.
Problemas secundarios también están acechando a la industria. Por ejemplo, GPUs mucho más densas y potentes están generando una gran cantidad de calor residual, hasta el punto de que más de lo mismo simplemente derretiría los chips.
Este calor residual también indica una gran cantidad de energía desperdiciada. Garantizar un suministro suficiente de energía estable y de base se está convirtiendo en un problema para las empresas de IA, con todas las grandes tecnológicas apresurándose a asegurar suministro de plantas nucleares.
Por último, la computación de IA se está volviendo más especializada, con diferentes metodologías emergiendo en distintas compañías y para distintas aplicaciones, cada una con requisitos diferentes respecto a su hardware. Así que, lo más probable es que la era de GPUs de propósito general usadas por todas las firmas de IA esté llegando a su fin, aunque lentamente.
La era de las super‑GPUs
Hasta ahora, la mayoría de los centros de datos de IA han consistido en enlazar miles de GPUs en servidores dedicados.
La solución inmediata al problema creciente de sobrecalentamiento y consumo de energía será la construcción de hardware integrado que vaya más allá de la mera acumulación de GPUs individuales.
Un paso importante en esa dirección es el reciente lanzamiento por Nvidia del GB200 NVL72. Este hardware está diseñado para actuar como una única GPU masiva, haciéndola mucho más potente que incluso el modelo H100, que previamente batía récords.
Esto también debería ser mucho más eficiente energéticamente, un punto crucial ya que la industria de IA podría quedarse sin energía antes de quedarse sin chips a la velocidad con la que se construyen los centros de datos de IA. Y más eficiencia de cómputo y energía significa menos calor residual, lo que también resuelve temporalmente el problema de sobrecalentamiento.

Fuente: Nvidia
Actualmente, CoreWeave se ha convertido en el primer proveedor de nube con instancias Nvidia GB200 NLV72 disponibles de forma general.
(Puedes leer más sobre CoreWeave y su provisión de computación en la nube para empresas que desarrollan soluciones de IA en “CoreWeave: el hiperescalador de IA en la nube”.
Hardware de IA no basado en GPU
Field Programmable Gate Arrays (FPGAs)
Otro tipo de hardware usado para el desarrollo de IA son los Field‑Programmable Gate Arrays. Las FPGA son circuitos integrados que pueden reprogramarse para realizar tareas específicas de manera más eficiente. Funcionan mediante interconexiones configurables entre sus componentes.

Fuente: Microcontrollers Labs
Esto puede hacer que las FPGA sean más flexibles que las GPUs y tengan mayor potencial de optimización para tipos específicos de cálculos.
Las FPGA también son más eficientes en consumo de energía que las GPUs. Su baja latencia (tiempo de reacción rápido) también las hace muy eficientes para aplicaciones del mundo real que requieren reacciones rápidas.
Sin embargo, las FPGA son menos capaces de manejar cálculos muy exigentes que requieren mucha potencia.
Otro problema es que, aunque las FPGA son reprogramables, este proceso puede ser intensivo en tiempo y mano de obra. Por lo tanto, pueden ser mucho más lentas de diseñar, construir y programar. Esto puede ser un serio inconveniente en un campo que avanza de forma revolucionaria cada seis meses.
Esto significa que, hasta ahora, los casos de uso de las FPGA se han concentrado en ciertas aplicaciones de IA, mientras que el desarrollo general sigue dependiendo de GPUs menos eficientes pero de propósito general:
- Procesamiento en tiempo real: cuando los datos entrantes deben tratarse rápidamente, como en procesamiento de señales digitales, sistemas de radar, vehículos autónomos y telecomunicaciones.
- Aceleración de hardware personalizada: Las FPGA configurables pueden ajustarse para acelerar tareas específicas de aprendizaje profundo y clústeres HPC optimizando tipos de datos o algoritmos concretos.
- Así, los centros de datos de IA modernos podrían convertirse progresivamente en una combinación de GPUs y FPGA, dedicando cada hardware a las subtareas que mejor pueda ejecutar.
- Computación perimetral: Esto implica mover capacidades de cómputo y almacenamiento más cerca del usuario final, por ejemplo, directamente en un coche o un dron. En estos casos, el bajo consumo de energía y el tamaño compacto de las FPGA son ventajas.
Application‑Specific Integrated Circuits (ASICs)
Los sistemas ASIC están construidos para tipos de cálculo específicos y solo pueden realizar esos cálculos. Por lo tanto, no son tanto un chip de ordenador como un circuito integrado puro; a veces las FPGA también se denominan ASIC programables.
La razón para usar ASICs en lugar de FPGA o GPUs es que los ASIC son mucho más rápidos que cualquier otro dispositivo lógico. También son más eficientes energéticamente y más pequeños.
Por eso, por ejemplo, los mineros ASIC se usan en la minería de criptomonedas, con un diseño optimizado para ejecutar el tipo de cálculo específico requerido.

Fuente: Wevolver
Sin embargo, los ASIC son también mucho más complejos de diseñar, por lo que solo tiene sentido desarrollar uno para una tarea que se repetirá con la frecuencia suficiente como para cubrir los costos de diseño. En general, los ASIC solo tienen sentido económico cuando se consideran para producción masiva.
Los diseños personalizados también requieren conocimientos expertos, y los lenguajes de programación y bibliotecas ampliamente usados pueden no ser utilizables.
Esta necesidad de diseño a medida puede, sin embargo, ser también una ventaja, ya que crea protección adicional de propiedad intelectual (IP).
Los casos de uso de los ASIC son similares a los de las FPGA: computación perimetral, reconocimiento de imágenes, telecomunicaciones y procesamiento de señales, pero incluso más que las FPGA requieren un cálculo que se repite con frecuencia.
Debido a que no son flexibles, también es poco probable que sean suficientes por sí solos para tareas complejas de IA. Sin embargo, podrían integrarse en un sistema de hardware de IA para darle mayor eficiencia y velocidad.
Empresas como Etched están desarrollando ASIC diseñados específicamente para realizar cálculos de transformadores (el “T” en chatGPT).

Fuente: Etched
Chips neuromórficos
Más allá de simplemente mejorar las GPUs o construir ASICs más eficientes, otros conceptos buscan cambiar completamente la forma en que se realiza la computación.
Una idea es que, si estamos diseñando una red neuronal, deberíamos tener una arquitectura de chip que la refleje.
Esta es la idea de los chips neuromórficos, que funcionan como neuronas interconectadas a nivel de hardware en lugar de simularlas mediante ecuaciones matemáticas complejas y millones de cálculos paralelos.
Estos dispositivos también se denominan a veces NPUs (Unidad de Procesamiento Neural), generalmente combinando muchos tipos diferentes de componentes en una sola unidad.
Los chips neuromórficos suelen usar señales eléctricas complejas, más cercanas a datos analógicos. Esto difiere de los “ordenadores normales” que usan un diseño de Von Neumann con señales binarias (0 & 1).

Fuente: Tech Target
Muchos métodos se están explorando actualmente para crear chips neuromórficos:
- Aprovechar la ferroelectricidad incipiente, un fenómeno aún poco comprendido.
- Sustrato activo usando vanadio o titanio.
- Uso de memristores, un nuevo tipo de componente electrónico, que puede realizar tareas de IA con 1/800ªdel consumo de energía normal.
Chips fotónicos
Otra opción para eludir muchas de las limitaciones actuales del hardware de silicio es pasar a ordenadores fotónicos. En lugar de que los electrones transporten la información, lo hacen los fotones de láser.
Este método tiene la ventaja de ser mucho menos vulnerable al sobrecalentamiento y de que la luz es lo que se mueve más rápido en el Universo.
Por ahora, la durabilidad de los componentes fotónicos, particularmente la memoria, ha sido un problema, pero esto está cambiando rápidamente.
Otros avances recientes en fotónica incluyen:
- Transistor de alta movilidad de electrones ferroelectrico (FeHEMT), que reduce el tamaño de los dispositivos de comunicación en smartphones.
- Perovskitas, más precisamente cristales CsPbBr3 (cesio‑plomo‑bromuro), que combinan fotónica con sustratos “normales” de silicio y galio‑arsénico.
- Escritura láser ultra‑rápida, para diseñar componentes fotónicos con nano‑grabado.
- Método de fabricación de fotónica de silicio multicapa.
- Uso de magnetita para crear ordenadores spintrónica‑fotónicos.
Uso de neuronas reales
Otra forma de impulsar la IA para que alcance un rendimiento similar al del cerebro real es quizá simplemente usar cerebros desde el principio.
Después de todo, si una red neuronal compuesta por neuronas reales puede ser altamente adaptable y sobresalir en el reconocimiento de patrones en la naturaleza, ¿por qué no funcionaría en un contexto más artificial?
En marzo de 2025, este concepto avanzó con el lanzamiento por Cortical Labs de CL1, la primera Inteligencia Biológica Sintética (SBI).

Fuente: Cortical Labs
Las neuronas reales se cultivan dentro de una solución rica en nutrientes, proporcionándoles todo lo necesario para mantenerse saludables. Crecen sobre un chip de silicio, que envía y recibe impulsos eléctricos dentro de la estructura neural.
Esto realmente difumina la línea entre la inteligencia artificial y la natural. ¿Sigue siendo artificial un ordenador hecho de neuronas reales?
Integramos las neuronas en el biOS con una mezcla de silicio duro y tejido blando. Puedes conectarte directamente a estas neuronas. Despliega código directamente a las neuronas reales y resuelve los desafíos más difíciles de hoy.
La neurona es auto‑programable, infinitamente flexible, y el resultado de cuatro mil millones de años de evolución. Lo que los modelos digitales de IA gastan enormes recursos intentando emular, nosotros lo iniciamos.
Esto podría ser un verdadero avance si algunas teorías que consideran al cerebro humano más como una computadora cuántica que como un sistema eléctrico resultan ser ciertas.
Aunque sigue siendo una tecnología emergente, podría recibir un impulso con los avances en campos afines, como la impresión 3D de órganos humanos, incluyendo tejido cerebral funcional, así como la producción de organoides (minicerebros) por empresas como Final Spark y BiologIC.
Interfaz cerebro‑computadora
Otra forma de impulsar el hardware de IA podría ser usarlo en una interfaz directa con otro tipo de super‑computadora biológica: el cerebro que ya está en nuestro cráneo y realiza nuestro pensamiento.
Al principio, las interfaces cerebro‑computadora (BCI) probablemente se usarán principalmente para ayudar a personas con afecciones neurológicas.
Nuevos métodos para hacer los implantes más duraderos y menos invasivos también deberían ayudar.
A largo plazo, esto también podría difuminar la línea entre la inteligencia de máquinas y la humana. Si piensas algo con la asistencia de una IA en interacción directa con nosotros a través de BCI, ¿quién hizo realmente el pensamiento?
Sin embargo, debido a preocupaciones éticas y de seguridad, es probable que esta sea una de las tecnologías más lejanas, a pesar de la anticipación de obras de ciencia ficción como Altered Carbon, Neuromancer o Cyberpunk 2077.
(Cubrimos las compañías más prominentes del sector en “5 mejores empresas de interfaces cerebro‑computadora (BCI)”.
¿Cuánta computación se necesita realmente?
DeepSeek
Durante muchos años, cada empresa de IA ha competido por añadir la mayor cantidad de cómputo lo más rápido posible, asumiendo que más siempre es mejor.
Esto fue desafiado por la brutal llegada de la empresa china de IA DeepSeek. Con un modelo de 10‑100 × más eficiente que sus competidores, y que cuesta solo entre el 3 % y el 5 % para un rendimiento equivalente o superior, DeepSeek ha cuestionado la necesidad de más potencia de cálculo para crear IAs mejores.
Una gran razón por la que DeepSeek se centró tanto en la eficiencia del modelo fue el acceso limitado de las empresas chinas de IA a chips de IA. Esto quedó claro cuando, poco después del lanzamiento, se reveló que los modelos de IA de otras firmas chinas rendían de forma impresionante: Qwen de Alibaba, Kimi de Moonshot AI, Doubao de ByteDance o Ernie Bot de Baidu.
Como dice el refrán, “la necesidad es la madre de la invención”.
Es probable que en los próximos años, un enfoque dual en mejor rendimiento y mayor eficiencia domine la industria de IA.
Sin embargo, esto no quiere decir que más cómputo no entregará mejores resultados. Simplemente, no es el único camino al éxito en la industria de IA, y compañías muy bien financiadas como OpenAI podrían haber sido un poco laxas con sus gastos.
Por ahora, la mayoría de las IAs han sido trabajos en progreso y diseños experimentales con aplicaciones limitadas. Cuanto más se integren en el flujo de trabajo de millones de empresas en todo el mundo, mayor será la necesidad de cómputo de IA.
Y cuanto más cómputo se necesite, mayor será la demanda de hardware más eficiente y menos intensivo en energía.
Así como ocurre con la computación tradicional, podemos asumir que el mercado seguirá exigiendo chips cada vez más mejorados, especialmente porque la IA podría pronto convertirse en uno de los mayores consumidores de energía del planeta.
EdgeAI & AI PCs
Otro efecto de la aparición de DeepSeek y otros modelos chinos de IA con menores requisitos de cómputo es que los modelos de IA, especialmente los “destilados”, ahora pueden ejecutarse en máquinas individuales de alta gama, en lugar de en gigantescos centros de datos de IA a escala de gigavatios.
Esto valida a los defensores de EdgeAI, que argumentan que gran parte del cómputo de IA debe realizarse “en el sitio”, en lugar de solo en la nube.
Como DeepSeek es un modelo de código abierto, también abre la puerta a muchos experimentos individuales con ordenadores de IA: lo suficientemente potentes para ejecutar modelos de IA, pero lo suficientemente baratos y pequeños como para que los compre gente individual. En conjunto, esto no lleva a una menor demanda de cómputo de IA, sino quizá a un proceso más descentralizado para desarrollar y usar aplicaciones de IA.
Así, los AI PCs probablemente serán la nueva gran tendencia en la construcción de ordenadores, con la prensa especializada ya discutiendo en detalle la cuestión y qué marca es la mejor, especialmente ahora que la IA se está introduciendo en la mayoría de las ofertas de empresas tecnológicas, incluido Microsoft (MSFT ), con Copilot convirtiéndose en casi omnipresente en Windows OS y otros softwares de la compañía.
Conclusión
Desde GPUs para juegos, el hardware para IA está evolucionando rápidamente. Esto comenzó con GPUs diseñadas para IA y está evolucionando hacia “super‑GPUs” diseñadas desde cero para encajar en centros de datos de IA con menor consumo de energía y producción de calor.
El siguiente paso probablemente será una mayor integración de GPUs generalistas con chips ASIC y FPGA para realizar tareas específicas de IA con menos energía y espacio.
Más adelante, la apuesta será sobre qué tecnología será la ganadora para el cómputo de IA: chips neuromórficos, fotónicos, spintrónicos o incluso neuronas biológicas reales entrenadas para interactuar con sustratos de silicio, y quizá IA interactuando directamente con nuestros propios cerebros a través de interfaces directas.
Para todas estas tecnologías, es seguro que el explosivo crecimiento en la capacidad de la IA y el explosivo crecimiento en sus aplicaciones mantendrán la demanda de hardware de IA más y mejor.
Así que, incluso si llegan al mercado modelos de IA más eficientes, como DeepSeek, la repentina oleada de demanda de AI PCs podría ser un buen indicador de que el hardware de IA probablemente seguirá estando algo escaso en comparación con la demanda en los próximos años.
Un líder en hardware de IA
Nvidia
(NVDA )
NVIDIA ha evolucionado de una empresa de semiconductores de nicho especializada en tarjetas gráficas a un gigante tecnológico a la vanguardia de la revolución de IA y de la enorme cantidad de hardware que necesita.
Esto se logró mediante el desarrollo de CUDA, una interfaz de programación de propósito general para las GPUs de NVIDIA, abriendo la puerta a usos más allá del gaming.
“Los investigadores se dieron cuenta de que al comprar esta tarjeta de juego llamada GeForce, la añades a tu ordenador y esencialmente tienes un superordenador personal. Dinámica molecular, procesamiento sísmico, reconstrucción de TC, procesamiento de imágenes… un montón de cosas diferentes.”
Jensen Huang, en una entrevista con Sequoia
Esta adopción más amplia de GPUs, y más específicamente del hardware NVIDIA, creó un bucle de retroalimentación positivo basado en efectos de red: cuantos más usos, más usuarios finales y programadores familiarizados con él, más ventas, más presupuesto de I+D, más aceleración en la velocidad de cómputo, más usos, etc.

Fuente: Nvidia
Hoy, la base instalada incluye cientos de millones de GPUs CUDA.
Otro aspecto notable de la evolución del poder de cómputo de IA es que sigue una ley exponencial en lugar de la ley más lineal de Moore para CPUs. Esto se debe a que no solo el hardware de GPU está mejorando, sino que la potencia de procesamiento requerida ha disminuido gracias a mejoras radicales en cómo se entrenan las redes neuronales.
Si bien es líder en GPU y IA, NVIDIA también está muy activa en el desarrollo de la computación cuántica como nuevo motor de crecimiento.
Al igual que desplegó CUDA para aplicaciones de redes neuronales, Nvidia ha lanzado CUDA‑Q para la computación cuántica, ofreciendo un sistema cuántico en la nube donde puedes alquilar capacidad de computación cuántica de NVIDIA a través de un servicio en la nube.

Fuente: NVIDIA
Esto también incluye tecnologías como cuQuantum de NVIDIA para que los investigadores emulen ordenadores cuánticos, cuPQC para encriptación cuántica y DGX Quantum para la integración de cómputo clásico y cuántico.
En conjunto, NVIDIA está a la vanguardia de la construcción de un ecosistema de computación cuántica, capitalizando su posición como líder en IA y hardware de IA.

Fuente: NVidia
Con una posición fuerte en IA, minería de criptomonedas y quizá pronto en computación cuántica, Nvidia está muy bien posicionada para ser una de las compañías de hardware de computación dominantes en la próxima década.
Puedes leer más sobre la historia, modelo de negocio e innovaciones de Nvidia en “NVIDIA (NVDA) Spotlight: De gigante gráfico a titán de IA”.











