Inteligencia artificial
Tecnologías Emergentes que Están Dando Forma al Futuro del Hardware de Inteligencia Artificial

Un Nuevo Tipo de Computación
Con los últimos años de progreso exponencial en la tecnología de inteligencia artificial, los principales ganadores han sido los constructores de hardware de inteligencia artificial. Esto se debe a que la inteligencia artificial moderna, que utiliza principalmente la tecnología de redes neuronales, utiliza la potencia de cálculo de una manera muy diferente a la de los ordenadores clásicos.
En lugar de realizar cálculos complejos con un CPU potente, realizan miles o millones de cálculos más simples en paralelo.
(Puedes aprender más sobre cómo se inventaron y funcionan las redes neuronales en “Inversión en Logros del Premio Nobel – Redes Neuronales Artificiales, La Base de la IA“)
Hasta ahora, las tarjetas gráficas, o GPUs (Unidades de Procesamiento Gráfico), han sido la herramienta favorita para desarrollar la inteligencia artificial, lo que ha aumentado dramáticamente los ingresos y beneficios de los líderes del sector como Nvidia (NVDA ).
El mercado de hardware de inteligencia artificial se espera que siga creciendo excepcionalmente rápido, con un CAGR del 31,2% de 2025 a 2035

Fuente: Análisis de Raíces
Este período también debería ver la aparición de muchos nuevos tipos de hardware de inteligencia artificial, a medida que las GPUs reaprovechadas para cálculos de inteligencia artificial sean progresivamente reemplazadas por chips diseñados específicamente para esta aplicación.
A largo plazo, es probable que formas más exóticas de computación hagan su camino en el mercado de hardware de inteligencia artificial, desde diseños específicos de aplicación hasta chips no de silicio o incluso utilizando neuronas biológicas reales.
Cómo Funciona el Pensamiento de la IA
La diferencia fundamental entre los superordenadores clásicos y las IA es cómo se procesa la información. En lugar de resolver cálculos complejos, las redes neuronales crean nodos virtuales conectados en una red. Mientras que la red neuronal inicial contenía apenas unas pocas decenas de nodos, haciendo unos pocos cientos de conexiones, las redes neuronales modernas como las utilizadas por ChatGPT utilizan billones de conexiones posibles, alcanzando niveles de complejidad no muy diferentes a los del cerebro humano.

Fuente: Premio Nobel
Este método diferente de cálculo requiere hardware capaz de realizar millones de operaciones en paralelo, incluso si la potencia de cálculo dedicada a cada una es relativamente pequeña.
Afortunadamente, este es un tipo de hardware que ya ha estado en funcionamiento durante muchos años, como la representación gráfica utilizando GPUs, principalmente para simulación 3D y videojuegos, y también utiliza este tipo de cálculos simples en paralelo.
Es por esto que el ganador inicial (y actual) de la carrera para asegurar suficientes chips de inteligencia artificial ha sido Nvidia, el líder en el mercado de GPUs.
GPUs Cada Vez Más Rápidas
Con la invención de algoritmos más eficientes y el rápido progreso en la inteligencia artificial que crearon, las posibles aplicaciones de la inteligencia artificial explotaron en la década de 2020.
Esto llevó a una carrera cada vez más intensa para asegurar suficiente hardware, especialmente GPU de Nvidia en 2023.
En paralelo, las crecientes expectativas de las posibles aplicaciones de la inteligencia artificial requieren una inteligencia artificial cada vez más inteligente, lo que a su vez requiere más potencia de cálculo. Y mientras que asegurar más GPUs fue una solución, también se necesitaban GPUs mejores.
La industria respondió, con un crecimiento de 1.000 veces en rendimiento en menos de 8 años.

Fuente: NVIDIA
¿Puede Durar?
Hay signos de que el progreso en el rendimiento de las GPUs podría ralentizarse pronto. Primero, todas las mejoras “fáciles”, como hacer que las GPUs sean más grandes y con transistores más pequeños y densos, se están agotando. Entonces, las mejoras adicionales deben provenir de rediseños y innovaciones más radicales.
Problemas secundarios también están afectando a la industria. Por ejemplo, las GPUs más densas y potentes están produciendo mucha energía residual, hasta el punto de que más de lo mismo simplemente derretiría los chips.
Esta energía residual también es indicativa de mucha energía desperdiciada. Asegurar un suministro de energía estable y básico se está convirtiendo en un problema para las empresas de inteligencia artificial, con todas las empresas Big Tech apresurándose para asegurar el suministro desde centrales nucleares.
Por último, la computación de inteligencia artificial se está volviendo más especializada, con diferentes metodologías emergiendo en diferentes empresas y para diferentes aplicaciones, cada una con requisitos diferentes respecto a su hardware. Entonces, es probable que la era de las GPUs de propósito general utilizadas por todas las empresas de inteligencia artificial esté llegando a su fin, aunque sea lentamente.
La Era de la Super GPU
Hasta ahora, la mayoría de los centros de datos de inteligencia artificial han consistido en enlazar miles de GPUs en servidores dedicados.
La solución inmediata al creciente problema de sobrecalentamiento y consumo de energía es la construcción de hardware integrado que vaya más allá de simplemente acumular GPUs individuales.
Un paso importante en esta dirección es el reciente lanzamiento por parte de Nvidia de GB200 NVL72. Este hardware está diseñado para actuar como una sola GPU masiva, lo que lo hace mucho más potente que incluso el modelo H100 récord anterior.
Esto también debería ser mucho más eficiente en términos de energía, un punto crucial ya que la industria de la inteligencia artificial podría quedarse corta de energía antes de quedarse sin chips a la velocidad a la que se están construyendo los centros de datos de inteligencia artificial. Y más eficiencia de cálculo y energía significa menos energía residual, lo que resuelve temporalmente el problema de sobrecalentamiento.

Fuente: Nvidia
Actualmente, CoreWeave se ha convertido en el primer proveedor de nube con instancias Nvidia GB200 NVL72 generalmente disponibles.
(Puedes leer más sobre CoreWeave y su provisión de computación en la nube para inteligencia artificial a empresas que desarrollan soluciones de inteligencia artificial en “CoreWeave: El Hipescalador de Nube de Inteligencia Artificial”).
Hardware de Inteligencia Artificial No GPU
Matrices de Puerta Programable en Campo (FPGAs)
Otro tipo de hardware utilizado para el desarrollo de inteligencia artificial es la Matriz de Puerta Programable en Campo. Las FPGAs son circuitos integrados que se pueden reprogramar para realizar tareas específicas de manera más eficiente. Funcionan teniendo interconexiones configurables entre sus componentes.
Esto puede hacer que las FPGAs sean más flexibles que las GPUs y tengan más potencial para la optimización de cálculos específicos.
Las FPGAs también son más eficientes en términos de energía que las GPUs. Su baja latencia (tiempo de reacción rápido) también las hace muy eficientes para aplicaciones en tiempo real que requieren reacciones rápidas.
Sin embargo, las FPGAs también son menos capaces de manejar cálculos muy exigentes que requieren mucha potencia.
Otro problema es que, si bien las FPGAs son reprogramables, este proceso puede ser largo y laborioso. Entonces, pueden ser mucho más lentas en diseño, construcción y programación. Esto puede ser un problema grave en un campo que está haciendo un progreso revolucionario cada 6 meses.
Esto significa que, hasta ahora, los casos de uso de las FPGAs se han concentrado en ciertas aplicaciones de inteligencia artificial, con el desarrollo general aún dependiendo de GPUs menos eficientes, pero de propósito general:
- Procesamiento en tiempo real: cuando los datos entrantes necesitan ser tratados rápidamente, como para el procesamiento de señales digitales, sistemas de radar, vehículos autónomos y telecomunicaciones.
- Aceleración de hardware personalizada: las FPGAs configurables pueden ajustarse para acelerar tareas de aprendizaje profundo y clústeres de alto rendimiento (HPC) optimizando para tipos de datos o algoritmos específicos.
- Entonces, los centros de datos de inteligencia artificial modernos podrían progresivamente convertirse en una mezcla de GPUs y FPGAs, con cada hardware dedicado a las subtareas que puede realizar mejor.
- Computación de borde: está moviendo las capacidades de cómputo y almacenamiento más cerca del usuario final, por ejemplo, directamente en un coche o un dron. En estos casos, el bajo consumo de energía y el tamaño compacto de las FPGAs son ventajas.
Circuitos Integrados Específicos de Aplicación (ASICs)
Los sistemas ASIC están diseñados para tipos de cálculo específicos y solo pueden realizar estos. Entonces, no es tanto un chip de computadora como un circuito integrado puro; las FPGAs a veces también se llaman ASICs programables.
La razón para usar ASICs en lugar de FPGAs o GPUs es que los ASICs son mucho más rápidos que cualquier otro dispositivo lógico. También son más eficientes en términos de energía y más pequeños en tamaño.
Es por esto que, por ejemplo, se utilizan mineros ASIC en la minería de criptomonedas, con el diseño optimizado para realizar el tipo específico de cálculo requerido.

Fuente: Wevolver
Sin embargo, los ASICs también son más complejos de diseñar, por lo que solo tiene sentido desarrollar uno para una tarea que se repetirá con suficiente frecuencia como para cubrir los costos de diseño.
En general, los ASICs tienen sentido económicamente solo cuando se consideran para producción masiva.
Los diseños personalizados también requieren conocimientos expertos, y los lenguajes de programación y bibliotecas ampliamente utilizados pueden no ser utilizables.
Esta necesidad de diseño personalizado puede ser, sin embargo, una ventaja también, ya que crea una protección adicional de propiedad intelectual (IP).












