Inteligencia artificial
La IA se Encuentra con la Eficiencia: Un Nuevo Chip Reduce el Consumo de Energía de los LLM en un 50%

El actual auge de la inteligencia artificial (IA) está provocando un aumento de los centros de datos, lo que genera una enorme demanda de energía para operar y enfriar los servidores que albergan.
Aunque existen más de 8.000 centros de datos en todo el mundo, la mayoría en EE. UU., este número aumentará sustancialmente en los próximos años.
Según la estimación del Boston Consulting Group, la demanda de centros de datos aumentará entre un 15 % y un 20 % cada año hasta 2030. En ese momento, la firma espera que representen el 16 % del consumo total de energía de EE. UU., frente al escaso 2,5 % antes del lanzamiento de ChatGPT de OpenAI en 2022.
Mientras tanto, el informe especial de Energía e IA de la Agencia Internacional de Energía (IEA) publicado este año, espera que la demanda de electricidad de los centros de datos a nivel mundial al menos se duplique para finales de esta década, alcanzando aproximadamente 945 TWh. Eso equivale casi al consumo actual de Japón.
La organización intergubernamental autónoma con sede en París informa que la IA es el principal impulsor de este aumento, y se proyecta que la demanda eléctrica de los centros de datos optimizados para IA se cuadruplique para 2030.
En EE. UU., el consumo de energía de los centros de datos ya representará aproximadamente la mitad del crecimiento de la demanda eléctrica entre ahora y 2030. Impulsada por el uso de IA, la economía estadounidense, según el informe, consumirá más electricidad para procesar datos en ese momento que para fabricar todos los productos intensivos en energía combinados.
Este apetito insaciable por energía representa un problema enorme para el avance y la adopción de la IA. Sin embargo, la buena noticia es el número creciente de investigadores y empresas que trabajan en reducir el consumo energético de la IA y hacerlo más eficiente.
Lo interesante de estos esfuerzos es que muchos de ellos utilizan la IA para abordar sus propios desafíos energéticos.
Este mismo mes, un equipo de investigadores demostró un nuevo chip que utiliza IA para reducir la huella energética de los grandes modelos de lenguaje (LLM) en un 50 %, marcando un avance importante para que los LLM sean rentables y más sostenibles de ejecutar.
Nuevo Chip Aprovecha la IA para Reducir el Consumo de Energía de los LLM

Investigadores de la Facultad de Ingeniería de la Universidad Estatal de Oregón desarrollaron el nuevo chip de IA eficiente para resolver el enorme problema de consumo eléctrico de aplicaciones de IA basadas en LLM como GPT-4 de OpenAI y Gemini de Google.
A type of machine learning (ML) model, a large language model (LLM) is pre-trained on vast amounts of data to perform natural language processing (NLP) tasks like text generation, summarization, simplification, text reasoning, language translation, and more.
Los chatbots más populares y ampliamente usados hoy incluyen GPT-4o, o3 y o1 de OpenAI, Gemini y Gemma de Google, Llama de Meta, R1 y V3 de DeepSeek, Claude de Anthropic, Nova de Amazon, Phi de Microsoft y Grok de xAI.
En los últimos años, los LLM han transformado por completo el campo de la IA al permitir que las máquinas comprendan y generen texto similar al humano con mayor precisión. Sin embargo, esta evolución de los LLM ha provocado un aumento exponencial de su tamaño.
El tamaño de un LLM, medido por su número de parámetros, es el principal impulsor de su consumo energético. Esto significa que cuanto mayor es el modelo, mayor es su necesidad de potencia computacional para entrenamiento e inferencia.
Por ejemplo, ChatGPT-1 tenía poco menos de 120 millones de parámetros, que aumentaron a 175 mil millones con GPT-3 y luego a aproximadamente 1,8 billones de parámetros con GPT-4.
Este inmenso aumento en el tamaño y la capacidad de los LLM implica que su consumo energético también está creciendo a una escala sin precedentes. Además del tamaño del modelo, factores como el tipo de hardware usado para entrenar estos LLM, la duración del proceso de entrenamiento, la infraestructura (es decir, los centros de datos), el procesamiento de datos, la optimización del modelo y la eficiencia de los algoritmos influyen en el consumo energético de los LLM.
De ahí el nuevo chip de los investigadores de OSU. Según Tejasvi Anand, profesor asociado de ingeniería eléctrica en OSU que también dirige el Laboratorio de Circuitos y Sistemas de Señales Mixtas en la Universidad:
“El problema es que la energía requerida para transmitir un solo bit no se está reduciendo al mismo ritmo que aumenta la demanda de velocidad de datos. Eso es lo que está haciendo que los centros de datos usen tanta energía.”
Para superar este problema, el equipo diseñó y desarrolló un nuevo chip que consume solo la mitad de energía en comparación con los diseños convencionales.
Anand y el estudiante de doctorado Ramin Javad presentaron esta nueva tecnología en la Conferencia IEEE Custom Integrated Circuits (CIC), que se celebró en Boston el mes pasado. La conferencia, que alberga foros, paneles, exposiciones y presentaciones orales, está dedicada al desarrollo de IC, que sirven como bloque de construcción de los sistemas electrónicos modernos al proporcionar funcionalidad y potencia de procesamiento en un paquete compacto y eficiente.
La última tecnología se construyó con el apoyo del Center for Ubiquitous Connectivity (CUbiC), la Semiconductor Research Corporation (SRC) y la Defense Advanced Research Projects Agency (DARPA). Además, Javadi recibió el Premio al Mejor Artículo de Estudiante en la conferencia.
Para el nuevo chip, los investigadores realmente aprovecharon principios de IA que, según Javadi, reducen el uso de electricidad para el procesamiento de señales.
Como explicó, los LLM envían y reciben muchos datos a través de conexiones cableadas, que son enlaces de comunicación basados en cobre en los centros de datos. Todo este proceso requiere una energía significativa, por lo que una posible “solución es desarrollar chips de comunicación cableada más eficientes”.
Javadi también señaló que cuando se envían a altas velocidades, los datos se corrompen al final del receptor y, como resultado, necesitan ser limpiados. Para ello, la mayoría de los sistemas de comunicación cableada existentes utilizan un ecualizador, que consume mucha energía.
“Estamos usando esos principios de IA en el chip para recuperar los datos de una manera más inteligente y eficiente entrenando al clasificador del chip para reconocer y corregir los errores.”
– Javadi
Aunque es un gran desarrollo, esto es solo la versión inicial del chip. Su próxima iteración está actualmente en desarrollo para mejorar aún más su eficiencia energética.
En general, esta investigación continua muestra un gran potencial para tener implicaciones de gran alcance en el futuro de la infraestructura de IA y las operaciones de los centros de datos. Pero, por supuesto, eso requeriría la implementación exitosa de la tecnología a gran escala, lo cual nunca es una tarea fácil.
Haga clic aquí para aprender cómo la IA está revolucionando la ingeniería de microchips.
Domando el Apetito Energético de la IA con Avances en Todas las Capas
Este último desarrollo de chip es solo uno de los muchos proyectos de investigación que abordan el problema del consumo energético de la IA. Así que, echemos un vistazo breve a las formas innovadoras en que los investigadores lo han abordado.
Usando Luz para la Eficiencia Energética de la IA
A principios de este año, científicos de USST desarrollaron1 un chip de IA microscópico, más pequeño que una mota de polvo o un grano de sal, que utiliza luz para procesar datos de cables de fibra óptica. Esto promete cálculos más rápidos con menor consumo de energía.
El chip manipula la luz para realizar cálculos instantáneamente en lugar de interpretar señales de luz como lo hacen las computadoras tradicionales. Para ello, utiliza una “red neuronal profunda difractiva totalmente óptica”, una tecnología que emplea capas estructuradas y 3D‑impresas de componentes apilados. Aunque es innovador, desafíos como el diseño específico para tareas, la sensibilidad a imperfecciones y la dificultad de producción a gran escala deben superarse para lograr “funcionalidades sin precedentes” en imágenes endoscópicas, computación cuántica y centros de datos.
Unos meses antes, científicos del MIT también usaron luz para ejecutar las operaciones clave de una red neuronal en un chip, permitiendo cálculos de IA ultrarrápidos (en medio nanosegundo) con un 92 % de precisión y una enorme eficiencia energética.
“Este trabajo demuestra que la computación —en su esencia, el mapeo de entradas a salidas— puede compilarse en nuevas arquitecturas de física lineal y no lineal que permiten una ley de escalado fundamentalmente diferente de la computación respecto al esfuerzo necesario.”
– Autor principal Dirk Englund
Los científicos desarrollaron el chip fotónico2, que está compuesto por módulos interconectados que forman una red neuronal óptica. Notablemente, el uso de procesos de fundición comerciales para su fabricación permite que sea escalable e integrado en la electrónica. Además, los científicos superaron el desafío de la no linealidad en óptica diseñando unidades de función óptica no lineal (NOFUs) que combinan electrónica y óptica.
Una Herramienta de Software para el Entrenamiento de IA y un Sistema de Enfriamiento para Centros de Datos

Los investigadores de la Universidad de Michigan, mientras tanto, apuntaron al desperdicio de energía creado durante el entrenamiento de IA, más específicamente, cuando se divide entre GPUs, una necesidad para procesar enormes conjuntos de datos, de manera desigual.
Así, desarrollaron una herramienta de software llamada Perseus que identifica subtareas que tomarán más tiempo para completarse y luego reduce la velocidad de los procesadores que no están en este “camino crítico” para permitir que todos completen sus tareas simultáneamente, eliminando el uso innecesario de energía.
Esta herramienta de código abierto está disponible como parte de Zeus, una herramienta para medir y optimizar el consumo energético de la IA.
Mientras tanto, investigadores de la Universidad de Missouri se dedicaron a desarrollar un sistema de enfriamiento de próxima generación para ayudar a que los centros de datos sean más eficientes energéticamente. También están fabricando un sistema de enfriamiento para una fácil conexión y desconexión dentro de los bastidores de servidores.
“El enfriamiento y la fabricación de chips van de la mano. Sin un enfriamiento adecuado, los componentes se sobrecalientan y fallan. Los centros de datos energéticamente eficientes serán clave para el futuro de la computación de IA.”
– Chanwoo Park, profesor de ingeniería mecánica y aeroespacial en la Mizzou College of Engineering
Con el apoyo de $1.5 millones en financiación del programa COOLERCHIPS del DOE, el equipo desarrolló un sistema de enfriamiento de dos fases que disipa el calor de los chips de los servidores mediante cambio de fase. No solo puede funcionar pasivamente sin usar energía cuando se necesita menos enfriamiento, sino que incluso en modo activo, el sistema usa una cantidad muy pequeña.
CRAM Hardware Could Cut AI Energy Use by 1000x
El verano pasado, ingenieros de la Universidad de Minnesota Twin Cities desarrollaron un dispositivo de hardware avanzado3 que podría reducir el consumo energético de la IA en aproximadamente 1.000 veces.
Este nuevo modelo se llama memoria de acceso aleatorio computacional (CRAM), y aquí, los datos nunca abandonan la memoria; más bien, se procesan completamente dentro del arreglo de memoria, eliminando así la necesidad de transferencias de datos intensivas en energía y lentas.
Dos décadas en desarrollo, este estudio forma parte de los esfuerzos del equipo basados en la investigación patentada del autor principal Jian-Ping Wang sobre dispositivos de Uniones Túnel Magnéticas (MTJ). Estos dispositivos nanoestructurados se utilizan para mejorar sensores, discos duros y otros sistemas microelectrónicos como la Memoria de Acceso Aleatorio Magnética (MRAM).
“Como un sustrato de computación digital en‑memoria extremadamente eficiente energéticamente, CRAM es muy flexible ya que la computación puede realizarse en cualquier ubicación del arreglo de memoria,” señaló la co‑autora Ulya Karpuzcu, profesora asociada del Departamento de Ingeniería Eléctrica y de Computación. Además, puede reconfigurarse para adaptarse mejor a las necesidades de rendimiento de diferentes algoritmos.
IA Inspirada en el Cerebro: Reduciendo el Consumo de Energía al Imitar la Eficiencia Humana
Así, como vimos, los investigadores están analizando diferentes aspectos de la IA para abordar sus problemas energéticos. Curiosamente, también se inspiran en el cerebro humano. Esto tiene sentido, después de todo, la IA es la simulación de procesos de inteligencia humana por máquinas, aunque está lejos de pensar y razonar como un humano debido a su capacidad de generalizar a través de variaciones, siendo “significativamente más débil que la cognición humana”.
La investigación de reducción de energía inspirada en el cerebro incluye el trabajo del Profesor Asociado Chang Xu en el Centro de IA de Sídney, quien señaló que los LLM utilizan los recursos a plena capacidad, incluso para tareas simples, lo cual no es la forma correcta de operar. Explicó:
“Cuando piensas en un cerebro humano saludable – no dispara todas las neuronas ni usa todo su poder cerebral a la vez. Funciona con una eficiencia energética increíble, solo 20 vatios de potencia a pesar de tener alrededor de 100 mil millones de neuronas, que utiliza selectivamente de diferentes hemisferios del cerebro para realizar distintas tareas o pensamientos.”
Como tal, están desarrollando algoritmos que evitan los cálculos redundantes innecesarios y no entran en alta velocidad automáticamente.
En otros casos, la investigación se inspiró en la neuromodulación del cerebro y creó un algoritmo llamado ‘sistema de almacenamiento’ para reducir la energía en un 37 % sin degradación de precisión, la función de autorreparación de la célula cerebral llamada astrocitos para dispositivos de hardware, y obtuvieron una forma de computación neuromórfica (memristores) para trabajar juntos en varios subgrupos de redes neuronales.
Invertir en Inteligencia Artificial
Una empresa global de semiconductores, AMD (AMD ) es conocida por sus tecnologías de computación de alto rendimiento, gráficos y visualización. Mientras compite directamente con la querida de IA NVIDIA (NVDA ), está ganando terreno rápidamente en los mercados de centros de datos y aceleradores de IA. Su serie MI300 está dirigida específicamente a cargas de trabajo de IA de nueva generación y aplicaciones HPC.
Su presencia líder en el espacio de CPU para centros de datos, fuerte enfoque en I+D, crecimiento de ingresos, clientela y adquisiciones hacen de AMD un jugador fuerte en el sector.
Advanced Micro Devices (AMD )
En 2022, AMD realizó un acuerdo récord en la industria de chips valorado en $50 mil millones con la adquisición de Xilinx para convertirse en el líder de computación de alto rendimiento y adaptativa. Y más recientemente, completó la adquisición de ZT Systems para abordar la oportunidad de $500 mil millones en aceleradores de IA para centros de datos en 2028.
El desempeño del mercado de AMD también está recuperándose este año después de haber sido golpeado por turbulencias arancelarias. Al momento de escribir, las acciones de AMD cotizan a $120, con una caída del 6,9 % en lo que va del año pero solo alrededor del 47 % por debajo de su pico de marzo de 2024. Con eso, su capitalización de mercado es de $182,34 mil millones, con un EPS (TTM) de 1,36 y un P/E (TTM) de 82,44.
En cuanto a las finanzas de la compañía, AMD reportó un aumento interanual del 36 % en ingresos, alcanzando $7,4 mil millones en el Q1 de 2025, lo que la directora ejecutiva, la Dra. Lisa Su, calificó como “un comienzo sobresaliente” del año, “a pesar del entorno macro y regulatorio dinámico.” Este crecimiento fue impulsado por “la expansión del impulso en centros de datos e IA,” añadió.
Durante este período, el ingreso operativo de AMD fue de $806 millones, el ingreso neto de $709 millones y las ganancias diluidas por acción fueron $0,44. Para el Q2 de 2025, proyecta aproximadamente $7,4 mil millones en ingresos.
Algunos desarrollos clave de la compañía incluyen la expansión de alianzas estratégicas con Meta Platforms, Inc. (META ) (Llama), Alphabet Inc. (GOOGL ) (Gemma), Oracle Corporation (ORCL ), Core42, Dell Technologies (DELL ), y otros. AMD, junto con Nokia, Cisco Systems, Inc. (CSCO ), y Jio, también anunciaron una nueva Plataforma de Telecomunicaciones Abierta de IA para ofrecer soluciones impulsadas por IA que mejoren la eficiencia, seguridad y capacidades.
Esta semana, AMD y Nvidia se asociaron con Humain, una subsidiaria centrada en IA del Fondo de Inversión Pública de Arabia Saudita, para suministrar semiconductores a un proyecto de centro de datos a gran escala que se espera tenga una capacidad de 500 MW.
Últimas Tendencias y Desarrollos de Advanced Micro Devices (AMD)
Conclusión
En los últimos años, la locura por la IA ha experimentado un crecimiento explosivo, y por buenas razones. Esta tecnología, después de todo, tiene un gran potencial para transformar una amplia gama de industrias, desde la salud, la manufactura y la ciencia de materiales hasta las finanzas, el entretenimiento, la educación, el comercio minorista y la ciberseguridad.
Sin embargo, el avance tecnológico, la creciente adopción y la posterior expansión de estos LLM han generado una demanda sustancial de energía, lo que contribuye a las emisiones de gases de efecto invernadero (GEI) y al cambio climático, aumenta los costos económicos y afecta la sostenibilidad de la tecnología.
Esto representa un gran desafío para la IA. Si queremos realizar plenamente su verdadero potencial en términos de reducción de costos, mayor productividad y mejor toma de decisiones a escala, los modelos deben alcanzar la rentabilidad y la sostenibilidad.
Lo positivo, sin embargo, es que investigadores de todo el mundo ya están trabajando arduamente para hacer que la IA sea energéticamente eficiente, como lo evidencia el chip impulsado por IA de Oregon State, lo que sugiere una fuerte posibilidad de alinear la innovación con la sostenibilidad.
Por supuesto, las tecnologías propuestas deben superar su mayor obstáculo para lograr un impacto real en el mundo: la escalabilidad. Aún así, una cosa es clara: el futuro de IA más verde es factible, ¡y está llegando!
Haga clic aquí para aprender todo sobre invertir en inteligencia artificial.
Estudios Referenciados:
1. Yu, H., Huang, Z., Lamon, S., Wu, J., Zhao, Z., Lin, D., Zhao, H., Zhang, J., Lu, C., Liu, H., Zhang, X., & Zhang, C. (2025). Transporte de imágenes totalmente óptico a través de una fibra multimodo usando una red neuronal difractiva miniaturizada en la faceta distal. Nature Photonics, 19, 486–493. https://doi.org/10.1038/s41566-025-01621-4
2. Bandyopadhyay, S., Sludds, A., Krastanov, S., Youssry, A., Zhang, L., Lian, C., Yu, S., Desiatov, B., Burek, M. J., Lukin, M. D., & Lončar, M. (2024). Red neuronal profunda fotónica de un solo chip con entrenamiento unidireccional. Nature Photonics, 18, 1335–1343. https://doi.org/10.1038/s41566-024-01567-z
3. Lv, Y., Zink, B. R., Bloom, R. P., Roy, A., Vaddi, K., Shang, L., & Manipatruni, S. (2024). Demostración experimental de memoria de acceso aleatorio computacional basada en uniones túnel magnéticas. npj Unconventional Computing, 1, 3. https://doi.org/10.1038/s44335-024-00003-3












