Inteligencia artificial
Edge AI: Por qué AMD es la mejor jugada de valor para 2026

La inteligencia artificial (IA) es uno de los principales disruptores tecnológicos de esta década, impulsando cambios fundamentales en industrias y la sociedad en general.
Los datos muestran que aproximadamente una de cada seis personas en todo el mundo están usando herramientas de IA generativa. Además, el 90 % de los trabajadores tecnológicos ya utilizan IA en sus empleos. A pesar de esta adopción, se proyecta que la industria de IA crecerá alrededor de 9 veces para 2033.
Con esta adopción masiva llegan los crecientes costos de cómputo, los desafíos de latencia y las crecientes preocupaciones sobre seguridad, consumo de energía y escalabilidad. Las empresas están comprendiendo que enviar constantemente datos a servidores remotos para la inferencia de IA —computación en la nube o IA en la nube— es costoso, lento y conlleva riesgos de privacidad.
En la IA en la nube, las empresas aprovechan los vastos recursos de plataformas como AWS, Azure y Google Cloud para ofrecer servicios de IA. Esto permite a los usuarios acceder a modelos de IA bajo demanda a través de internet sin construir su propia infraestructura.
La base de la IA en la nube son los hiperescaladores —centros de datos de IA masivos que brindan una escalabilidad extrema para manejar cargas de trabajo mucho más allá de las capacidades tradicionales on‑premise. Con sus extensas matrices horizontales de servidores, proporcionan a las empresas los recursos para acceder, construir, entrenar, desplegar y mantener aplicaciones de IA de manera eficiente.
Esta combinación de computación en la nube e IA ofrece beneficios de eficiencia de costos, escalabilidad y la capacidad de aprovechar modelos compartidos. Pero al mismo tiempo, tiene desventajas significativas, incluidos altos costos recurrentes debido a recursos computacionales, almacenamiento, transferencia de datos y la experiencia especializada requerida para su uso continuo.
Otros problemas que enfrenta la IA en la nube incluyen latencia, riesgos de seguridad, privacidad de datos, dependencia de internet, control limitado y bloqueo del proveedor.
Con la nube demostrando ser costosa y desafiante para aplicaciones de consumo, portátiles, sistemas industriales y casos de uso en tiempo real, las empresas están girando hacia la “IA en el borde”. Realizar inferencia local en el dispositivo en lugar de depender de costosas GPU en la nube está remodelando cómo se despliega la IA más allá de los centros de datos.
Desliza para desplazarte →
| Dimensión | IA en la Nube (Inferencia Centralizada) | IA en el Borde (Inferencia en el Dispositivo / Local) |
|---|---|---|
| Latencia | Los viajes de ida y vuelta de la red añaden retraso; variable bajo carga | Respuestas de clase milisegundo; rendimiento estable |
| Economía de Unidad | Facturas recurrentes de GPU + ancho de banda + almacenamiento | Costo inicial de silicio; amortizado durante la vida del dispositivo |
| Privacidad y Cumplimiento | Los datos salen del dispositivo; mayor exposición + carga de gobernanza | Los datos sensibles pueden permanecer locales; menor superficie de exposición |
| Confiabilidad | Dependiente de internet + disponibilidad del servicio | Funciona sin conexión o en redes degradadas |
| Escalabilidad | Escala mediante la capacidad del centro de datos y el suministro de GPU | Escala distribuyendo la inferencia entre los puntos finales |
| Mejor Ajuste | Entrenamiento, inferencia masiva por lotes, analítica centralizada | Aplicaciones en tiempo real: PC, robótica, vehículos, cámaras, industrial |
IA en el Borde Explicada: Por qué la Inferencia se Mueve al Dispositivo

La industria está experimentando un cambio estratégico y arquitectónico hacia la IA en el Borde, trasladando la IA de centros de datos centralizados y de gran consumo energético hacia hardware de inferencia local.
En la IA en el Borde, la inteligencia artificial se combina con la computación perimetral para eliminar la dependencia de la nube al permitir que los dispositivos procesen datos localmente. “Borde” aquí se refiere al dispositivo que se usa —como un teléfono, coche, cámara, TV, sensor o dispositivo médico— por lo que la computación perimetral significa que la computadora diseñada para procesar datos está cerca o dentro de ese dispositivo.
Además de los dispositivos perimetrales que recopilan y procesan datos, otros componentes clave incluyen modelos de IA entrenados en la nube y desplegados en el borde, así como chips de hardware especializados que manejan eficientemente tareas de IA localmente.
Con este giro hacia dispositivos de bajo consumo energético, el objetivo es abordar problemas críticos de latencia y privacidad de datos al habilitar el procesamiento en tiempo real en los dispositivos de los usuarios, donde los datos se generan realmente.
Esto significa que, en lugar de enviar datos a un centro de datos externo, los cálculos se realizan cerca de la fuente, permitiendo que los dispositivos tomen decisiones en milisegundos sin requerir una conexión a internet. Los datos se utilizan esencialmente justo cuando son creados por el dispositivo.
Este procesamiento en tiempo real es crucial para la robótica, los vehículos autónomos y las aplicaciones de vigilancia que requieren tiempos de respuesta rápidos.
La computación perimetral también alivia la pesada carga sobre los centros de datos al eliminar la necesidad de mover datos de ida y vuelta. En la IA en el Borde, solo los datos relevantes se envían a la nube, reduciendo los requisitos de ancho de banda y los costos asociados.
Además de la rentabilidad, pasar de centros de datos a escala de gigavatios a dispositivos ofrece la ventaja de la eficiencia energética, ya que pueden ejecutar IA con un consumo mínimo. Al mantener los datos sensibles localmente, las empresas pueden abordar aún más las preocupaciones de seguridad, protegiendo contra accesos no autorizados y brechas de datos.
Gracias a los beneficios de velocidad, costo, privacidad y eficiencia energética, la inferencia de IA se está realizando cada vez más en el borde.
En IA, la inferencia es la operación real del modelo —un proceso que comienza después de que un modelo ha sido entrenado y deja de aprender. La inferencia es cuando el modelo comienza a trabajar, extrayendo conclusiones de los datos y convirtiendo ese conocimiento en resultados del mundo real.
La inferencia local se refiere a ejecutar modelos de IA directamente en la máquina del usuario usando silicio especializado, como NPUs (Unidades de Procesamiento Neural) integradas en CPUs o sistemas en chip (SoC), en lugar de enviar cada solicitud a una GPU en la nube.
Las NPUs son chips de IA optimizados para cálculos complejos en tareas de aprendizaje profundo como procesamiento de lenguaje natural, procesamiento de voz, detección de objetos y reconocimiento de imágenes. Estos chips aceleradores de IA especializados permiten una inferencia rápida en el dispositivo con un consumo mínimo de energía, habilitando aplicaciones en tiempo real.
En la práctica, la inferencia local significa que su portátil, PC, sistema embebido o incluso smartphone pueden ejecutar grandes modelos de lenguaje (consultas LLM), modelos de visión o cargas de trabajo de asistente sin recurrir a servidores grandes, costosos y potentes.
Esto reduce la latencia, disminuye los costos de ancho de banda, mejora la privacidad y reduce las facturas de servidores. Debido a que los sistemas de IA en el Borde pueden operar sin conectividad constante a internet, ofrecen mayor confiabilidad, haciéndolos adecuados para áreas remotas.
A medida que las cargas de trabajo de IA escalan de la experimentación al uso cotidiano, este cambio hacia la inferencia local ya no es teórico sino una necesidad, ya que miles de millones de dispositivos adquieren capacidades de IA y la inferencia basada en la nube se vuelve insostenible a gran escala.
Las estimaciones de investigación de mercado de Edge AI indican que los procesadores de IA en el borde podrían valer casi 60 mil millones de dólares a finales de esta década, frente a 9 mil millones en 2020, impulsados en gran medida por el cómputo local en PC y dispositivos.
Ya este año, la tendencia de inferencia local ha pasado de demostraciones de investigación a productos reales, como se mostró en el CES 2026, donde se demostraron decenas de PC con IA y factores de forma perimetrales con capacidades de inferencia en el dispositivo.
Por ejemplo, Ambarella lanzó su SoC de visión CV7 con procesamiento avanzado de IA en el dispositivo para diversas aplicaciones de percepción en tiempo real. Qualcomm reforzó la integración vertical para “computación inteligente en todas partes” con sus PC Snapdragon X Elite Gen 2. Broadcom también se está enfocando en integrar “Neural Engines” en los procesadores para habilitar IA local, apuntando específicamente a aplicaciones de hogares inteligentes.
En cuanto a gigantes como Apple (AAPL ) y NVIDIA (NVDA ), el primero está utilizando un modelo híbrido de IA en el dispositivo y “Private Cloud Compute”, mientras que el segundo está realizando una transición hacia “IA física” y procesamiento en el dispositivo.
La IA física, que extiende la IA más allá del mundo digital hacia la robótica, drones y maquinaria industrial, es una de las tendencias emergentes en el sector de IA en el Borde y se espera que sea un motor de crecimiento importante.
Por qué AMD está Posicionado para Ganar el Ciclo de Hardware de IA en el Borde
En el mundo de las acciones de IA en el Borde, uno de los nombres más destacados a observar es Advanced Micro Devices (AMD ), que desarrolla semiconductores, procesadores y GPU para centros de datos, IA, juegos y aplicaciones embebidas.
A principios de este mes, en CES 2026, la presidenta y directora ejecutiva de AMD, Lisa Su, compartió el objetivo de la compañía de ofrecer IA para todos mientras destacaba una estrategia de IA orientada al borde en PC, dispositivos embebidos y desarrolladores, reforzando el enfoque de la empresa en hardware de inferencia local más allá de los entornos de nube hiperescalada.
Como parte de este enfoque, la compañía presentó una nueva línea de procesadores de IA. Esto incluye el procesador Ryzen AI 400 Series para PC con IA, con NPUs integrados que ofrecen alrededor de 60 TOPS de cómputo de IA para inferencia local. Esta última versión de los chips de PC impulsados por IA de AMD cuenta con 12 núcleos de CPU y 24 hilos y permitirá una multitarea más rápida (1,3×) que sus competidores. También son 1,7× más rápidos en la creación de contenido.
Los PC, incluido el procesador Ryzen AI 400 Series, estarán disponibles en el trimestre actual.
En una rueda de prensa, Rahul Tikoo, vicepresidente senior y director general del negocio de clientes de AMD, señaló que ya han expandido a más de 250 plataformas de PC con IA, lo que representa un crecimiento de 2× respecto al año pasado. Dijo:
“En los próximos años, la IA será una tela multicapa que se entrelazará en cada nivel de la computación a nivel personal. Nuestros PC y dispositivos con IA transformarán cómo trabajamos, cómo jugamos, cómo creamos y cómo nos conectamos entre nosotros.”
AMD también presentó los chips Ryzen AI Max+ en la mayor feria de electrónica de consumo del mundo. Está dirigido a notebooks premium y mini‑PC para inferencia local avanzada, creación de contenido y juegos.
Para desarrolladores, AMD anunció la plataforma Ryzen AI Halo para el desarrollo de modelos en el dispositivo, lista para llevar potentes capacidades de desarrollo de IA a un PC de escritorio compacto en el próximo trimestre.
Su nuevo portafolio de procesadores x86 embebidos está diseñado para impulsar aplicaciones impulsadas por IA en el borde. Los nuevos procesadores de las series P100 y X100 ofrecen cómputo de IA de alto rendimiento para salud inteligente, cabinas digitales automotrices y robótica humanoide.
“No importa quién seas y cómo uses la tecnología a diario, la IA está remodelando la computación cotidiana. Tienes miles de interacciones con tu PC cada día. La IA puede comprender, aprender contexto, aportar automatización, proporcionar razonamiento profundo y personalización a cada individuo.”
– Rahul Tikoo, Senior VP & GM of Client Business
Con estos movimientos, el fabricante de chips estadounidense está apuntando a cargas de trabajo de IA en el dispositivo y contribuyendo al impulso de la industria hacia la inferencia local y la inteligencia distribuida en miles de millones de puntos finales.
Además de habilitar el cómputo de IA en el borde, la compañía ha exhibido sus procesadores de IA avanzados, que se utilizan en los bastidores de servidores de centros de datos. Una versión empresarial del chip de la serie MI400 (el MI440X) ha sido diseñada para uso on‑premise, pero no está específicamente diseñada para clústeres de IA.
Para satisfacer las futuras necesidades de cómputo de empresas como OpenAI, AMD también ha presentado la plataforma MI500, que la compañía afirma está diseñada para lograr aumentos de rendimiento de órdenes de magnitud a nivel de sistema y bastidor en comparación con generaciones anteriores, en lugar de una simple actualización de chip uno a uno. Los chips se lanzarán el próximo año.
Además de un impresionante portafolio de productos, AMD cuenta con una excelente lista de clientes, incluyendo OpenAI, Blue Origin, Liquid AI, Luma AI, World Labs, Illumina, Absci, AstraZeneca y Generative Bionics, que han aprovechado la tecnología de la compañía para convertir la promesa de la IA en un impacto real. Según Su:
“A medida que la adopción de IA se acelera, estamos entrando en la era de la computación a escala yotta, impulsada por un crecimiento sin precedentes tanto en entrenamiento como en inferencia. AMD está construyendo la base de cómputo para esta próxima fase de IA mediante liderazgo tecnológico de extremo a extremo, plataformas abiertas y una profunda co‑innovación con socios en todo el ecosistema.”
En una entrevista, ella señaló que, dada la demanda “increíble” de IA, que está “disparándose”, se requerirá una inversión masiva e inevitable en potencia de cómputo y hardware de vanguardia para mantenerse competitivos en el mercado de IA.
Según ella, el mundo necesitaría más de “10 yottaflops” de cómputo, “10 000 veces más cómputo que teníamos en 2022”, para seguir el ritmo del crecimiento de la IA. Y en línea con eso, compartió el plan de la compañía para una infraestructura a escala yotta, presentando la plataforma de rack “Helios” de AMD, que ofrecerá hasta 3 exaflops de rendimiento de IA en un solo rack.
En el mismo evento, el principal competidor de AMD, Nvidia, lanzó su plataforma Vera Rubin de próxima generación, que comprende seis chips y se espera que debuten a finales de este año.
Pero mientras Nvidia sigue enfocándose en la hiperescalabilidad con mega GPU de primera categoría y pilas empresariales, AMD adopta un enfoque diversificado en sus productos que habilitan la funcionalidad de IA a costos totales más bajos. Este contraste define cada vez más el debate AMD vs NVIDIA 2026.
AMD está reduciendo los precios de Nvidia en los chips “AI PC” para capturar una mayor cuota del emergente mercado de PC con IA, haciendo que los procesadores de alto rendimiento con IA sean más asequibles para OEM y consumidores. Como resultado, AMD es vista como una de las acciones de IA subvaloradas clave en el mercado.
Al 20 de enero de 2026, AMD, con una capitalización de mercado de 377,4 mil millones de dólares, cotiza a 231,87 $, con un aumento del 8,25 % en lo que va del año y del 90,87 % en el último año. Tiene un BPA (TTM) de 1,92 y una relación P/E (TTM) de 120,97.
(AMD )
La posición financiera de AMD también es sólida, con Jean Hu, vicepresidenta ejecutiva, directora financiera y tesorera de AMD, señalando: “Nuestras continuas inversiones en IA y computación de alto rendimiento están impulsando un crecimiento significativo y posicionando a AMD para ofrecer creación de valor a largo plazo.”
Esto se evidencia en los ingresos récord de la compañía global de semiconductores de 9,2 mil millones de dólares en el tercer trimestre de 2025. Esto incluye 4,3 mil millones de dólares del segmento de centros de datos, un aumento del 22 % interanual, 4 mil millones de dólares de ingresos combinados de clientes y juegos, un aumento del 73 % interanual, y 857 millones de dólares del segmento embebido, una caída del 8 % interanual.
Los ingresos de AMD aún no incluyen los envíos de sus chips Instinct MI308 a China, como sí lo hizo el trimestre pasado, aunque la compañía espera ingresos de ellos pronto. “Hemos recibido algunas licencias para el MI308,” señaló Su en ese momento. “Todavía estamos trabajando con nuestros clientes sobre el entorno de demanda y cuál es la oportunidad global.”
Su ingreso operativo para el período fue de 1,3 mil millones de dólares, y el ingreso neto de 1,2 mil millones, mientras que el margen bruto fue del 52 %. Su BPA diluido fue de 0,75 $.
“Entregamos un trimestre sobresaliente, con ingresos y rentabilidad récord que reflejan una demanda generalizada de nuestros procesadores EPYC y Ryzen de alto rendimiento y los aceleradores de IA Instinct,” dijo Su. Esto “marca un claro avance en nuestra trayectoria de crecimiento a medida que nuestra franquicia de cómputo se expande y el negocio de IA en centros de datos escala rápidamente, impulsando un crecimiento significativo de ingresos y ganancias,” añadió.
En ese momento, el gigante de semiconductores señaló que el impulso de los clientes para sus plataformas de IA se está acelerando, como se evidencia en sus asociaciones cada vez más profundas con OpenAI, Oracle (ORCL ), Cisco (CSCO ), IBM (IBM ), y Cohere.
El Departamento de Energía de EE. UU. también formó una asociación de 1 mil millones de dólares con AMD para construir dos supercomputadoras de próxima generación que “impulsarán” avances en el desarrollo de fármacos, energía nuclear y tecnologías de seguridad nacional. La primera se llama Lux y será alimentada por chips de IA MI355X y chips de redes, convirtiéndose en la primera supercomputadora fábrica de IA de EE. UU. La supercomputadora Discovery, más avanzada, se basará en la serie de chips de IA MI430.
Para el último trimestre, AMD espera ingresos de aproximadamente 9,6 mil millones de dólares y un margen bruto no GAAP del 54,5 %.
La semana pasada, el socio fabricante de AMD, TSMC, que es el mayor fabricante de chips por contrato, también superó las estimaciones de ingresos al reportar un aumento del 35 % en su beneficio del cuarto trimestre. La compañía espera aumentar el gasto de capital este año, señalando confianza en la expansión de IA.
“Esperamos que nuestro negocio sea respaldado por la continua fuerte demanda de nuestras tecnologías de proceso de vanguardia.”
– Wendell Huang, CFO de TSMC
Así, mientras intenta mantenerse al ritmo de Nvidia, AMD está profundizando en aceleradores de IA, computación enfocada en el borde y plataformas rentables, posicionándose como una alternativa atractiva basada en el valor en el panorama de IA en evolución.
IA en el Borde es el Próximo Gran Ciclo de Hardware
El panorama de IA está evolucionando a un ritmo rápido, integrándose en todo, desde teléfonos inteligentes hasta dispositivos portátiles, pantallas, drones, robots y vehículos autónomos. A medida que los modelos de IA se vuelven más eficientes y el uso de la tecnología pasa de la experimentación al despliegue y la escalada, la industria está pasando de la nube al borde para seguir el ritmo del auge de la IA.
Mientras Nvidia sigue dominando el entrenamiento en centros de datos y la inferencia hiperescalada con GPU de alta gama y bloqueo del ecosistema, el ciclo de hardware ahora se está trasladando de los centros de datos centralizados a los dispositivos cotidianos, donde el valor, la eficiencia y el precio son lo más importante. En esta nueva era de IA a nivel de dispositivo, AMD destaca por su enfoque estratégico en la inferencia local, NPUs integradas y procesadores de PC con IA, lo que la convierte en una jugada de valor convincente en 2026.
La IA en el Borde aún está en sus primeras etapas, pero su potencial es enorme. Al incrustar inteligencia en cada dispositivo, puede permitir que la IA opere en todas partes, independientemente de la conectividad a internet. Y a medida que todo se convierte en una computadora, la oportunidad para la IA en el Borde podría resultar gigantesca, incluso mayor que la nube. Pero en lugar de reemplazarla, el futuro de la IA probablemente será híbrido, con plataformas en la nube manejando el entrenamiento y los dispositivos de borde proporcionando inferencia en tiempo real, marcando el próximo gran paradigma informático.












