Computación
Tecnología revolucionaria de multihilo simultáneo y heterogéneo para acelerar la computación

Aunque todos los nuevos dispositivos de gigantes tecnológicos como Apple y Google presentan mejoras incrementales —un aumento de un solo dígito en la duración de la batería, un nanómetro menos para el procesador, que aún no produce un rendimiento óptimo para los fabricantes, o unos pocos megapíxeles adicionales— surge la pregunta: ¿Son realmente suficientes esas modestas mejoras? ¿Es la solución añadir más hardware?
No, según el profesor asociado Hung-Wei Tseng del Departamento de Ingeniería Eléctrica y de Computación de la Universidad de California, Riverside (UCR). Él dice:
«No necesitas añadir nuevos procesadores porque ya los tienes.»
El profesor Tseng, junto con un equipo de investigadores, desarrolló un nuevo marco de software para procesamiento paralelo llamado Simultaneous and Heterogeneous Multi-threading (SHMT). Según los resultados iniciales, SHMT está preparado para mejorar significativamente la velocidad de procesamiento y reducir el consumo de energía al aprovechar las capacidades latentes de los procesadores actuales en computadoras personales, teléfonos móviles y otros dispositivos.
Alabado como “revolucionario” por la comunidad tecnológica, SHMT busca eliminar los cuellos de botella en el flujo de datos y facilitar la colaboración sin fisuras de muchas unidades de procesamiento. Este avance podría afectar no solo a la electrónica personal, sino también a los centros de datos y a otros tipos de computación masivamente paralela.
Desglosando el Cuello de Botella

Antes de aventurarnos a explorar todo el potencial de lo que es posible con el multihilo simultáneo y heterogéneo, comprendamos primero las limitaciones de los sistemas informáticos actuales.
En la mayoría de los dispositivos, varios componentes, como la unidad central de procesamiento (CPU), la unidad de procesamiento gráfico (GPU) y la unidad de procesamiento tensorial (TPU), manejan la información por separado. Los datos se transfieren de una unidad de procesamiento a otra, lo que a menudo genera “cuellos de botella” que obstaculizan el rendimiento general del sistema.
Esto se agrava aún más por los modelos de programación tradicionales, que típicamente delegan tareas a un solo tipo de procesador, dejando así otros recursos inactivos y subutilizados. Replicando estas observaciones, el artículo de investigación ‘Simultaneous and Heterogeneous Multi-threading’ de Kuan-Chieh Hsu y Hung-Wei Tseng afirma:
“Los modelos de programación arraigados se centran en usar solo las unidades de procesamiento más eficientes para cada región de código, subutilizando el poder de procesamiento dentro de los ordenadores heterogéneos.”
SHMT se desvía de este enfoque al explotar la diversidad de múltiples componentes dentro de un sistema informático. Este concepto se conoce como heterogeneidad. Al desglosar funciones computacionales y distribuirlas entre las unidades de procesamiento disponibles, SHMT facilita el procesamiento verdaderamente paralelo.
Este enfoque de descomponer funciones computacionales y distribuirlas entre varias unidades de procesamiento maximiza la utilización de los recursos disponibles para mejorar el rendimiento y ahorrar energía. El artículo de investigación también desglosa las deficiencias de los modelos de programación tradicionales al afirmar que solo pueden delegar una región de código exclusivamente a un tipo de procesador, dejando otros recursos informáticos inactivos sin contribuir a la función actual.
SHMT, por otro lado, busca liberarse de estas limitaciones aprovechando las habilidades distintas de cada unidad de procesamiento y su trabajo colaborativo en una región de código compartida. Los autores también señalan que la tecnología informática contemporánea es indudablemente heterogénea, ya que todas las plataformas informáticas integran múltiples tipos de unidades de procesamiento y aceleradores de hardware. Esto requiere un modelo de programación que pueda aprovechar eficazmente el poder de estos componentes diversos (que es precisamente lo que SHMT pretende lograr).
Por lo tanto, SHMT allana el camino hacia una computación más rápida y eficiente al abordar los cuellos de botella en la computación ahora tradicional.
¿Cómo funciona la tecnología de multihilo simultáneo y heterogéneo?
Como es evidente, gestionar y distribuir eficientemente las actividades informáticas entre diferentes componentes de hardware es el principio básico detrás de SHMT.
El marco incluye una colección de operaciones virtuales (VOPs) para facilitar la delegación de tareas desde una aplicación CPU a un dispositivo de hardware virtual. Según el estudio, “Un conjunto de operaciones virtuales (VOPs) permite a un programa CPU ‘delegar’ una función a un dispositivo de hardware virtual.” Estas VOPs median la comunicación y la delegación de trabajos creando una barrera entre el programa y el hardware.
Un sistema de tiempo de ejecución optimiza el rendimiento evaluando las capacidades de cada recurso de hardware y tomando decisiones de planificación inteligentes mientras la aplicación se ejecuta. Según el estudio, “Durante la ejecución del programa, un sistema de tiempo de ejecución impulsa el hardware virtual del multihilo simultáneo y heterogéneo, evaluando la capacidad del recurso de hardware para tomar decisiones de planificación.” Para maximizar la eficiencia de los recursos y adaptarse a las necesidades específicas de cada tarea, SHMT evalúa dinámicamente las capacidades del hardware.
El sistema de tiempo de ejecución desglosa los VOPs en operaciones de alto nivel (HLOPs) para distribuirlas a varias colas de tareas de hardware. Según el estudio, “El sistema de tiempo de ejecución divide los VOPs en una o más operaciones de alto nivel (HLOPs) para usar simultáneamente múltiples recursos de hardware.” Descomponer los VOPs en HLOPs permite un control granular sobre la asignación de trabajos y la máxima utilización de cada unidad de procesamiento.
La política de planificación de SHMT utiliza un enfoque de robo de trabajo consciente de la calidad (QAWS), garantizando una utilización eficiente de los recursos y cargas de trabajo variadas. Según el estudio, “SHMT usa una política de planificación de robo de trabajo consciente de la calidad (QAWS) que no acapara recursos, sino que ayuda a mantener el control de calidad y el equilibrio de la carga de trabajo.” Además de distribuir el trabajo de manera eficaz en todo el sistema, este enfoque impide que cualquier unidad de procesamiento acapare recursos.
Si SHMT desea maximizar el rendimiento sin sacrificar la calidad, necesita la política de planificación QAWS. El estudio indica que “SHMT debe asegurar el resultado sin incurrir en una sobrecarga significativa.” Para garantizar que la salida de las unidades de procesamiento heterogéneas sea precisa y consistente, SHMT integra técnicas de control de calidad en la planificación.
La capacidad de SHMT para aprovechar las capacidades específicas de cada pieza de hardware es una gran ventaja. Como señala el estudio, “SHMT puede dividir el cómputo de la misma función en varios tipos de recursos informáticos y explotar tipos heterogéneos de paralelismo al mismo tiempo.” SHMT mejora enormemente el rendimiento al utilizar el paralelismo en sistemas heterogéneos para ejecutar trabajos simultáneamente en varias unidades de procesador.
Otro aspecto de SHMT que se supone es flexible y adaptable es el sistema de tiempo de ejecución. Y según el estudio, “Como los HLOPs son independientes del hardware, el sistema de tiempo de ejecución puede ajustar la asignación de tareas según sea necesario.” Gracias a su adaptabilidad, SHMT puede reaccionar rápidamente a cambios en la disponibilidad de hardware o en la demanda de carga de trabajo, manteniendo el sistema funcionando con la máxima eficiencia y rendimiento.
En conjunto, el estudio expone todos los pasos necesarios para comprender cómo funciona SHMT, destacando las partes y procesos críticos que le permiten lograr una eficiencia y efectividad notables en entornos de computación heterogénea. Gracias a SHMT, que utiliza VOPs, HLOPs y la estrategia de planificación QAWS para revolucionar el procesamiento paralelo, está a punto de amanecer una nueva era de computación eficiente y poderosa.
Resultados Positivos de las Pruebas Iniciales del Prototipo
Para demostrar que SHMT funciona, los investigadores de UCR realizaron pruebas rigurosas en un sistema prototipo que imitaba las capacidades de un centro de datos mediante el uso de componentes estándar en los teléfonos móviles contemporáneos. El prototipo incluía un Google Edge TPU incorporado a través de la ranura M.2 Key E del sistema, un módulo NVIDIA Jetson Nano con un procesador ARM Cortex-A57 de cuatro núcleos, y 128 núcleos GPU de arquitectura Maxwell.
Para evaluar el rendimiento del marco SHMT bajo diferentes circunstancias de carga de trabajo, los investigadores sometieron el prototipo a una batería de programas de referencia. El resultado fue impresionante: la estrategia QAWS de mayor rendimiento no solo redujo el consumo de energía en un 51 % sino que también mejoró el rendimiento de procesamiento en 1,95 × en comparación con la técnica de referencia.

Los resultados subrayan el potencial de SHMT para mejorar enormemente el rendimiento de procesamiento y la eficiencia energética en una amplia gama de dispositivos y aplicaciones de software. SHMT demostró que es posible aprovechar al máximo la configuración actual al utilizar mejor todos sus recursos sin tener que gastar una fortuna en nuevo hardware.
Con la necesidad cada vez mayor de una computación más rápida y eficiente, avances como el multihilo simultáneo y heterogéneo serán cada vez más cruciales para moldear la trayectoria futura de la tecnología. El trabajo del equipo de investigación de UCR deja claro que encontrar soluciones informáticas de alto rendimiento y a largo plazo, capaces de adaptarse a las demandas dinámicas de nuestro mundo digital, nunca ha sido tan fácil como con el trabajo del equipo de investigación de UCR.
Implicaciones y Direcciones Futuras del Multihilo Simultáneo y Heterogéneo
La creación y prueba de SHMT representan un cambio profundo en el futuro de la computación. Tiene el potencial de revolucionar el diseño y uso de dispositivos informáticos en varias aplicaciones al ofrecer aumentos sustanciales de rendimiento y ahorro de energía con el hardware existente.
A medida que SHMT se adopte más ampliamente, los consumidores podrán evitar costosas actualizaciones de hardware y disfrutar de dispositivos móviles, tabletas, portátiles y de escritorio más rápidos y receptivos. Por ello, más personas pronto podrán adquirir y acceder a computadoras de alto rendimiento, ayudando a cerrar la brecha digital.
Los centros de datos y otros sistemas informáticos a gran escala también podrían encontrar en SHMT una herramienta indispensable para reducir costos y consumo de energía sin sacrificar el rendimiento. Además, innovaciones que promuevan la eficiencia energética y la sostenibilidad, como SHMT, ganarán importancia a medida que aumenten las preocupaciones sobre los efectos ambientales de la tecnología.
A pesar de sus mejores esfuerzos, el equipo de investigación de UCR reconoce que aún existen obstáculos por superar y oportunidades para más investigación y avances en el futuro. Los ingenieros de software y los fabricantes de hardware deberán trabajar estrechamente para implementar SHMT a gran escala. Esto garantizará que la tecnología funcione bien en todos los dispositivos y plataformas. Sin embargo, se requiere más investigación para determinar qué aplicaciones y cargas de trabajo son las más adecuadas para utilizar esta tecnología revolucionaria.
A pesar de estos obstáculos, tanto académicos como empresas han tomado nota de los prometedores resultados iniciales de SHMT. La posibilidad de que esta tecnología revolucionaria transforme la industria informática se vuelve cada vez más atractiva a medida que los estudios avanzan y se establecen colaboraciones.
Como muchas otras ideas brillantes, el multihilo simultáneo y heterogéneo parece ser producto del sentido común, pero el diablo está en los detalles. Aunque la idea de una caché compartida entre CPUs y GPUs es intrigante, probablemente requiera una revisión completa de la arquitectura de hardware.
Impulsaría alejarse de la arquitectura x86-64 actual, y tal diseño requeriría el desarrollo de una nueva arquitectura de procesador con una caché L3 o L4 compartida. Esto, a su vez, aumentaría la complejidad de la CPU y potencialmente anularía cualquier beneficio obtenido de la caché compartida.
Además, la memoria caché suele ser mucho más pequeña en comparación con la RAM del sistema y no es adecuada para aplicaciones GPU, que requieren grandes cantidades de memoria de alto ancho de banda. Sin embargo, desarrollos como memoria universal podrían abordar estas preocupaciones. A medida que la investigación sobre SHMT continúe, será emocionante ver cómo esta tecnología innovadora evoluciona e impacta el futuro del procesamiento paralelo y la computación heterogénea.












