Computing
Banebrydende Simultane og Heterogene Multi-Threading-teknologi for at gøre beregning hurtigere

Selvom alle nye enheder fra teknologigiganter som Apple og Google kun indeholder inkrementelle forbedringer – en enkeltcifret stigning i batterilevetiden, en nanometer mindre for processoren, som endnu ikke giver optimal udbytte for producenterne, eller et par ekstra megapixel – opstår spørgsmålet: Er sådanne beskedne forbedringer virkelig nok? Er tilføjelse af mere hardware løsningen?
Ikke ifølge lektor Hung-Wei Tseng fra afdelingen for elektroteknik og datalogi ved University of California, Riverside (UCR). Han siger:
Du behøver ikke tilføje nye processorer, fordi du allerede har dem.
Professor Tseng, sammen med et team af forskere, udviklede en ny software-ramme til parallel behandling kaldet Simultaneous and Heterogeneous Multi-threading (SHMT). Ifølge de første resultater er SHMT klar til at forbedre behandlingshastigheden betydeligt og reducere strømforbruget ved at udnytte de skjulte kapaciteter i nuværende processorer i personlige computere, mobiltelefoner og andre enheder.
Blev rost som “banebrydende” af teknologisamfundet, har SHMT til formål at fjerne flaskehalse i dataflow og muliggøre problemfri samarbejde mellem mange behandlingsenheder. Dette gennembrud kan påvirke ikke kun personlige elektroniske enheder, men også datacentre og andre former for massiv parallel computing.
Opløsning af Flaskehalsen

Før vi begynder at udforske den fulde herlighed af, hvad der er opnåeligt med simultan og heterogen multi-threading, lad os først forstå begrænsningerne i de nuværende computersystemer.
I de fleste enheder håndterer forskellige komponenter, såsom centralprocessoren (CPU), grafikkortet (GPU) og tensorprocessoren (TPU), information separat. Data overføres fra én behandlingsenhed til en anden, hvilket ofte resulterer i “flaskehalse”, der hæmmer den samlede systemydelse.
Dette forværres yderligere af de traditionelle programmeringsmodeller, som typisk tildeler opgaver til en enkelt type processor, og dermed lader andre ressourcer stå ubrugte og underudnyttede. I overensstemmelse med disse observationer udtaler forskningspapiret ‘Simultaneous and Heterogeneous Multi-threading’ af Kuan-Chieh Hsu og Hung-Wei Tseng:
De indgroede programmeringsmodeller fokuserer på kun at bruge de mest effektive behandlingsenheder for hver kodeområde, hvilket underudnytter behandlingskraften i heterogene computere.
SHMT afviger fra denne tilgang ved at udnytte mangfoldigheden af flere komponenter i et computersystem. Dette koncept er kendt som heterogenitet. Ved at nedbryde beregningsfunktioner og distribuere dem blandt tilgængelige behandlingsenheder muliggør SHMT ægte parallel behandling.
Denne tilgang med at nedbryde beregningsfunktioner og distribuere dem blandt flere behandlingsenheder maksimerer udnyttelsen af tilgængelige ressourcer for at forbedre ydeevnen og spare energi. Forskningspapiret dissekerer yderligere manglerne ved traditionelle programmeringsmodeller ved at fastslå, at de “kun kan delegere et kodeområde eksklusivt til én type processor, hvilket lader andre computerressourcer stå ubrugte uden at bidrage til den aktuelle funktion.”
SHMT har derimod til formål at bryde fri fra disse begrænsninger ved at udnytte hver behandlingsenheds unikke færdigheder og deres samarbejde på et fælles kodeområde. Forfatterne påpeger også, at nutidens computeringeniørkunst utvivlsomt er heterogen, da alle computerplatforme integrerer flere typer af behandlingsenheder og hardwareacceleratorer. Dette kræver en programmeringsmodel, der effektivt kan udnytte kraften i disse forskellige komponenter (hvilket præcis er, hvad SHMT sigter mod at opnå).
Dermed baner SHMT vejen for hurtigere og mere effektiv computing ved at tackle flaskehalsene i den nu traditionelle computing.
Hvordan fungerer Simultane og Heterogene Multi-Threading-teknologi?
Som tydeligt fremgår er styring og effektiv fordeling af computeraktiviteter blandt forskellige hardwarekomponenter det grundlæggende princip bag SHMT.
Rammen indeholder en samling af virtuelle operationer (VOPs) for at lette overførsel af opgaver fra et CPU-program til en virtuel hardwareenhed. Ifølge undersøgelsen, “Et sæt af virtuelle operationer (VOPs) tillader et CPU-program at ‘offloade’ en funktion til en virtuel hardwareenhed.” Disse VOPs medierer kommunikation og jobdelegation ved at skabe en barriere mellem programmet og hardwaren.
Et runtime-system optimerer ydeevnen ved at evaluere hver hardware-ressources kapacitet og træffe intelligente planlægningsbeslutninger, mens applikationen kører. Ifølge undersøgelsen, “Under programudførelse driver et runtime-system simultan og heterogen multi-threadings virtuelle hardware, og vurderer hardware-ressourcens evne til at træffe planlægningsbeslutninger.” For at maksimere ressourceeffektiviteten og tilpasse sig job-specifikke behov, evaluerer SHMT dynamisk hardwarekapaciteter.
Runtime-systemet nedbryder VOPs til høj-niveau operationer (HLOPs) for at distribuere dem til forskellige hardware-opgavekøer. Ifølge undersøgelsen, “Runtime-systemet opdeler VOPs i en eller flere høj-niveau operationer (HLOPs) for samtidigt at bruge flere hardware-ressourcer.” Nedbrydning af VOPs til HLOPs giver granular kontrol over joballokering og maksimal udnyttelse af hver behandlingsenhed.
SHMT’s planlægningspolitik anvender en kvalitetsbevidst work-stealing (QAWS) tilgang, som sikrer effektiv ressourceudnyttelse og varierede arbejdsbelastninger. Ifølge undersøgelsen, “SHMT bruger en kvalitetsbevidst work-stealing (QAWS) planlægningspolitik, der ikke beslaglægger ressourcer, men hjælper med at opretholde kvalitetskontrol og arbejdsbalancering.” Ud over at distribuere arbejde effektivt på tværs af systemet forhindrer denne tilgang enhver behandlingsenhed i at akkumulere ressourcer.
Hvis SHMT ønsker at maksimere ydeevnen uden at gå på kompromis med kvaliteten, har den brug for QAWS-planlægningspolitikken. Undersøgelsen fastslår, at “SHMT skal sikre resultatet uden at pådrage sig betydelige omkostninger.” For at garantere, at output fra heterogene behandlingsenheder er præcist og konsistent, integrerer SHMT kvalitetskontrolteknikker i planlægningen.
SHMT’s evne til at udnytte de specifikke kapaciteter i hver hardwarekomponent er en stor fordel. Som undersøgelsen bemærker, “SHMT kan opdele beregningen fra den samme funktion til flere typer af computerressourcer og udnytter samtidig heterogene typer af parallelisme.” SHMT forbedrer ydeevnen betydeligt, fordi den udnytter parallelisme i heterogene systemer til at køre job samtidigt på tværs af flere processor-enheder.
Et andet aspekt af SHMT, som menes at være fleksibelt og adaptivt, er runtime-systemet. Og ifølge undersøgelsen, “Da HLOPs er hardware-uafhængige, kan runtime-systemet justere opgavefordelingen efter behov.” På grund af sin tilpasningsevne kan SHMT reagere i realtid på ændringer i hardwaretilgængelighed eller arbejdsbelastningskrav, så systemet forbliver i top-effektivitet og -ydeevne.
Samlet set skitserer undersøgelsen alle nødvendige trin for at forstå, hvordan SHMT fungerer, og fremhæver de kritiske dele og processer, der gør det muligt at opnå bemærkelsesværdig effektivitet og virkningsfuldhed i heterogene computermiljøer. Takket være SHMT, som bruger VOPs, HLOPs og QAWS-planlægningsstrategien til at revolutionere parallel behandling, er en ny æra af effektiv og kraftfuld computing på vej til at bryde frem.
Positive Resultater fra den Indledende Test af Prototypen
For at bevise, at SHMT fungerer, udførte forskerne ved UCR grundige tests på et prototypesystem, der efterlignede datacenterkapaciteter ved at anvende komponenter, der er standard i moderne mobiltelefoner. Prototypen indeholdt en Google Edge TPU integreret via systemets M.2 Key E-slot, et NVIDIA Jetson Nano-modul med en quad-core ARM Cortex-A57-processor og 128 GPU-kerner med Maxwell-arkitektur.
For at evaluere SHMT-rammens ydeevne under forskellige arbejdsbelastningsforhold kørte forskerne prototypen gennem en række benchmark-programmer. Resultatet var imponerende: den bedst præsterende QAWS-strategi reducerede ikke kun energiforbruget med 51 % men forbedrede også behandlingsydelsen med 1,95 x sammenlignet med baseline-teknikken.

Resultaterne understreger SHMT’s potentiale til at forbedre behandlingsydelsen og energieffektiviteten betydeligt på tværs af et bredt spektrum af enheder og softwareapplikationer. SHMT demonstrerede, at det er muligt at få mest muligt ud af dit nuværende setup ved at udnytte alle dets ressourcer bedre uden at skulle bruge en formue på ny hardware.
Med det stadigt stigende behov for hurtigere og mere effektiv computing vil gennembrud som simultan og heterogen multi-threading blive stadig vigtigere for at forme teknologiens fremtidige udviklingsbane. UCR-forskerteamets arbejde gør det klart, at det aldrig har været lettere at finde langsigtede, højtydende computerløsninger, der kan tilpasse sig de dynamiske krav i vores digitale verden, end med UCR-forskerteamets arbejde.
Implikationer og Fremtidige Retninger for Simultan og Heterogen Multi-Threading
Skabelsen og testningen af SHMT repræsenterer et dybtgående skift i computingens fremtid. Det har potentiale til at revolutionere design og brug af computerenheder på tværs af flere anvendelser ved at tilbyde betydelige ydelsesforøgelser og energibesparelser med eksisterende hardware.
Efterhånden som SHMT får bredere udbredelse, kan forbrugerne undgå dyre hardwareopgraderinger og nyde hurtigere, mere responsive mobiltelefoner, tablets, laptops og stationære computere. På grund af dette vil flere mennesker snart kunne købe og få adgang til højtydende computere, hvilket hjælper med at lukke den digitale kløft.
Datacentre og andre store computersystemer kan også finde SHMT som et uundværligt værktøj til at reducere omkostninger og energiforbrug uden at gå på kompromis med ydeevnen. Desuden vil innovationer, der fremmer energieffektivitet og bæredygtighed, såsom SHMT, få større betydning, efterhånden som bekymringer om teknologiens miljøpåvirkning vokser.
På trods af deres bedste indsats erkender UCR-forskerteamet, at der stadig er forhindringer, der skal overvindes, og muligheder for yderligere undersøgelse og udvikling i fremtiden. Softwareingeniører og hardwareproducenter skal arbejde tæt sammen for at implementere SHMT i stor skala. Dette vil sikre, at teknologien fungerer godt på alle enheder og platforme. Dog er yderligere forskning nødvendig for at fastslå, hvilke applikationer og arbejdsbelastninger der er bedst egnet til at bruge denne revolutionerende teknologi.
Uden at se bort fra disse forhindringer har både akademikere og virksomheder bemærket SHMT’s lovende tidlige resultater. Muligheden for, at denne banebrydende teknologi kan transformere computerindustrien, bliver stadig mere attraktiv, efterhånden som studier skrider frem og samarbejder etableres.
Ligesom mange andre brillante idéer ser simultan og heterogen multi-threading ud til at være et produkt af sund fornuft, men djævelen gemmer sig i detaljerne. Selvom idéen om en delt cache mellem CPU’er og GPU’er er fascinerende, vil den sandsynligvis kræve en fuldstændig omstrukturering af hardwarearkitekturen.
Det ville kræve at bevæge sig væk fra den nuværende x86-64-arkitektur, og et sådant design ville nødvendiggøre udviklingen af en ny processorarkitektur med en delt L3- eller L4-cache. Dette ville igen øge CPU’ens kompleksitet og potentielt ophæve eventuelle fordele ved den delte cache.
Derudover er cache-hukommelse typisk meget mindre sammenlignet med system-RAM og er ikke velegnet til GPU-applikationer, som kræver store mængder høj-båndbredde hukommelse. Dog kan udviklinger som universal memory adresse disse bekymringer. Efterhånden som forskningen i SHMT fortsætter, vil det være spændende at se, hvordan denne innovative teknologi udvikler sig og påvirker fremtiden for parallel behandling og heterogen computing.












