Вычисление
Революционная технология одновременной и гетерогенной многопоточности для ускорения вычислений
Securities.io поддерживает строгие редакционные стандарты и может получать компенсацию за просмотренные ссылки. Мы не являемся зарегистрированным инвестиционным консультантом, и это не инвестиционный совет. Пожалуйста, ознакомьтесь с нашим раскрытие аффилированного лица.

Хотя все новые устройства от технологических гигантов, таких как Apple и Google, имеют постепенные улучшения — однозначное увеличение времени автономной работы, уменьшение на один нанометр процессора, который еще не обеспечивает оптимальную производительность для производителей, или несколько дополнительных мегапикселей — вопрос Возникает вопрос: достаточно ли таких скромных улучшений? Является ли добавление дополнительного оборудования решением?
Нет, по словам доцента Хунг-Вей Цэна с факультета электротехники и вычислительной техники Калифорнийского университета в Риверсайде (UCR). Он говорит:
«Вам не нужно добавлять новые процессоры, потому что они у вас уже есть».
Профессор Ценг вместе с командой исследователей разработал новую программную среду для параллельной обработки называется одновременной и гетерогенной многопоточностью (SHMT). Согласно первоначальным результатам, SHMT призван значительно повысить скорость обработки данных и снизить энергопотребление за счет использования скрытых возможностей современных процессоров персональных компьютеров, мобильных телефонов и других устройств.
SHMT, рекламируемый технологическим сообществом как «новаторский», направлен на устранение узких мест в потоке данных и облегчение беспрепятственного взаимодействия множества процессоров. Этот прорыв может затронуть не только личную электронику, но и центры обработки данных и другие виды массово-параллельных вычислений.
Устранение узкого места

Прежде чем мы приступим к исследованию всего великолепия возможностей одновременной и гетерогенной многопоточности, давайте сначала поймем ограничения современных вычислительных систем.
В большинстве устройств различные компоненты, такие как центральный процессор (ЦП), графический процессор (ГП) и тензорный процессор (ТПУ), обрабатывают информацию отдельно. Данные передаются из одного процессора в другой, что часто приводит к возникновению «узких мест», снижающих общую производительность системы.
Ситуация ещё больше усугубляется традиционными моделями программирования, которые обычно делегируют задачи одному типу процессора, тем самым оставляя другие ресурсы бездействующими и недоиспользуемыми. В подтверждение этих наблюдений, в исследовательской работе «Одновременная и гетерогенная многопоточность» Куан-Чиэ Сю и Хун-Вэй Цэна говорится:
«Укоренившиеся модели программирования ориентированы на использование только наиболее эффективных процессоров для каждой области кода, недостаточно используя вычислительную мощность гетерогенных компьютеров».
SHMT отклоняется от этого подхода, используя разнообразие множества компонентов вычислительной системы. Эта концепция известна как гетерогенность. Разбивая вычислительные функции и распределяя их между доступными процессорами, SHMT обеспечивает настоящую параллельную обработку.
Такой подход декомпозиции вычислительных функций и распределения их между несколькими процессорами позволяет максимально использовать доступные ресурсы для повышения производительности и экономии энергии. В исследовательском документе далее анализируются недостатки традиционных моделей программирования, заявляя, что они «могут делегировать область кода исключительно одному типу процессоров, оставляя другие вычислительные ресурсы бездействующими, не внося вклада в текущую функцию».
С другой стороны, SHMT стремится преодолеть эти ограничения, используя уникальные возможности каждого процессора и их совместную работу над общей областью кода. Авторы также отмечают, что современные вычислительные технологии, несомненно, неоднородны, поскольку все вычислительные платформы интегрируют различные типы процессоров и аппаратных ускорителей. Это требует программной модели, способной эффективно использовать возможности этих разнообразных компонентов (именно к этому стремится SHMT).
Таким образом, SHMT открывает путь к более быстрым и эффективным вычислениям, устраняя узкие места в традиционных вычислениях.
Как работают технологии одновременной и гетерогенной многопоточности?
Очевидно, что эффективное управление и распределение вычислительной деятельности между различными аппаратными компонентами является основным принципом SHMT.
Платформа включает в себя набор виртуальных операций (VOP) для облегчения выгрузки задач из приложения ЦП в компьютер. виртуальное аппаратное устройствоСогласно исследованию, «набор виртуальных операций (VOP) позволяет программе ЦП «переложить» функцию на виртуальное аппаратное устройство». Эти VOP обеспечивают взаимодействие и делегирование задач, создавая барьер между программой и оборудованием.
Система выполнения оптимизирует производительность, оценивая возможности каждого аппаратного ресурса и принимая интеллектуальные решения по планированию во время выполнения приложения. Согласно исследованию, «Во время выполнения программы система выполнения управляет виртуальным оборудованием одновременной и гетерогенной многопоточности, оценивая способность аппаратного ресурса принимать решения по планированию». Чтобы максимально эффективно использовать ресурсы и адаптироваться к потребностям конкретной задачи, SHMT динамически оценивает возможности оборудования.
Система выполнения разбивает VOP на операции высокого уровня (HLOP) для распределения их по различным очередям аппаратных задач. Согласно исследованию: «Система времени выполнения делит VOP на одну или несколько операций высокого уровня (HLOP) для одновременного использования нескольких аппаратных ресурсов». Разложение VOP на HLOP обеспечивает детальный контроль над распределением заданий и максимальным использованием каждого процессорного блока.
Политика планирования SHMT использует подход QAWS (перехват работы с учётом качества), обеспечивая эффективное использование ресурсов и разнообразие рабочих нагрузок. Согласно исследованию, «SHMT использует политику планирования QAWS (перехват работы с учётом качества), которая не перегружает ресурсы, но помогает поддерживать контроль качества и баланс рабочей нагрузки». Помимо эффективного распределения работы по системе, этот подход предотвращает накопление ресурсов любым процессором.
Если SHMT хочет максимизировать производительность без ущерба для качества, ей необходима политика планирования QAWS. В исследовании говорится, что «SHMT должен гарантировать результат без значительных накладных расходов». Чтобы гарантировать точность и согласованность результатов разнородных процессоров, SHMT интегрирует методы контроля качества в планирование.
Способность SHMT использовать специфические возможности каждого оборудования является большим плюсом. Как отмечается в исследовании, «SHMT может разбить вычисления одной и той же функции на несколько типов вычислительных ресурсов и при этом использовать гетерогенные типы параллелизма». SHMT значительно повышает производительность, поскольку использует параллелизм в гетерогенных системах для одновременного выполнения заданий на нескольких процессорных модулях.
Еще один аспект SHMT, который должен быть гибким и адаптивным, — это система времени выполнения. И согласно исследованию: «Поскольку HLOP не зависят от оборудования, система выполнения может корректировать назначение задач по мере необходимости». Благодаря своей адаптивности SHMT может оперативно реагировать на изменения доступности оборудования или требований рабочей нагрузки, поддерживая работу системы с максимальной эффективностью и производительностью.
В целом, в исследовании излагаются все необходимые шаги для понимания того, как работает SHMT, обращая внимание на критические части и процессы, которые позволяют ему достигать замечательной эффективности и результативности в гетерогенных вычислительных средах. Благодаря SHMT, который использует VOP, HLOP и стратегию планирования QAWS для революции в параллельной обработке, вот-вот наступит новая эра эффективных и мощных вычислений.
Положительные результаты первоначального тестирования прототипа
Чтобы доказать работоспособность SHMT, исследователи из Калифорнийского университета в Риверсайде провели тщательные испытания прототипа системы, имитирующего возможности центра обработки данных, используя компоненты, стандартные для современных мобильных телефонов. Прототип включал в себя TPU Google Edge, подключенный через слот M.2 Key E, модуль NVIDIA Jetson Nano с четырехъядерным процессором ARM Cortex-A57 и 128 графических ядер с архитектурой Maxwell.
Чтобы оценить производительность фреймворка SHMT при различных нагрузках, исследователи прогнали прототип через ряд бенчмарков. Результат оказался впечатляющим: наиболее эффективная стратегия QAWS не только снизила энергопотребление на 51%, но и увеличила производительность обработки в 1.95 раза по сравнению с базовым методом.

Результаты подчеркивают потенциал SHMT для значительного повышения производительности и энергоэффективности обработки данных в широком спектре устройств и программных приложений. SHMT продемонстрировал, что можно извлечь максимальную пользу из текущей системы, более эффективно используя все её ресурсы, без необходимости тратить целое состояние на новое оборудование.
В условиях постоянно растущей потребности в более быстрых и эффективных вычислениях такие прорывы, как одновременная и гетерогенная многопоточность, будут становиться все более важными в формировании будущей траектории развития технологий. Работа исследовательской группы UCR ясно показывает, что поиск долгосрочных высокопроизводительных вычислительных решений, способных адаптироваться к динамическим требованиям нашего цифрового мира, никогда не был проще, чем работа исследовательской группы UCR.
Последствия и будущие направления одновременной и гетерогенной многопоточности
Создание и тестирование SHMT представляют собой глубокий сдвиг в будущем вычислений. Он может совершить революцию в проектировании и использовании вычислительных устройств в нескольких приложениях, предлагая существенное повышение производительности и экономию энергии по сравнению с существующим оборудованием.
По мере того, как SHMT получает более широкое распространение, потребители смогут избежать дорогостоящих обновлений оборудования и наслаждаться более быстрыми и отзывчивыми мобильными устройствами, планшетами, ноутбуками и настольными компьютерами. Благодаря этому все больше людей вскоре смогут приобретать и иметь доступ к высокопроизводительным компьютерам, что поможет сократить цифровой разрыв.
Центры обработки данных и другие крупномасштабные вычислительные системы также могут использовать SHMT как незаменимый инструмент для сокращения расходов и энергопотребления без ущерба для производительности. Кроме того, инновации, способствующие энергоэффективности и устойчивому развитию, такие как SHMT, будут приобретать всё большую значимость по мере роста опасений по поводу воздействия технологий на окружающую среду.
Несмотря на все усилия, исследовательская группа UCR признает, что все еще существуют препятствия, которые необходимо преодолеть, и есть возможности для дальнейших исследований и достижений в будущем. Инженерам-программистам и производителям оборудования придется тесно сотрудничать для реализации SHMT в больших масштабах. Это гарантирует, что технология будет хорошо работать на всех устройствах и платформах. Однако необходимы дальнейшие исследования, чтобы определить, какие приложения и рабочие нагрузки наиболее подходят для использования этой революционной технологии.
Несмотря на эти препятствия, учёные и представители бизнеса обратили внимание на многообещающие первые результаты SHMT. Возможность того, что эта новаторская технология может преобразить компьютерную индустрию, становится всё более привлекательной по мере развития исследований и развития сотрудничества.
Как и многие другие блестящие идеи, одновременная и гетерогенная многопоточность кажется продуктом здравого смысла, но дьявол кроется в деталях. Хотя идея общего кэша между центральными и графическими процессорами интригует, она, вероятно, потребует полного пересмотра аппаратной архитектуры.
Это потребует отказа от нынешней архитектуры x86-64, и такая конструкция потребует разработки новой архитектуры процессора с общим кэшем L3 или L4. Это, в свою очередь, увеличит сложность ЦП и потенциально сведет на нет любые преимущества, получаемые от общего кэша.
Кроме того, кэш-память обычно намного меньше системной оперативной памяти и не очень подходит для приложений графического процессора, которым требуется большой объем памяти с высокой пропускной способностью. Однако такие события, как универсальная память может решить эти проблемы. Поскольку исследования SHMT продолжаются, будет интересно увидеть, как эта инновационная технология развивается и влияет на будущее параллельной обработки и гетерогенных вычислений.










