Новый китайский алгоритм увеличивает скорость GPU Nvidia в 800 раз
Киев • УНН
Китайские ученые создали алгоритм PD-General для графических процессоров Nvidia, ускоряющий вычисления в 800 раз. Технология позволяет выполнять сложные расчеты материалов на обычных GPU за считанные минуты вместо дней.

Новый алгоритм, разработанный командой под руководством доцента Яна Яна (Yang Yang), использует теорию перидинамики (PD), которая используется для моделирования переломов и структурных повреждений.
Передает УНН со ссылкой на South China Morning Post.
Китайские исследователи разработали высокопроизводительный алгоритм, который может решать сложные задачи дизайна материалов на потребительских графических процессорах, достигнув революционного увеличения скорости в 800 раз по сравнению с традиционными методами.
Новый алгоритм повышает вычислительную эффективность перидинамики (PD), передовой, нелокальной теории, которая решает сложные физические проблемы, такие как трещины, повреждения и разломы. Это открывает новые возможности для решения сложных механических проблем в различных отраслях промышленности, включая аэрокосмическую и военную промышленность, на широко доступных и недорогих чипах
Повышение производительности до 800 раз на графических процессорах NVIDIA
Перидинамика доказала преимущество в моделировании, но ее высокая вычислительная сложность традиционно делала широкомасштабное моделирование неэффективным. На это влияли такие факторы, как высокое использование памяти и низкая скорость обработки.
Чтобы решить эти проблемы, команда разработчиков, во главе с доцентом Ян Янгом, использовала и использовала технологию программирования Nvidia CUDA для создания структуры PD-General. Проведя углубленный анализ уникальной структуры чипа, команда разработчиков оптимизировала дизайн алгоритма и управление памятью, что привело к значительному повышению производительности. Их исследование было опубликовано в китайском журнале вычислительной механики 8 января.
Эта эффективная вычислительная мощность позволяет исследователям сократить вычисления, которые обычно занимают несколько дней, до нескольких часов или даже минут, используя обычный домашний GPU, что является значительным прогрессом для исследований PD
В тестах, проведенных с графическим процессором NVIDIA RTX 4070, PD-General достигла 800-кратного ускорения по сравнению с традиционными последовательными программами и в 100 раз быстрее, чем параллельные программы на основе OpenMP.
В крупномасштабном моделировании, включающем миллионы частиц, алгоритм выполнил 4000 итерационных шагов всего за пять минут.
Для крупномасштабных двумерных проблем одноосного растяжения он обработал 69,85 миллионов итераций менее чем за две минуты с единичной точностью.
Соответствующий прогресс должен резко сократить расходы на исследования в областях, которые зависят от моделирования сложных материалов, демократизируя доступ к этому типу исследований и ускоряя развитие новых технологий.