Новий китайський алгоритм збільшує швидкість GPU Nvidia у 800 разів
Київ • УНН
Китайські вчені створили алгоритм PD-General для графічних процесорів Nvidia, що прискорює обчислення у 800 разів. Технологія дозволяє виконувати складні розрахунки матеріалів на звичайних GPU за лічені хвилини замість днів.

Новий алгоритм, розроблений командою під керівництвом доцента Яна Яна (Yang Yang), використовує теорію перидинаміки (PD), яка використовується для моделювання переломів і структурних пошкоджень.
Передає УНН із посиланням на South China Morning Post.
Китайські дослідники розробили високопродуктивний алгоритм, який може вирішувати складні задачі дизайну матеріалів на споживчих графічних процесорах, досягнувши революційного збільшення швидкості у 800 разів порівняно з традиційними методами.
Новий алгоритм підвищує обчислювальну ефективність перидинаміки (PD), передової, нелокальної теорії, яка вирішує складні фізичні проблеми, такі як тріщини, пошкодження та розломи. Це відкриває нові можливості для вирішення складних механічних проблем у різних галузях промисловості, включаючи аерокосмічну та військову промисловість, на широкодоступних чипах, які є недорогими
Підвищення продуктивності до 800 разів на графічних процесорах NVIDIA
Перидинаміка довела перевагу в моделюванні, але її висока обчислювальна складність традиційно робила широкомасштабне моделювання неефективним. На це впливали такі чинники, як високе використання пам’яті та низька швидкість обробки.
Щоб вирішити ці проблеми, команда розробників, на чолі з доцентом Ян Янгом, використала икористав технологію програмування Nvidia CUDA для створення структури PD-General. Провівши поглиблений аналіз унікальної структури чіпа, команда розробників оптимізувала дизайн алгоритму та керування пам’яттю, що призвело до значного підвищення продуктивності. Їх дослідження було опубліковано в китайському журналі обчислювальної механіки 8 січня.
Ця ефективна обчислювальна потужність дозволяє дослідникам скоротити обчислення, які зазвичай займають кілька днів, до кількох годин або навіть хвилин, використовуючи звичайний домашній GPU, що є значним прогресом для досліджень PD
У тестах, проведених з графічним процесором NVIDIA RTX 4070, PD-General досягла 800-кратного прискорення порівняно з традиційними послідовними програмами та в 100 разів швидше, ніж паралельні програми на основі OpenMP.
У великомасштабному моделюванні, що включає мільйони частинок, алгоритм виконав 4000 ітераційних кроків лише за п’ять хвилин.
Для великомасштабних двовимірних проблем одновісного розтягування він обробив 69,85 мільйонів ітерацій менш ніж за дві хвилини з одиничною точністю.
Відповідний прогрес повинен різко скоротити витрати на дослідження в областях, які залежать від моделювання складних матеріалів, демократизуючи доступ до цього типу досліджень і прискорюючи розвиток нових технологій.