تکنولوژی

ابررایانه فوگاکو؛ معرفی کامل ابررایانه ژاپنی Fugaku

ابرارایانه فوگاکو در مرکز محاسباتی علوم رایکن (RIKEN Center for Computational Science) در کوبِ ژاپن مستقر شده است. ابررایانه ژاپنی Fugaku از سال ۲۰۱۴ به عنوان جانشین ابرارایانه کی (K computer) توسعه یافت و در سال ۲۰۲۰ به طور رسمی معرفی شد. فوگاکو با نام ژاپنی (Fugaku)، که نامی جایگزین برای کوه فوجی است، نماد قدرت و پایداری است و با استفاده از معماری مبتنی بر آرم (ARM) ساخته شده، که آن را به اولین ابرارایانه مبتنی بر آرم تبدیل کرده که به رتبه اول جهان دست یافته است. فوگاکو شامل ۱۵۸٬۹۷۶ نود محاسباتی است که هر کدام توسط پردازنده سفارشی A64FX فوجیتسو قدرت می‌گیرد و عملکرد پیک آن در حالت دو دقتی ۵۳۷ پتافلاپس و در حالت تک دقتی بیش از ۱ اگزافلاپس است.

این ابرارایانه نه تنها برای محاسبات علمی طراحی شده، بلکه برای حل مسائل اجتماعی و علمی پیچیده مانند مدل‌سازی همه‌گیری‌ها، شبیه‌سازی‌های پزشکی و تحقیقات هوش مصنوعی به کار می‌رود. ابررایانه فوگاکو با مصرف انرژی ۳۰ مگاوات، کارایی انرژی بالایی دارد و در رتبه‌بندی Green500 نیز عملکرد برجسته‌ای نشان داده است. از زمان راه‌اندازی، فوگاکو در بنچمارک‌های مختلف مانند TOP500، HPCG و HPL-AI رتبه‌های برتر را کسب کرده و نقش کلیدی در تحقیقات کووید-۱۹ ایفا نموده، از جمله شبیه‌سازی‌های پخش قطرات ویروسی و جستجوی داروهای بالقوه.

فوگاکو

پروژه Fugaku و نقش RIKEN و فوجیتسو

ابررایانه فوگاکو بخشی از برنامه پرچمدار ۲۰۲۰ ژاپن (FLAGSHIP 2020) است که توسط وزارت آموزش، فرهنگ، ورزش، علوم و فناوری ژاپن (MEXT) تأمین مالی شده است. توسعه پروژه از سال ۲۰۱۴ آغاز شد و با همکاری نزدیک مرکز محاسباتی علوم رایکن و شرکت فوجیتسو پیش رفت. رایکن، به عنوان بزرگ‌ترین مؤسسه تحقیقاتی ژاپن، مسئولیت رهبری علمی و کاربردهای تحقیقاتی را بر عهده داشت، در حالی که فوجیتسو طراحی سخت‌افزاری، از جمله پردازنده A64FX و شبکه اتصال TofuD را مدیریت کرد. همکاری بر پایه رویکرد “هم‌طراحی” (co-design) استوار بود که در آن نرم‌افزار و سخت‌افزار همزمان توسعه یافتند تا عملکرد بهینه متنوع حاصل شود.

رایکن با بیش از ۲۵۰۰ محقق، تمرکز خود را بر کاربردهای علمی مانند شبیه‌سازی‌های فیزیکی، بیولوژیکی و هوش مصنوعی گذاشت و فوجیتسو با تخصص در فناوری‌های HPC، بیش از ۱ میلیارد دلار سرمایه‌گذاری را تضمین کرد. پروژه شامل نه سازمان اولویت‌دار کاربردی بود که نیازهای خاص خود را برای شبیه‌سازی‌های بزرگ‌مقیاس مطرح کردند. تا سال ۲۰۲۱، فوگاکو به طور کامل عملیاتی شد و دسترسی اشتراکی برای محققان دانشگاهی و صنعتی فراهم گردید. این مشارکت نه تنها ژاپن را در صدر محاسبات جهانی قرار داد، بلکه الگویی برای همکاری‌های بین‌المللی شد.

معماری سخت‌افزاری ابررایانه فوگاکو

معماری فوگاکو بر پایه یک سیستم موازی عظیم با ۱۵۸٬۹۷۶ نود محاسباتی استوار است که در ۴۳۲ رک سازماندهی شده‌اند. هر نود شامل یک پردازنده A64FX است که ۴۸ هسته محاسباتی و ۲-۴ هسته کمکی دارد، و با حافظه HBM2E 3D-stacked (۳۲ گیگابایت در هر نود) جفت شده است. این معماری بدون GPU، بر محاسبات برداری باSVE (Scalable Vector Extension) آرم تمرکز دارد و پهنای باند حافظه ۱ پتابایت بر ثانیه را فراهم می‌کند. سیستم از ۷٬۶۳۰٬۸۴۸ هسته کلی تشکیل شده و فرکانس کلاک ۲.۰ گیگاهرتز در حالت عادی و ۲.۲ گیگاهرتز در حالت بوست عمل می‌کند.

شبکه اتصال TofuD با توپولوژی مش/توروس شش‌بعدی، ارتباط کم‌تأخیر و پهنای باند بالا (۴۰.۸ گیگابایت بر ثانیه در هر نود) را تضمین می‌کند. ذخیره‌سازی سه‌لایه شامل LLIO برای دسترسی محلی NVMe، FEFS بر پایه Lustre با ۱۵۰ پتابایت ظرفیت، و آرشیو نواری برای داده‌های بلندمدت است. سیستم عامل مبتنی بر لینوکس با کرنل دوگانه IHK/McKernel، jitter سیستم عامل را کاهش می‌دهد و محیط برنامه‌نویسی با MPI و OpenMP سازگار است.

مشخصات فنی پردازنده

پردازنده A64FX، قلب تپنده فوگاکو، یک میکروپروسسور ۶۴ بیتی مبتنی بر معماری آرم v8.2-A است که توسط فوجیتسو برای HPC طراحی شده و اولین پیاده‌سازی SVE در مقیاس سرور است. این پردازنده با فرآیند ۷ نانومتری TSMC ساخته شده و شامل ۴۸ هسته محاسباتی (با ۱۲ هسته در هر خوشه) و ۲-۴ هسته کمکی برای مدیریت OS است. هر هسته ۵۱۲ بیتی SVE پشتیبانی می‌کند که عملیات برداری را برای FP16/32/64 و INT8/16/32 تسریع می‌نماید، و عملکرد پیک ۳.۳۷۹۲ ترافلاپس در FP64 را در هر چیپ ارائه می‌دهد. حافظه کش L1 ۶۴ کیلوبایت (دستور و داده) در هر هسته، L2 ۳۲ مگابایت در هر خوشه، و L3 ۹۶ مگابایت در چیپ است.

A64FX با ۸ کانال HBM2E (۱ ترابایت بر ثانیه پهنای باند) جفت شده و کنترلرهای TofuD و PCIe Gen3 را یکپارچه کرده است. ویژگی‌های RAS شامل ۱۲۸٬۴۰۰ چک‌کننده خطا برای قابلیت اطمینان بالا است. فرکانس ۲.۲ گیگاهرتز در بوست، نسبت قدرت به وزن عالی (نزدیک به Xeon) را فراهم می‌کند و مصرف انرژی ۳۴۲ وات در هر سوکت است. پردازنده با تمرکز بر HPC و AI، فوگاکو را قادر به اجرای شبیه‌سازی‌های پیچیده می‌سازد و در سیستم‌های کوچک‌تر مانند PRIMEHPC FX700 نیز استفاده می‌شود.

ابررایانه ژاپنی Fugaku

توان پردازشی و رتبه‌بندی فوگاکو در لیست TOP500

ابررایانه فوگاکو با عملکرد ۴۴۲ پتافلاپس Rmax در HPL، از ژوئن ۲۰۲۰ تا می ۲۰۲۲ رتبه اول TOP500 را حفظ کرد و اولین ابرارایانه آرم در صدر بود. در نوامبر ۲۰۲۰، پس از ارتقا، عملکرد به ۴۴۲ پتافلاپس رسید و مجموع چهار ابرارایانه بعدی را پشت سر گذاشت. در HPCG، با ۱۶ پتافلاپس، ۵.۴ برابر سامیت برتر بود و رکورد را برای پنج دوره متوالی نگه داشت. در Graph500، امتیاز ۲۰۴.۰۶۸ تراتپس با ۱۵۲٬۰۶۴ نود، اولین امتیاز بالای ۲۰۰ تراتپس را ثبت کرد.

در HPL-AI، فوگاکو ۲ اگزافلاپس در دقت مخلوط به دست آورد و اولین سیستم اگزاسکیل در این بنچمارک شد. در نوامبر ۲۰۲۴، رتبه ششم TOP500 با ۴۴۲ پتافلاپس، دوم HPCG و اول Graph500 را داشت.

شبکه ارتباطی TofuD و ویژگی‌های آن

شبکه TofuD، نسل چهارم Torus Fusion، یک اتصال شش‌بعدی مش/توروس است که ۱۵۸٬۹۷۶ نود را با تأخیر کم و پهنای باند بالا متصل می‌کند. هر نود شش TNI (Tofu Network Interface) با ۶.۸ گیگابایت بر ثانیه دارد، مجموع ۴۰.۸ گیگابایت بر ثانیه، و روتر ۱۰ پورتی با ۲۰ لین. TofuD با RDMA، تزریق پهنای باند ۲۰ گیگابایت بر ثانیه و ظرفیت سوئیچینگ ۱۴۰ گیگابایت بر ثانیه را فراهم می‌کند و fault-tolerance با برش دینامیک پکت را دارد.

ویژگی‌های کلیدی شامل مقیاس‌پذیری ۱۰۰k+ نود، پشتیبانی از barrier sync و multi-rail برای ارتباطات همزمان است. TofuD نسبت به Tofu قبلی، تراکم بالاتر و تحمل خطا را افزایش داد و در بنچمارک‌ها مانند Graph500 برتر است. با ۲۰۰٬۰۰۰ کابل (نیمی فیبر نوری، ۹۰۰ کیلومتر طول)، TofuD ارتباط کارآمد را تضمین می‌کند و فوگاکو را برای شبیه‌سازی‌های بزرگ‌مقیاس ایده‌آل می‌سازد.

سیستم‌های خنک‌سازی و مدیریت حرارتی ابررایانه فوگاکو

فوگاکو با تولید حرارت بالا (تا ۱۰۰ کیلووات بر متر مربع در رک)، از خنک‌سازی مایع مستقیم استفاده می‌کند که ۹۰ درصد حرارت را با آب جذب می‌نماید. هر رک ۱۹۲ واحد CPU-Memory (CMU) دارد که با لوله‌های مایع خنک می‌شوند و LCU (Liquid Cooling Unit) جریان آب را از مرکز به لبه هدایت می‌کند تا دمای CPU زیر ۳۰ درجه سلسیوس بماند. سیستم دوگانه اولیه و ثانویه، با سنسورها و پمپ‌های قابل تنظیم، دمای ثانویه را در ۱۵ درجه سلسیوس نگه می‌دارد.

چیلرها و مبدل‌های حرارتی Alfa Laval، حرارت را به بخار تبدیل کرده و از برج خنک‌کننده دفع می‌کنند. نسبت خنک‌سازی آب به هوا ۹:۱ است و نسبت به کی، شش برابر کارآمدتر. سیستم خنک‌سازی با نگهداری زنده (live maintenance)، پایداری را تضمین می‌کند و کارایی انرژی ۱۴.۱۷ گیگافلاپس بر وات در Green500 را حاصل نموده است.

کاربردهای علمی گسترده فوگاکو

ابررایانه فوگاکو کاربردهای علمی متنوعی از نجوم تا مواد را پشتیبانی می‌کند و شبیه‌سازی‌های دقیق را امکان‌پذیر می‌سازد. در نجوم، مدل‌سازی تکامل کیهان و ماده تاریک را تسریع می‌کند و در هواشناسی، پیش‌بینی‌های دقیق‌تر را فراهم می‌نماید. در انرژی، شبیه‌سازی‌های همجوشی هسته‌ای و سلول‌های سوختی را انجام می‌دهد و در مواد، ساختارهای نانویی را مدل می‌کند. فوگاکو با ۴.۸۵ پتابایت حافظه، big data را پردازش کرده و در شیمی، واکنش‌های کاتالیستی را شبیه‌سازی می‌نماید. در فیزیک، شبیه‌سازی‌های ذرات بنیادی و گرانش کوانتومی را اجرا می‌کند و در مهندسی، سازه‌های بزرگ را تحلیل می‌نماید.

تصویری از پروژه

استفاده از فوگاکو در تحقیقات پزشکی و بیولوژی

فوگاکو در پزشکی و بیولوژی، شبیه‌سازی‌های مولکولی را برای کشف دارو و مدل‌سازی بیماری‌ها تسریع می‌کند. در ژنومیک، شبکه‌های ژنی را تحلیل کرده و در سرطان، مکانیسم‌های مهاجرت سلولی را مدل می‌نماید. با DeepTensor، ژنوم‌های پیچیده را پردازش می‌کند و در قلب، شبیه‌سازی‌های نارسایی را انجام می‌دهد. در مغز، مدل‌های دیجیتال کورتکس موش را با ۱۰ میلیون نورون ساخته و بیماری‌هایی مانند آلزایمر را مطالعه می‌نماید. فوگاکو داده‌های بزرگ پزشکی را ادغام کرده و با AI، پیش‌بینی‌های شخصی‌سازی‌شده را فراهم می‌کند.

فوگاکو در تحقیقات کووید-۱۹، شبیه‌سازی‌های پخش قطرات را انجام داد و نشان داد که ماسک و تهویه، خطر را ۹۰ درصد کاهش می‌دهند. با ۱۷.۵ میلیون ساعت نود، مدل‌های عفونت را در قطارها و دفاتر شبیه‌سازی کرد و به سیاست‌های عمومی کمک نمود. در کشف دارو، ۲٬۰۰۰ ترکیب را غربالگری کرده و ۳۰ داروی بالقوه مانند ایورمکتین را شناسایی نمود.

در واکسن، پروتئین‌های SARS-CoV-2 را مدل کرد و جهش‌ها را پیش‌بینی نمود، که به توسعه واکسن‌های mRNA کمک کرد. ابررایانه فوگاکو مکانیسم‌های اتصال ویروس به سلول‌ها را شبیه‌سازی کرده و درمان‌های کوچک‌مولکولی را تسریع بخشید.

مقایسه ابررایانه فوگاکو با سامیت و فرانتیر

ابررایانه فوگاکو در مقایسه با ابرارایانه‌های آمریکایی سامیت (Summit) و فرانتیر (Frontier)، برتری‌های منحصربه‌فردی در کارایی و کاربردهای عمومی نشان می‌دهد. سامیت، ساخته‌شده توسط IBM در آزمایشگاه ملی اوک ریج (ORNL) در سال ۲۰۱۸، با عملکرد ۱۴۸.۸ پتافلاپس در بنچمارک HPL، از سال ۲۰۱۸ تا ۲۰۲۰ رتبه اول TOP500 را داشت. این سیستم بر پایه پردازنده‌های POWER9 و GPUهای NVIDIA V100 استوار است و برای محاسبات GPU-محور بهینه‌سازی شده، اما فوگاکو با ۴۴۲ پتافلاپس در سال ۲۰۲۰، ۲.۸ برابر سریع‌تر بود و بدون GPU، بر محاسبات CPU-محور تمرکز دارد. سامیت در HPCG تنها ۲.۹۳ پتافلاپس امتیاز گرفت، در حالی که فوگاکو ۱۶ پتافلاپس را ثبت کرد، که ۵.۴ برابر برتر است.

فرانتیر، ساخته‌شده توسط HPE Cray در ORNL و راه‌اندازی‌شده در ۲۰۲۲، اولین ابرارایانه اگزاسکیل واقعی است با ۱.۱ اگزافلاپس، که فوگاکو را از رتبه اول TOP500 جابه‌جا کرد. فرانتیر بر پایه AMD EPYC و GPUهای AMD Instinct MI250X است و کارایی انرژی ۵۲.۲۳ گیگافلاپس بر وات دارد، اما فوگاکو در HPCG همچنان پیشتاز است با ۱۶ پتافلاپس در برابر ۱۴.۰۵ پتافلاپس فرانتیر. فوگاکو با معماری آرم، انعطاف‌پذیری بیشتری برای کاربردهای علمی عمومی مانند شبیه‌سازی‌های بیولوژیکی ارائه می‌دهد، در حالی که سامیت و فرانتیر بیشتر برای AI و GPU-محور مناسب‌اند. در HPL-AI، فوگاکو ۲ اگزافلاپس دارد، اما فرانتیر با ۹.۹۵ اگزافلاپس پیشی گرفت.

امتیاز post

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *