ابررایانه فوگاکو؛ معرفی کامل ابررایانه ژاپنی Fugaku

ابرارایانه فوگاکو در مرکز محاسباتی علوم رایکن (RIKEN Center for Computational Science) در کوبِ ژاپن مستقر شده است. ابررایانه ژاپنی Fugaku از سال ۲۰۱۴ به عنوان جانشین ابرارایانه کی (K computer) توسعه یافت و در سال ۲۰۲۰ به طور رسمی معرفی شد. فوگاکو با نام ژاپنی (Fugaku)، که نامی جایگزین برای کوه فوجی است، نماد قدرت و پایداری است و با استفاده از معماری مبتنی بر آرم (ARM) ساخته شده، که آن را به اولین ابرارایانه مبتنی بر آرم تبدیل کرده که به رتبه اول جهان دست یافته است. فوگاکو شامل ۱۵۸٬۹۷۶ نود محاسباتی است که هر کدام توسط پردازنده سفارشی A64FX فوجیتسو قدرت میگیرد و عملکرد پیک آن در حالت دو دقتی ۵۳۷ پتافلاپس و در حالت تک دقتی بیش از ۱ اگزافلاپس است.
این ابرارایانه نه تنها برای محاسبات علمی طراحی شده، بلکه برای حل مسائل اجتماعی و علمی پیچیده مانند مدلسازی همهگیریها، شبیهسازیهای پزشکی و تحقیقات هوش مصنوعی به کار میرود. ابررایانه فوگاکو با مصرف انرژی ۳۰ مگاوات، کارایی انرژی بالایی دارد و در رتبهبندی Green500 نیز عملکرد برجستهای نشان داده است. از زمان راهاندازی، فوگاکو در بنچمارکهای مختلف مانند TOP500، HPCG و HPL-AI رتبههای برتر را کسب کرده و نقش کلیدی در تحقیقات کووید-۱۹ ایفا نموده، از جمله شبیهسازیهای پخش قطرات ویروسی و جستجوی داروهای بالقوه.
پروژه Fugaku و نقش RIKEN و فوجیتسو
ابررایانه فوگاکو بخشی از برنامه پرچمدار ۲۰۲۰ ژاپن (FLAGSHIP 2020) است که توسط وزارت آموزش، فرهنگ، ورزش، علوم و فناوری ژاپن (MEXT) تأمین مالی شده است. توسعه پروژه از سال ۲۰۱۴ آغاز شد و با همکاری نزدیک مرکز محاسباتی علوم رایکن و شرکت فوجیتسو پیش رفت. رایکن، به عنوان بزرگترین مؤسسه تحقیقاتی ژاپن، مسئولیت رهبری علمی و کاربردهای تحقیقاتی را بر عهده داشت، در حالی که فوجیتسو طراحی سختافزاری، از جمله پردازنده A64FX و شبکه اتصال TofuD را مدیریت کرد. همکاری بر پایه رویکرد “همطراحی” (co-design) استوار بود که در آن نرمافزار و سختافزار همزمان توسعه یافتند تا عملکرد بهینه متنوع حاصل شود.
رایکن با بیش از ۲۵۰۰ محقق، تمرکز خود را بر کاربردهای علمی مانند شبیهسازیهای فیزیکی، بیولوژیکی و هوش مصنوعی گذاشت و فوجیتسو با تخصص در فناوریهای HPC، بیش از ۱ میلیارد دلار سرمایهگذاری را تضمین کرد. پروژه شامل نه سازمان اولویتدار کاربردی بود که نیازهای خاص خود را برای شبیهسازیهای بزرگمقیاس مطرح کردند. تا سال ۲۰۲۱، فوگاکو به طور کامل عملیاتی شد و دسترسی اشتراکی برای محققان دانشگاهی و صنعتی فراهم گردید. این مشارکت نه تنها ژاپن را در صدر محاسبات جهانی قرار داد، بلکه الگویی برای همکاریهای بینالمللی شد.
معماری سختافزاری ابررایانه فوگاکو
معماری فوگاکو بر پایه یک سیستم موازی عظیم با ۱۵۸٬۹۷۶ نود محاسباتی استوار است که در ۴۳۲ رک سازماندهی شدهاند. هر نود شامل یک پردازنده A64FX است که ۴۸ هسته محاسباتی و ۲-۴ هسته کمکی دارد، و با حافظه HBM2E 3D-stacked (۳۲ گیگابایت در هر نود) جفت شده است. این معماری بدون GPU، بر محاسبات برداری باSVE (Scalable Vector Extension) آرم تمرکز دارد و پهنای باند حافظه ۱ پتابایت بر ثانیه را فراهم میکند. سیستم از ۷٬۶۳۰٬۸۴۸ هسته کلی تشکیل شده و فرکانس کلاک ۲.۰ گیگاهرتز در حالت عادی و ۲.۲ گیگاهرتز در حالت بوست عمل میکند.
شبکه اتصال TofuD با توپولوژی مش/توروس ششبعدی، ارتباط کمتأخیر و پهنای باند بالا (۴۰.۸ گیگابایت بر ثانیه در هر نود) را تضمین میکند. ذخیرهسازی سهلایه شامل LLIO برای دسترسی محلی NVMe، FEFS بر پایه Lustre با ۱۵۰ پتابایت ظرفیت، و آرشیو نواری برای دادههای بلندمدت است. سیستم عامل مبتنی بر لینوکس با کرنل دوگانه IHK/McKernel، jitter سیستم عامل را کاهش میدهد و محیط برنامهنویسی با MPI و OpenMP سازگار است.
مشخصات فنی پردازنده
پردازنده A64FX، قلب تپنده فوگاکو، یک میکروپروسسور ۶۴ بیتی مبتنی بر معماری آرم v8.2-A است که توسط فوجیتسو برای HPC طراحی شده و اولین پیادهسازی SVE در مقیاس سرور است. این پردازنده با فرآیند ۷ نانومتری TSMC ساخته شده و شامل ۴۸ هسته محاسباتی (با ۱۲ هسته در هر خوشه) و ۲-۴ هسته کمکی برای مدیریت OS است. هر هسته ۵۱۲ بیتی SVE پشتیبانی میکند که عملیات برداری را برای FP16/32/64 و INT8/16/32 تسریع مینماید، و عملکرد پیک ۳.۳۷۹۲ ترافلاپس در FP64 را در هر چیپ ارائه میدهد. حافظه کش L1 ۶۴ کیلوبایت (دستور و داده) در هر هسته، L2 ۳۲ مگابایت در هر خوشه، و L3 ۹۶ مگابایت در چیپ است.
A64FX با ۸ کانال HBM2E (۱ ترابایت بر ثانیه پهنای باند) جفت شده و کنترلرهای TofuD و PCIe Gen3 را یکپارچه کرده است. ویژگیهای RAS شامل ۱۲۸٬۴۰۰ چککننده خطا برای قابلیت اطمینان بالا است. فرکانس ۲.۲ گیگاهرتز در بوست، نسبت قدرت به وزن عالی (نزدیک به Xeon) را فراهم میکند و مصرف انرژی ۳۴۲ وات در هر سوکت است. پردازنده با تمرکز بر HPC و AI، فوگاکو را قادر به اجرای شبیهسازیهای پیچیده میسازد و در سیستمهای کوچکتر مانند PRIMEHPC FX700 نیز استفاده میشود.
توان پردازشی و رتبهبندی فوگاکو در لیست TOP500
ابررایانه فوگاکو با عملکرد ۴۴۲ پتافلاپس Rmax در HPL، از ژوئن ۲۰۲۰ تا می ۲۰۲۲ رتبه اول TOP500 را حفظ کرد و اولین ابرارایانه آرم در صدر بود. در نوامبر ۲۰۲۰، پس از ارتقا، عملکرد به ۴۴۲ پتافلاپس رسید و مجموع چهار ابرارایانه بعدی را پشت سر گذاشت. در HPCG، با ۱۶ پتافلاپس، ۵.۴ برابر سامیت برتر بود و رکورد را برای پنج دوره متوالی نگه داشت. در Graph500، امتیاز ۲۰۴.۰۶۸ تراتپس با ۱۵۲٬۰۶۴ نود، اولین امتیاز بالای ۲۰۰ تراتپس را ثبت کرد.
در HPL-AI، فوگاکو ۲ اگزافلاپس در دقت مخلوط به دست آورد و اولین سیستم اگزاسکیل در این بنچمارک شد. در نوامبر ۲۰۲۴، رتبه ششم TOP500 با ۴۴۲ پتافلاپس، دوم HPCG و اول Graph500 را داشت.
شبکه ارتباطی TofuD و ویژگیهای آن
شبکه TofuD، نسل چهارم Torus Fusion، یک اتصال ششبعدی مش/توروس است که ۱۵۸٬۹۷۶ نود را با تأخیر کم و پهنای باند بالا متصل میکند. هر نود شش TNI (Tofu Network Interface) با ۶.۸ گیگابایت بر ثانیه دارد، مجموع ۴۰.۸ گیگابایت بر ثانیه، و روتر ۱۰ پورتی با ۲۰ لین. TofuD با RDMA، تزریق پهنای باند ۲۰ گیگابایت بر ثانیه و ظرفیت سوئیچینگ ۱۴۰ گیگابایت بر ثانیه را فراهم میکند و fault-tolerance با برش دینامیک پکت را دارد.
ویژگیهای کلیدی شامل مقیاسپذیری ۱۰۰k+ نود، پشتیبانی از barrier sync و multi-rail برای ارتباطات همزمان است. TofuD نسبت به Tofu قبلی، تراکم بالاتر و تحمل خطا را افزایش داد و در بنچمارکها مانند Graph500 برتر است. با ۲۰۰٬۰۰۰ کابل (نیمی فیبر نوری، ۹۰۰ کیلومتر طول)، TofuD ارتباط کارآمد را تضمین میکند و فوگاکو را برای شبیهسازیهای بزرگمقیاس ایدهآل میسازد.
سیستمهای خنکسازی و مدیریت حرارتی ابررایانه فوگاکو
فوگاکو با تولید حرارت بالا (تا ۱۰۰ کیلووات بر متر مربع در رک)، از خنکسازی مایع مستقیم استفاده میکند که ۹۰ درصد حرارت را با آب جذب مینماید. هر رک ۱۹۲ واحد CPU-Memory (CMU) دارد که با لولههای مایع خنک میشوند و LCU (Liquid Cooling Unit) جریان آب را از مرکز به لبه هدایت میکند تا دمای CPU زیر ۳۰ درجه سلسیوس بماند. سیستم دوگانه اولیه و ثانویه، با سنسورها و پمپهای قابل تنظیم، دمای ثانویه را در ۱۵ درجه سلسیوس نگه میدارد.
چیلرها و مبدلهای حرارتی Alfa Laval، حرارت را به بخار تبدیل کرده و از برج خنککننده دفع میکنند. نسبت خنکسازی آب به هوا ۹:۱ است و نسبت به کی، شش برابر کارآمدتر. سیستم خنکسازی با نگهداری زنده (live maintenance)، پایداری را تضمین میکند و کارایی انرژی ۱۴.۱۷ گیگافلاپس بر وات در Green500 را حاصل نموده است.
کاربردهای علمی گسترده فوگاکو
ابررایانه فوگاکو کاربردهای علمی متنوعی از نجوم تا مواد را پشتیبانی میکند و شبیهسازیهای دقیق را امکانپذیر میسازد. در نجوم، مدلسازی تکامل کیهان و ماده تاریک را تسریع میکند و در هواشناسی، پیشبینیهای دقیقتر را فراهم مینماید. در انرژی، شبیهسازیهای همجوشی هستهای و سلولهای سوختی را انجام میدهد و در مواد، ساختارهای نانویی را مدل میکند. فوگاکو با ۴.۸۵ پتابایت حافظه، big data را پردازش کرده و در شیمی، واکنشهای کاتالیستی را شبیهسازی مینماید. در فیزیک، شبیهسازیهای ذرات بنیادی و گرانش کوانتومی را اجرا میکند و در مهندسی، سازههای بزرگ را تحلیل مینماید.
استفاده از فوگاکو در تحقیقات پزشکی و بیولوژی
فوگاکو در پزشکی و بیولوژی، شبیهسازیهای مولکولی را برای کشف دارو و مدلسازی بیماریها تسریع میکند. در ژنومیک، شبکههای ژنی را تحلیل کرده و در سرطان، مکانیسمهای مهاجرت سلولی را مدل مینماید. با DeepTensor، ژنومهای پیچیده را پردازش میکند و در قلب، شبیهسازیهای نارسایی را انجام میدهد. در مغز، مدلهای دیجیتال کورتکس موش را با ۱۰ میلیون نورون ساخته و بیماریهایی مانند آلزایمر را مطالعه مینماید. فوگاکو دادههای بزرگ پزشکی را ادغام کرده و با AI، پیشبینیهای شخصیسازیشده را فراهم میکند.
فوگاکو در تحقیقات کووید-۱۹، شبیهسازیهای پخش قطرات را انجام داد و نشان داد که ماسک و تهویه، خطر را ۹۰ درصد کاهش میدهند. با ۱۷.۵ میلیون ساعت نود، مدلهای عفونت را در قطارها و دفاتر شبیهسازی کرد و به سیاستهای عمومی کمک نمود. در کشف دارو، ۲٬۰۰۰ ترکیب را غربالگری کرده و ۳۰ داروی بالقوه مانند ایورمکتین را شناسایی نمود.
در واکسن، پروتئینهای SARS-CoV-2 را مدل کرد و جهشها را پیشبینی نمود، که به توسعه واکسنهای mRNA کمک کرد. ابررایانه فوگاکو مکانیسمهای اتصال ویروس به سلولها را شبیهسازی کرده و درمانهای کوچکمولکولی را تسریع بخشید.
مقایسه ابررایانه فوگاکو با سامیت و فرانتیر
ابررایانه فوگاکو در مقایسه با ابرارایانههای آمریکایی سامیت (Summit) و فرانتیر (Frontier)، برتریهای منحصربهفردی در کارایی و کاربردهای عمومی نشان میدهد. سامیت، ساختهشده توسط IBM در آزمایشگاه ملی اوک ریج (ORNL) در سال ۲۰۱۸، با عملکرد ۱۴۸.۸ پتافلاپس در بنچمارک HPL، از سال ۲۰۱۸ تا ۲۰۲۰ رتبه اول TOP500 را داشت. این سیستم بر پایه پردازندههای POWER9 و GPUهای NVIDIA V100 استوار است و برای محاسبات GPU-محور بهینهسازی شده، اما فوگاکو با ۴۴۲ پتافلاپس در سال ۲۰۲۰، ۲.۸ برابر سریعتر بود و بدون GPU، بر محاسبات CPU-محور تمرکز دارد. سامیت در HPCG تنها ۲.۹۳ پتافلاپس امتیاز گرفت، در حالی که فوگاکو ۱۶ پتافلاپس را ثبت کرد، که ۵.۴ برابر برتر است.
فرانتیر، ساختهشده توسط HPE Cray در ORNL و راهاندازیشده در ۲۰۲۲، اولین ابرارایانه اگزاسکیل واقعی است با ۱.۱ اگزافلاپس، که فوگاکو را از رتبه اول TOP500 جابهجا کرد. فرانتیر بر پایه AMD EPYC و GPUهای AMD Instinct MI250X است و کارایی انرژی ۵۲.۲۳ گیگافلاپس بر وات دارد، اما فوگاکو در HPCG همچنان پیشتاز است با ۱۶ پتافلاپس در برابر ۱۴.۰۵ پتافلاپس فرانتیر. فوگاکو با معماری آرم، انعطافپذیری بیشتری برای کاربردهای علمی عمومی مانند شبیهسازیهای بیولوژیکی ارائه میدهد، در حالی که سامیت و فرانتیر بیشتر برای AI و GPU-محور مناسباند. در HPL-AI، فوگاکو ۲ اگزافلاپس دارد، اما فرانتیر با ۹.۹۵ اگزافلاپس پیشی گرفت.







