物理新新聞

善用國科會核心高效能科學計算服務,開啟科研新境界

國科會高效能核心科學計算中心(NSTCCore)2025年12月25日11
分享:

讓國科會高效能核心科學計算中心(NSTCCore)提供的科學計算服務(HPC),成為研究教學的最佳夥伴,協助增進科學發現與創新效能!

💻 計劃簡介:打造科研運算與儲存的全方位支援

由國家科學及技術委員會資助之高效能核心科學計算中心 (NSTCCore),於 2023 年夏季正式成立,由中央研究院物理所網格中心 (Academia Sinica Grid Computing Centre, ASGC) 負責維運。主要目標為提供國內學研團隊便利使用、中型規模(約 10,000 CPU core)、高效能、低價的科學計算資源與服務。適合各類型科學計算 、大數據分析、以及規模小於 1,000 CPU core 的高效能平行計算(high-throughput computing)。服務模式係以使用者需求為導向,提供客製化、彈性的合作方案與資源配置,協助使用者有效利用本設施資源,並促進資源的最佳使用效率。一方面讓科研團隊可專注於科學研究,同時與國家高速網路與計算中心合作,提升科學計算服務量能與基礎架構。考量設備建置經費由國科會補助,使用費計價僅計算維運費用(包含設備與空調用電,分攤機房維運實際花費),因而得以優於自行購置設備整體維運成本(total cost of ownership)的低廉價格,提供各領域研究團隊服務。

https://bimonthly.ps-taiwan.org/cms/media/NST_圖片1-1024x681.jpg

圖 1: 核心計算中心設置於中央研究院物理研究所的 ASGC (Academia Sinica Grid Computing) 計算中心。


1本中心所服務之科學計算,泛指涵蓋各種形式、以科學研究教育與應用為目的,廣義的科學計算。

💻 服務與資源
本中心提供整合式高效能計算與檔案管理系統,針對不同研究需求,兼顧最佳效能與低使用成本,提供彈性與客製化的大數據處理與分析流程以及資源配置解決方案,協助建立所需計算分析環境,便利的有效利用各項資源與服務。持續提升穩定性與效能(包含科學計算效能、機房能源效益與資訊安全),提升智慧化監控程度,則為本中心的另一要務。

在國科會的支持下,2023 年起,每年均新增 CPU 計算與磁碟系統等資源。至 2025 年底,將可提供 6,272 CPU cores, 以及 8 Petabyte 磁碟儲存系統 (本文截稿時 2025.10, 可用資源為 4,352 CPU cores, 5 Petabyte 儲存空間)。預計執行五年後 (2028 年開始),可維持至少 10,000 CPU cores, 12 Petabyte 檔案系統的規模。2026 年起亦將配合需求,逐年購置 GPU 資源。在高可擴充性的系統架構下(如圖二),之後維持每年更新;好處是使用者可了解新的硬體技術優點與利用方法。

此外,由於網格中心同時也擔負中研院核心設施功能,提供全院大數據分析與科學計算服務,基於相同的核心技術與服務內容,因此與本計劃資源與研發維運人力整合執行,以發揮雙方資源綜效,提供提升整體科學計算服務量能。同時,藉由使用者委員會協助,建立公平合理易用的使用環境以及資源與服務策略。針對資源配置、收費與服務、執行方式以及中長期目標等策略,提供建議,持續提升本中心服務品質與成效。

https://bimonthly.ps-taiwan.org/cms/media/NST_圖片2-1024x455.png圖 2: 同時提供高效能科學計算與雲端計算服務,以彈性有效的支援各領域的不同研究需求。

✅ 高效能科學計算與雲端計算服務
提供使用者便利的 Slurm 及 Web-based 雲端計算(Software-as-a-Service, SaaS)服務介面,利用本中心各類 CPU 或 GPU 資源,高效能的完成所需資料處理與分析計算。同時支援機器學習或需要的科學計算軟體與環境,包含客製化建立 Web Application, JupyterLab 應用環境,容器化(containerization, 使用 Singularity,提供獨立、可攜性以及安全的)軟體環境建置。目前可用的 SaaS DiCOS App 服務,已超過 70 項。各項已建置可使用的軟體環境與工具,請參閱本核心資源網站。本計劃同時支援大數據分析的流程整合與最佳化,支援與研究設施間的整合,促進大數據分析流程與效能最佳化。
GPU 資源目前使用網格中心管理的中研院核心設施的既有資源(包含NVIDIA A100、V100、RTX4090、RTX3090, L40S 等規格),與本計劃設備互補整合,提供使用者最大的計算能力。

✅ 檔案系統與儲存服務
本中心使用 Ceph 高效能檔案系統,提供穩定高效擴充性強的計算與儲存服務。利用CephFS 檔案系統、 Erasure Coding 機制,以及大規模分散儲存架構,建立容錯能力更高、更有彈性、且能平行 I/O 的大規模磁碟儲存系統,提供包含使用者空間、HPC/HTC 計算檔案系統、以及跨系統的檔案分享等服務,同時兼具更佳的效能與穩定性。本中心 Ceph  檔案系統單日資料存取量可達 O(1000)TB。每個使用群組,均有 3TB 免費的群組共享空間,每個使用者帳號,最大免費空間則為 100GB。
2024 年,整合了由中研院核心設施購置的 10PB 磁帶櫃系統,提供備份以及較低使用率研究資料的儲存空間,將更多的 Ceph 空間,提供給需要高效率存取服務的應用。

✅ 使用者服務與研究支援
本中心採用使用者為中心的服務與彈性合作模式,協助使用者有效利用各類資源,並有效支援不同領域研究需求。主要方式有:1) 協助客製化的軟體環境建置與計算流程整合,提供如同量身打造的計算服務。2) 強化溝通,了解使用者需求,協助解決應用問題。包含與新使用群組訪談,提供資源規劃建議。同時,每週定期舉行使用者會議 (User Meeting),可及時處理使用者需求與問題,同時也報告近一週的資源與服務情形。3) 提供彈性的合作模式,積極建立與不同需求研究團隊的合作。目前計有實支實用(pay-as-you-go)、資源整合 (Resource Integration)、設備共置 (Buy-In)、服務共置(Service Collocation)、先進服務等案例。4) 教育訓練與服務推廣,每年舉辦三至四次教育訓練,除提供使用者入門、實機操作以及服務與合作推廣等內容,並藉此了解使用者需求。此外,亦支援研究團隊或主題社群合辦主題式的教育訓練(例如高能物理資料分析、GPU 計算、軟體工具與分析環境使用、AI 研究應用等),以及支援研究主題研討會中之數據分析與科學計算等訓練課程(包含軟硬體環境準備與實機操作訓練)。此外,本中心亦於國科會自然處協助下,參加各學會年會,以了解可能使用群的需求,介紹本中心服務,增進合作。5) 持續提升機器學習應用環境與支援能力,協助研究團隊有效利用本中心資源:除配合需求提供 GPU-based 的機器學習環境 (TensorFlow, PyTorch, Keras, Scikit-Learn 等),或所需的工具與套裝軟體,亦提供使用者程式整合、分析流程最佳化、應用環境容器化、以及軟體可攜化包裝(以轉移至國網中心等大型計算中心執行)等服務。此外,透過彈性資源配置,可即時支援較大規模計算資源需求的研究應用。

💻 成功案例分享
目前,NSTCCore 高效能核心科學計算中心為全台各研究機構與大學提供服務,支援超過 140 個研究團隊,涵蓋約 600 名使用者。這些研究團隊從事許多不同的研究主題,包括天體物理學、生物醫學、化學、氣候研究、地球科學、資訊科技、數學、微生物學、粒子物理學以及太空科學。過去十八個月中,我們的 CPU 資源使用量持續穩定增加(如圖三所示),每週達到約 25,000 個 CPU core-day。GPU 資源的使用量也穩步成長,在過去六個月內總計達到 17,000 個 GPU board-day 。藉由本計算中心的運算資源,研究團隊已取得多項卓越成果,部分成果列示如下。

https://bimonthly.ps-taiwan.org/cms/media/NST_圖片3-1024x661.jpg

📍 支援中研院資創中心和資訊所團隊參加AI模型國際競賽
「高規格的GPU叢集資源取得不易,但透過使用此可負擔服務,讓中研院資創中心和資訊所的團隊能突破限制,從原先用單機訓練的語音和大語言模型,在HPC GPU叢集上加速,以致能參與大型的國際競賽,在競爭激烈的學術領域中發揮實力!」

📍 快速軟體部署,客製化環境預備,使得研究人員能專注於研究問題、加速研究產出
「目前我們部署的軟體應用已超過五十項,涵蓋生物資訊(CryoEM 蛋白質結構分析與BioSAX生物結構實驗資料分析,AlphaFold, RosettaFold)、科學計算與數據分析(Matlab, Octave, Root)、物理化學(DeepMD, Gromacs)、地球科學(地震波模擬(SPECFEM3D)、海嘯波模擬 (iCOMCOT)、氣候模擬(WRF))、通用科學計算環境與工具(JupyterLab, Paraview, OpenACC,資料傳輸服務)、以及機器學習應用環境等。」

📍  整合實驗設施及研究社群的科學應用資料分析流程整合及最佳化
「提供了全方位的進階支援服務,提升實驗社群資料分析效能:(1)將實驗設施與大數據分析流程間之延遲從三天縮短至二小時內(包含研發on-the-fly 即時傳輸且減少資料傳輸量);(2)整合所需分析軟體與大數據儲存、GPU/CPU等資源,並配合分析流程開發 Web 使用環境;(3) 提供高可擴充性系統,支援超過 30 個研究團隊所需之高效能計算環境。

本中心目標為服務台灣科學界的中型計算中心,為使用者提供全面的硬體和軟體資源支持,並協助研究團隊客製化大數據分析流程,以提高分析效能,從而使研究團隊無需自行建置計算資源,而能專注於科學問題。目前正以提供整合資料、演算法與計算資源的科學計算環境,以配合快速增加的此類需求。共同的研究需求,將優先建立為公共服務;隨著使用群組增加,新的服務將隨著需求更新。依據實際運作經驗,整合適當的服務、硬體設備以及技術支援團隊,才能獲得所規劃的成效。需求與資訊軟硬體技術的快速變遷下,前述三大支柱必須能夠持續強化提升。


📩 服務與聯絡資訊
[NSTCCore 核心科學計算中心網站]:https://nstccore.twgrid.org
[聯絡技術支援窗口]:Email to <DiCOS-Support@twgrid.or>

善用國科會核心高效能科學計算服務,開啟科研新境界 | 物理雙月刊