成功大學啟用數位無限 AI-Stack 平台,帶動 AI 研究量能完美躍升

成功大學啟用數位無限 AI-Stack 平台,帶動 AI 研究量能完美躍升

現今人工智慧(AI)已在各行各業掀起一波波革命,成為翻轉世界的重要力量,驅使多數企業投入相關應用發展,亟思以 AI 驅動數位轉型。許多大學基於學用合一考量,也紛紛開啟 AI 學程,期望培養學生解決 AI 問題的能力與經驗,日後投入職場能學以致用。

綜觀各個大專院校的 AI 發展進程,國立成功大學展現的雄心壯志,堪稱相對顯著。成功大學計算機與網路中心主任詹寶珠說,2015 年蘇慧貞校長上任後,便將 AI 列為主要推動項目,要求全力發展 AI 跨領域應用與研究;後續舉凡承接科技部計畫投入 AI 生技醫療創新研究、與臺南市政府合作計算登革熱病媒蚊熱區、與產業界合作打造智慧防疫手環、首創將 AI 運用至校園安全作業…等等,在在彰顯其旺盛企圖心。

為打造堅實的 AI 研究基底,成大不吝投資引進多台 NVIDIA DGX-1 超級電腦;但欲使這些超級電腦發揮極致價值、不再只是一台台單機,需要藉助好的管理平台,將多台單機匯聚為可調控的資源池,同時滿足多項研究計畫運作需求。計算機與網路中心(以下簡稱計中)透過長期資服夥伴敦陽科技的推薦,因而獲知數位無限的 AI-Stack 機器學習協作管理平台,經評估後發現,它的管理機制相當到位,且原廠擁有純熟的軟體開發及技術支援能力,可配合成大需求進行客製化修改,於是拍板決定採用 AI-Stack,建構成大 AI 資源平台的管理核心。

詹寶珠主任表示,AI 資源平台 24 小時運作,開放給各學院和各系所師生申請使用 GPU 資源,不可能依靠人工來執行排程和計價;有了 AI-Stack 協助,成大即可藉由其中的自動化排程功能,有條不紊調控每一份 GPU 資源,還可運用獨特的錢包儲值功能,準確計算每個使用歷程的衍生費用,落實使用者付費精神。


配合校方申請流程規範,悉心提供客製協助


成大對 AI 資源平台寄予深切期待,希望展現最大的應用彈性與價值,因此在 AI-Stack 導入過程中,提出許多調整需求,屢屢獲得數位無限積極妥善的回應。

首先為確保使用者能持續享用最佳訓練環境,數位無限悉心為成大計中提供自主升級的操作指引,以利 AI 資源平台隨時更新到最新版的 NGC(Nvidia GPU Cloud)AI Framework、CUDA Driver,恆常維持最佳狀態。

其次校方非常重視 AI 模型訓練與 AI 訓練資料兩者搭配性,以及資料流程的順暢性,為此數位無限展現技術能量,透過綁定個人 NFS 資料空間的獨特設計,讓使用者每次建立 AI 訓練環境的同時,皆可一併掛載其專屬儲存空間,不需額外費心下載或搬移所需檔案,一來提高資料使用與傳遞效率,二來也確保不同專案計畫彼此資料檔案的有效隔離。

再者早先校內其他單位採購的 DGX-1 因後續無人管理,校方決定由計中統一管控;得力於 AI-Stack 強大的橫向納管能力,使這些額外納入的 GPU 伺服器,都能立即加入資源池、提供給使用者自助申請使用;反之當計中出借 DGX-1 予成大醫院使用時,平台也能快速將這些伺服器移出叢集。絕佳的擴容與縮容彈性,讓計中同仁備感受益良多。

不僅如此,數位無限全力配合校方申請機制與資訊規範,針對整體網站視覺設計、整合身份驗證入口、計劃單填寫設計、申請訂單規劃、同意與駁回的審核流程系統、GPU 資源試用模式等等事項,提供完善的客製協助。


自助式服務機制,便於師生加速推動 AI 訓練


詹寶珠主任歸納,AI-Stack 上線啟用至今雖僅有短短幾個月,但已為成大帶來許多實質效益。最顯而易見的是管理方便性、減少計中同仁的管理負擔。主要歸功於 AI-Stack 具備完善 Web 介面,可供自助式申請與運用 AI 資源服務,加上整合全校教職員生身份驗證機制,因此能將資源使用權利直接交予使用者,從而依表單內容快速產生開發環境,快速展開日常例行性 AI 訓練操作;影響所及,計中管理者不需為了協助使用者建立訓練環境而時時緊盯系統,只需透過系統報表定期察看使用狀況,就能清楚掌握 GPU 資源運用情況,讓 GPU 管理工作事半功倍。

此外受惠於錢包儲值功能,不僅實現了精準的成本費用計算功能,更方便校內師生依照研究計畫、專題或各類學程的編列預算,進行有效管控,使全校師生更有效率、更公平地使用 GPU 運算資源,可謂 AI-Stack 的附加價值。

另一方面,大專院校的研究單位多數申請過國家高速網路中心 TWCC 的 GPU 資源,而數位無限是 TWCC 原型系統 TWGC 的創始開發團隊成員,所以用戶在使用 AI-Stack 時,無論操作介面的直覺式設計,或資源部署流程的友善性,皆可駕輕就熟快速上手,有助大幅加速 AI 資源導入計畫與新系統上線的進程。

更重要的,本次專案計畫從需求規劃、環境建置,直到正式開放使用者啟用 AI-Stack,一路走來數位無限都盡情展現 AI 領域的熱忱與專業,並細心與校方承辦同仁互動、深入熟悉成大的 AI 應用場景與環境細節,讓此次新系統的上線計畫順利推進。展望今後,成大將持續善用此一平台,共同提升校方與師生的 AI 研究量能,期望催生更多跨領域智慧應用成果,為臺灣產業轉型升級、智慧醫療落地實踐,乃至各項便民服務的發展,做出最大貢獻。

Infinities
Infinities

數位無限軟體(InfinitiesSoft)專注於為企業解決虛擬化、容器化、微服務、邊緣運算、混合雲管理、異質IT環境與人工智慧帶來的挑戰,整合異質雲管與熱門的開源AI深度學習架構和開發工具環境,提供一站購足的AI機器學習雲平台方案AI-Stack。

相關文章
相關關鍵字