中新網上海6月27日電(李秋瑩)6月27日,國內高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)在復旦大學正式上線。這臺為發現和解決復雜科學問題而建的科研“超級計算機”由復旦大學與阿里云、中國電信共同打造,以先進的公共云模式提供超千卡并行智能計算,支持千億參數的大模型訓練——這在國內高校中尚屬首例,也領先于斯坦福大學等國際知名高校。
目前,首個基于CFFF平臺訓練的科學大模型成果已正式發布,45億參數大模型一天訓完。
復旦大學校長、中國科學院院士金力表示,在數據和智能技術驅動的“大科學時代”,如何在日新月異的科技創新環境中贏得主動,在關鍵領域取得創新突破,是時代給予高校的命題。以CFFF平臺為代表的智算平臺作為一種新興的科研超算架構,將成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學原理發現和技術突破,并有力推動科學大模型的落地。
(資料圖片)
延續復旦大學“博學而篤志,切問而近思”的校訓,CFFF平臺由面向多學科融合創新的AI for Science智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。
復旦大學浩清教授、人工智能創新與產業研究院院長漆遠介紹,基于百G高速數據傳輸網和阿里云全球領先的大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,部署在復旦校內的“近思”一號和托管在1500公里外阿里云烏蘭察布數據中心的“切問”一號連成了一臺真正意義上的“超級計算機”,復旦四校區的所有實驗設備都能高速接入,做到異構算力統一管理,計算任務統一調度,滿足不同應用場景下的科學智能研究與應用需求。
它還擁有國內高校最大規模的多級數據冷熱分層存儲集群,解決了海量科研數據無法長期備份的痛點,并支持云上高速傳輸。以往PB級科研數據從復旦校內傳到西部數據中心需要兩周,如今當天就能完成,真正實現了“東數西算”。
位于“東數西算”節點上的阿里云烏蘭察布數據中心,以公共云模式為復旦校內多學院的多個科研項目提供更高性能、更具彈性、更低成本和更綠色的智能計算服務。漆遠表示,有賴于公共云模式,跑在CFFF平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。
同時,CFFF平臺更加低碳。阿里云綠色數據中心技術結合烏蘭察布當地天然的氣候優勢,CFFF平臺可實現年平均PUE小于1.2,每年可節省電力2000 MWh(兆瓦時),年均節碳量達約1500噸。
據悉,CFFF平臺從開始建設的第一天起,就收到了來自復旦不同院系的多種研究需求,不僅涵蓋生命科學、大氣科學、材料科學領域,也包括金融系統分析等社會科學研究。平臺上的云原生與低代碼工程化AI開發平臺,進一步降低了AI與科研融合的門檻。
鉆研介孔材料多年、曾獲國家自然科學一等獎的趙東元院士對平臺推進AI for Science研究充滿期待:“CFFF平臺的上線就像我們擁有了一個‘大科學裝置’,讓做科研如虎添翼。實驗科學的數據非常多,如果可以通過文獻數據找到設計一種材料的最佳路線,將會省掉很多時間,我們對物質的認識也會更加深入。”
目前,CFFF平臺上的第一個科研成果已經誕生。復旦大學人工智能創新與產業研究院李昊團隊近期發布了45億參數量的中短期天氣預報大模型,預測效果在公開數據集上首次達到業界公認的ECMWF(歐洲中期天氣預報中心)集合平均水平,并將預測速度從原來的小時級縮短到了3秒內。
“基于CFFF平臺的千卡并行智能計算,這樣一個規模的大模型只用一天就完成了訓練。傳統的計算平臺是很難做到的。”李昊說。
這也是CFFF平臺上孕育出的第一個大模型。金力表示,復旦希望基于CFFF平臺建成一批具有世界級影響力的科學大模型,例如生命科學大模型、材料科學大模型、大氣科學大模型、集成電路大模型等。
未來,CFFF平臺還將持續擴大其算力規模,并向復旦校外的科研機構、高校、醫院、高科技企業等開放。當天,面向全球科研人員的首屆世界科學智能大賽也宣布正式啟動,大賽設置生命科學、量子化學等五大賽道,CFFF平臺將為參賽隊伍提供免費訓練算力,并以更普惠的算力長期支持部分科研項目。(完)
關鍵詞: