8月30日,國內最大的智算中心在哈爾濱市投入使用,該中心部署共計1.8萬張AI加速卡,建設國內最大的超萬卡智算集群。待集群建設完成后,可提供算力6.6EFLOPS(EFLOPS指每秒進行1018次浮點運算)。
這是我國算力基礎建設的最新標志性事件。當前,算力正在加速成為驅動生產(chǎn)力變革的關鍵力量,智算中心建設在全球呈現(xiàn)競速狀態(tài)。在此方面,國內建設熱潮涌動,推進速度不斷加快。據(jù)不完全統(tǒng)計,2023年全國新建智算中心項目超100個。
算力服務異軍突起
“隨著生成式AI的突飛猛進,算力越來越成為數(shù)字經(jīng)濟社會發(fā)展的重要底座。超算、云計算、大數(shù)據(jù)、AI的融合創(chuàng)新發(fā)展,推動算力需求迅猛增長;近3年來TOP100企業(yè)的算力服務份額不斷攀升?!钡谑膶萌珖f(xié)委員、中國科學院計算技術研究所研究員張云泉表示,多方合力不斷加碼,推動中國算力發(fā)展快速步入全新階段。
為了促進算力基礎設施建設,我國于2023年一年中先后出臺了《生成式人工智能服務管理暫行辦法》和《算力基礎設施高質量發(fā)展行動計劃》。預計到2025年,我國算力規(guī)模將超過300EFLOPS,智能算力占比達到35%。
地方政府則通過制定相關政策、提供資金支持、規(guī)劃區(qū)域布局,為智算中心建設提供基礎保障。
據(jù)數(shù)智前線的不完全統(tǒng)計,僅今年前7個月,圍繞土建基礎設施和IT基礎架構等方面的建設內容,已發(fā)布的智算中心相關項目中標公告就超過140個。
近期,城地香江、奧飛數(shù)據(jù)、拓維信息等多家A股上市公司均披露了斬獲算力基礎設施建設服務相關訂單,金額均在10億元以上。
智算中心建設覆蓋的城市十分廣泛,據(jù)不完全統(tǒng)計的140多個項目所分布的省區(qū)市至少23個,其中以安徽、江蘇、北京、山東、浙江等省市最多。
隨著智算中心建設的大規(guī)模展開,算力市場規(guī)模也快速增長,IDC數(shù)據(jù)顯示,2023年下半年,中國智算服務市場整體規(guī)模達114.1億元,同比增長85.8%。
張云泉表示,算力服務異軍突起,中國已進入算力經(jīng)濟時代,這是由數(shù)字經(jīng)濟衍生的一種新經(jīng)濟形態(tài),其以計算為核心,已成為衡量一個地方數(shù)字經(jīng)濟發(fā)展程度的代表性指標和新舊動能轉換的主要手段。據(jù)測算,對算力每投入1元就可帶動經(jīng)濟產(chǎn)出3-4元;算力發(fā)展指數(shù)每提高1點,GDP增長約為1293億元。
各地切勿盲從
數(shù)智前線的統(tǒng)計顯示,在智算中心建設項目涉及的城市中,不僅有北京、成都、武漢、杭州、合肥、蘇州等區(qū)域經(jīng)濟發(fā)達且具有一定人工智能基礎的一二線城市,也包括很多三四五線城市,如安徽省安慶市、新疆維吾爾自治區(qū)克拉瑪依市、山東省德州市等。
張云泉介紹,各地建設智算中心熱情高漲,但也出現(xiàn)了不顧實際需求、重復建設的現(xiàn)象,甚至有的城市同時建設多個超算中心和智算中心。
“智算中心的生命周期比較短,一般只有5-10年。地方政府要發(fā)展算力產(chǎn)業(yè),尤其是建設算力基礎設施,必須考慮自身需求,配套政策,碳排放指標,電力供應和電價,網(wǎng)絡延遲和帶寬,產(chǎn)業(yè)鏈建設,運營能力,人才隊伍,選址和氣候環(huán)境,水資源供應,容災備份,投資回報等因素?!睆堅迫f。
今年4月份,北京市發(fā)布《北京市算力基礎設施建設實施方案(2024-2027年)》提出,改變智算建設“小、散”局面,集中建設一批智算單一大集群,到2025年,北京市智算供給規(guī)模達到45EFLOPS,2025-2027年根據(jù)人工智能大模型發(fā)展需要和國家相關部署進一步優(yōu)化算力布局。
萬聯(lián)證券投資顧問屈放表示,目前算力閑置率較高,國內的算力中心整體利用率僅有50%,這種資源浪費問題需要得到重視。此外,當前算力中心比較分散,雖然各地都有各自的算力中心建設計劃,但較難形成協(xié)同運轉。
智算中心運行過程中出現(xiàn)的問題需得到重視。聯(lián)想中國基礎設施業(yè)務群戰(zhàn)略總監(jiān)黃山表示,算力基礎設施建設目標,是高效可靠的承載計算工作負載包括通用、科學、AI計算。不同計算類型需要不同的算力基礎設施軟硬件架構來支持。尤其是日新月異的AI計算,對異構算力協(xié)同、大規(guī)模集群計算穩(wěn)定性及集群計算效率、能效、算法與算力的匹配等各方面算力基礎設施都提出新的要求。
值得關注的是,智算訓練集群規(guī)模不斷擴大的過程中故障率呈現(xiàn)指數(shù)級增長,故障難監(jiān)控、難診斷、更難恢復;AI算力按需分配這一需求背后所需要的任務編排、監(jiān)控和優(yōu)先級管理、彈性擴縮容技術在業(yè)界還沒完全成熟,需要大量的現(xiàn)場實踐調優(yōu)。
張云泉表示,算力基礎設施要按需建設,適當超前,需進行充分論證,而不顧市場需求盲目上馬,肯定會導致投資無法收回,造成浪費。(孫立彬)
轉自:中國高新技術產(chǎn)業(yè)導報
【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65363056。
延伸閱讀