訂閱
糾錯(cuò)
加入自媒體

有多少AI公司,如今困在智算中心?

2024-11-11 13:59
新眸
關(guān)注

這可能是國內(nèi)一些科技公司代價(jià)最大的一段彎路。

作者|李小東

直到現(xiàn)在,算力仍然被看作是制約國內(nèi)AI發(fā)展的主要因素。

為了解決這一問題,尤其是ChatGPT出現(xiàn)后,智算中心被視為AI時(shí)代如同水和電一般的新基建,在全國各地落地開花。截至今年上半年,全國建成和在建的智算中心超過250個(gè),有媒體報(bào)道,僅今年前七個(gè)月,就涌現(xiàn)出了140個(gè)新的中標(biāo)項(xiàng)目。

建設(shè)這些智算中心背后涉及的公司和機(jī)構(gòu),除了城投、運(yùn)營商、金融企業(yè)和一些央國企,大型的互聯(lián)網(wǎng)云計(jì)算公司,比如華為云、阿里云、騰訊云,甚至還有些從房地產(chǎn)等行業(yè)跨界過來的公司。

但另一組數(shù)據(jù)同樣值得關(guān)注:IDC指出,以企業(yè)為主要用戶的通用算力中心利用率,目前僅為10%-15%;之前有中科院院士公開表示,一些重量級的智算中心,現(xiàn)在大多甚至都處于閑置狀態(tài)。

從算力不足,到所謂的算力“過剩”,核心問題實(shí)際上并沒有完全解決。這就意味著,動(dòng)輒投資數(shù)十億甚至過百億的大項(xiàng)目,不僅沒有發(fā)揮出應(yīng)該有的價(jià)值,還成了這場AI熱潮中代價(jià)最高的新難題。

01

算力供給風(fēng)起云涌

不少人對“智算中心”這個(gè)詞可能還感到陌生。但它其實(shí)不算個(gè)新詞,可以理解為更高階的“計(jì)算中心”。

在計(jì)算機(jī)科學(xué)興起之初,由于計(jì)算設(shè)備昂貴且稀缺,許多機(jī)構(gòu)和組織會(huì)建立專門的計(jì)算中心,來集中提供高性能的計(jì)算資源和服務(wù)。隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步和普及,從最初的大型機(jī)時(shí)代到如今的云計(jì)算、邊緣計(jì)算,計(jì)算中心的形式和功能也發(fā)生了變化。

相較于傳統(tǒng)算力中心,智算中心在硬件層面使用GPU替代CPU,GPU并行處理在面對大規(guī)模數(shù)據(jù)集運(yùn)算時(shí)計(jì)算效率更高;另一方面,智算中心在軟件層面部署了AI框架,能將計(jì)算任務(wù)調(diào)配給不同的計(jì)算平臺,從而實(shí)現(xiàn)最大的效率。

按應(yīng)用角度來看,傳統(tǒng)計(jì)算中心更多地以存儲(chǔ)數(shù)據(jù)和提供互聯(lián)網(wǎng)服務(wù)為主;而智算中心是專門給AI應(yīng)用提供算力和數(shù)據(jù)存儲(chǔ)。

三年前,在推動(dòng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的背景下,國內(nèi)首個(gè)智算中心落地武漢,總投資約4.6億元,由于這類項(xiàng)目的建設(shè)過程中,通常會(huì)采用預(yù)制模塊化機(jī)房和整柜交付的方式,所以實(shí)際建設(shè)周期很短,僅僅6個(gè)月就能夠建成。

當(dāng)時(shí)一期的建設(shè)規(guī)模為100P FLOPS的AI算力,由數(shù)千顆昇騰AI處理器組成,算力峰值性能相當(dāng)于5萬臺高性能PC機(jī)。這是個(gè)怎樣的概念呢?以天文探索的場景為例,普通算力需要169天才能找到的特定星星,智算中心只用不到100秒。

新眸統(tǒng)計(jì)2021以來建成的智算中心,從以地方主導(dǎo)的項(xiàng)目,如武漢、合肥、南京、京津冀等,到后來以商湯、阿里云、百度云等大廠為主開始投資運(yùn)營,投入資金、算力規(guī)模整體呈現(xiàn)出明顯逐階上漲的趨勢。

比如2022年投入運(yùn)營的“商湯科技人工智能智算中心”,一期投入56億元,機(jī)柜數(shù)量5000個(gè),峰值訓(xùn)練算力達(dá)到3740P FLOPS;同年后來阿里云的張北智算中心上線,算力規(guī)模達(dá)到12000P FLOPS,總投入180億元。

過去的一年里,智算中心以量出圈。

具體表現(xiàn)在,一些四五線城市的智算中心拔地而起,比如甘肅慶陽、安徽宿州、山東棗莊等。相比大城市,這些城市土地資源豐富且價(jià)格低廉,渴望經(jīng)濟(jì)轉(zhuǎn)型,并帶動(dòng)周邊產(chǎn)業(yè)發(fā)展,因此對智算中心給予如稅收優(yōu)惠和資金補(bǔ)貼等支持,并且審批流程更簡化,建設(shè)進(jìn)度更快。

另一方面,智算中心需要實(shí)現(xiàn)算力的標(biāo)準(zhǔn)化、服務(wù)化,達(dá)到隨用隨取,類似于傳統(tǒng)公有云服務(wù)。這意味著智算中心不僅僅是提供硬件資源,而是要轉(zhuǎn)型為提供算力服務(wù),因此很多企業(yè),甚至是傳統(tǒng)企業(yè)都涌入了跨界做算力租賃的賽道。

同花順數(shù)據(jù)顯示,截至目前,算力租賃概念股已經(jīng)多達(dá)108家。例如,主營彩票印刷業(yè)務(wù)的鴻博股份,是A股首家宣布跨界算力的上市公司;蓮花健康主業(yè)是做味精的,也采購了大量英偉達(dá)GPU開展算力租賃業(yè)務(wù)。

02

算力租賃,一個(gè)新的風(fēng)口賽道

簡單來說,算力租賃就是當(dāng)你在需要強(qiáng)大算力來完成某個(gè)項(xiàng)目時(shí),不去自己購買昂貴的計(jì)算設(shè)備,而是去租用。服務(wù)商根據(jù)需求,搭建好所需的計(jì)算環(huán)境或系統(tǒng),然后通過簽訂合同的方式,把這套計(jì)算能力租給你用。

客戶付的是租金,用完之后這套設(shè)備的所有權(quán)還是歸服務(wù)提供方,也不需要自己去維護(hù)或者買下這些設(shè)備。通常情況下,算力租賃有四種收費(fèi)方式,按小時(shí)、按算力規(guī)模、按使用量和套餐計(jì)費(fèi)。

具體來看,一般小型科創(chuàng)公司在做一些科研項(xiàng)目、短期的數(shù)據(jù)處理任務(wù)等,對算力的使用時(shí)間不確定,按小時(shí)計(jì)費(fèi)就可以靈活控制成本。比如SFCompute公司提供按小時(shí)計(jì)費(fèi)的服務(wù),用戶可以根據(jù)自己的需求租用H100 GPU,價(jià)格還很便宜。

按算力規(guī)模計(jì)費(fèi),通常涉及到服務(wù)器性能、GPU數(shù)量等方面的評估,性能越好、效率越高,服務(wù)租金也更高。其次還有按照數(shù)據(jù)處理量、網(wǎng)絡(luò)流量的使用情況來計(jì)費(fèi)的方式。針對一些大型企業(yè)或有特殊需求的客戶,提供商可以根據(jù)客戶的具體要求定制個(gè)性化的套餐。

為什么要租?

眾所周知,這兩年大模型訓(xùn)練、微調(diào)、推理需求急劇增加,但關(guān)鍵在于,AI應(yīng)用在不同的開發(fā)階段,對算力的需求也不同。在開發(fā)周期中,需要大量的訓(xùn)練算力;當(dāng)模型開發(fā)完成上線后,就不再需要訓(xùn)練算力而是推理算力。

當(dāng)下算力租賃下的迫切需求,更多是源于模型訓(xùn)練。至于需要多少,參考GPT-4訓(xùn)練過程中A100卡數(shù)量達(dá)到萬張量級?紤]到服務(wù)器采購與租金成本,以及對算力的彈性需求,調(diào)試、維護(hù)成本,工程師研發(fā)時(shí)間成本,算力租賃成為大多數(shù)大模型廠商的最佳選擇。

然而,在目前的算力租賃市場,競爭格局呈現(xiàn)戶參與者眾多,但格局分散的特點(diǎn)。傳統(tǒng)的云服務(wù)提供商,高端算力資源相對充足,但對外租賃的比例較少。具備IDC建設(shè)運(yùn)營能力的企業(yè),比如浪潮信息、中科曙光,以及跨行過來做算力的企業(yè)也越來越多。

另一個(gè)問題,國內(nèi)在近幾年的算力投入下,與國外的差距不斷縮小,甚至單從規(guī)模上看,已經(jīng)到了全球頂尖的水準(zhǔn),尤其是智算中心的儲(chǔ)備,也遠(yuǎn)非供不應(yīng)求的狀態(tài)。

那么,在這種情況下,為什么還會(huì)有那么多公司爭相做租賃生意?

事實(shí)上,在供需方面,國內(nèi)的算力規(guī)模雖然增長,但面向AI、高性能計(jì)算的算力缺口一直存在。根據(jù)賽迪顧問的數(shù)據(jù),2023年國內(nèi)智能算力需求達(dá)123.6EFLOPS,但供給僅有57.9EFLOPS,不到一半。

另一方面,算力需求未被云計(jì)算大廠承接住。據(jù)業(yè)內(nèi)人士指出,主要是因?yàn)榇竽P陀?xùn)練需高性能GPU集群,而大廠提供的多是單節(jié)點(diǎn)服務(wù),缺乏節(jié)點(diǎn)間超高帶寬互聯(lián)基礎(chǔ)設(shè)施,無法滿足需求。

再加上建設(shè)新集群成本高,現(xiàn)有基礎(chǔ)設(shè)施又無法重復(fù)利用,并且大廠更關(guān)注在單節(jié)點(diǎn)可用性與可靠性,在高性能集群業(yè)務(wù)上并無優(yōu)勢,要不然也不會(huì)有其他算力租賃公司的發(fā)展機(jī)會(huì)。

據(jù)東吳證券研報(bào),算力租賃公司的毛利率約為40%左右,凈利率約為20%左右,最大的一個(gè)門檻就是資金——用來硬件采購、場地租賃、運(yùn)維團(tuán)隊(duì)組建;但技術(shù)門檻并不高,企業(yè)可以通過與技術(shù)供應(yīng)商合作、引進(jìn)專業(yè)人才等方式快速搭建和運(yùn)營大規(guī)模的算力中心。

對于一些主業(yè)經(jīng)營承壓、急于尋找新盈利增長點(diǎn)的企業(yè)來說,這個(gè)新賽道的吸引力巨大。

03

智算中心的背后邏輯

2023年,蓮花控股成立蓮花紫星開展算力租賃業(yè)務(wù)。公告顯示,算力項(xiàng)目預(yù)計(jì)總投入約 2.9 億元。今年前8個(gè)月,蓮花紫星營業(yè)收入超過3515萬元,但凈利潤為-398.13萬元。整體仍處于虧損,主要原因是設(shè)備的折舊及利息費(fèi)用影響金額較大,人員成本支出占比較高,尚未發(fā)揮出規(guī)模效應(yīng)。

短時(shí)間內(nèi)賺不到錢,并不是說這不是一門好生意。通過梳理開展算力租賃的A股公司的財(cái)務(wù)數(shù)據(jù)發(fā)現(xiàn),大部分的確都處在增收不增利的狀態(tài),極少數(shù)實(shí)現(xiàn)盈利,但這些與“算力”概念相關(guān)的企業(yè),最直接的收獲,可能就是短期內(nèi)幾乎都出現(xiàn)過明顯上漲的股價(jià)。

如果要問算力租賃還有哪些不確定性,市場需求、政策變化、技術(shù)水平,以及交付和供應(yīng)鏈、國產(chǎn)替代等等,都是重要的影響因素。不過對于當(dāng)下涉足這個(gè)賽道的企業(yè)來說,更關(guān)鍵的問題是真正的know how。

智算中心并非買了一堆GPU后就能靠租售躺賺。單就硬件部署,要解決的就包括:高性能的AI芯片、異構(gòu)架構(gòu)設(shè)計(jì)、高速低延遲的網(wǎng)絡(luò)、存儲(chǔ)系統(tǒng)、安全配置、監(jiān)控管理、液冷裝置等等復(fù)雜步驟。

除此以外,訓(xùn)練算力的租賃對象主要是大模型公司,那么租賃公司,尤其是跨行的企業(yè),怎么獲取這些客戶資源,獲取穩(wěn)定的客戶支持?這些問題在實(shí)操的過程中更難解決。截至目前,已經(jīng)陸續(xù)有幾家上市公司放棄了算力租賃業(yè)務(wù)。

那回到開頭的話題,智算中心的ROI過低,什么原因?

除了供給與需求的不匹配,地區(qū)間的經(jīng)濟(jì)發(fā)展水平和產(chǎn)業(yè)結(jié)構(gòu)差異,比如東部地區(qū)算力需求旺盛而供給相對不足之外,最早撇下的泡沫,是那些在缺乏充分市場調(diào)研的情況下,盲目投入智算中心建設(shè)的公司。

其次,結(jié)合算力租賃市場當(dāng)下的窘境,智算中心的高效運(yùn)行不僅依賴于高性能的硬件,還需要軟件層面的優(yōu)化和協(xié)調(diào)。智算不僅僅是卡的問題,而是一個(gè)軟硬件協(xié)調(diào)的系統(tǒng)。當(dāng)軟件能力不夠時(shí),卡自身的發(fā)揮也會(huì)受限,導(dǎo)致用卡效率不高。

智算中心不景氣,直接影響了算力租賃市場的低迷,反過來,算力資源無法得到有效利用,一些企業(yè)因缺乏應(yīng)用場景而閑置算力資源,造成浪費(fèi),如此循環(huán)。

值得注意的是,囿于國內(nèi)外技術(shù)差距以及芯片卡脖子,國產(chǎn)替代越發(fā)的被反復(fù)提及。但在這個(gè)過程中,最難解決的是應(yīng)用生態(tài)的問題。

打個(gè)比方,如果國內(nèi)芯片廠商在技術(shù)上采取封閉式模式,廠商通過高價(jià)設(shè)備銷售、輔助運(yùn)營服務(wù)等方式實(shí)現(xiàn)了商業(yè)利益的最大化,雖然能夠集中力量辦大事,實(shí)現(xiàn)端到端的控制。

但封閉性也會(huì)導(dǎo)致可用的開源軟件、商用軟件極少,用戶自有軟件的遷移適配成本極高,一些用戶的軟件無法適配,依此建立的智算中心只能處于閑置狀態(tài)。

本文系新眸原創(chuàng)

       原文標(biāo)題 : 有多少AI公司,如今困在智算中心?

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號