訂閱
糾錯(cuò)
加入自媒體

打完“價(jià)格戰(zhàn)”,大模型還要比什么

圖片

來(lái)源 | 伯虎財(cái)經(jīng)(bohuFN) 

作者 | 楷楷 

在近日舉辦的2024年云棲大會(huì)上,阿里再次成為了焦點(diǎn)。

今年5月,阿里云宣布旗下通義千問(wèn)的多款商業(yè)化及開(kāi)源模型進(jìn)行大幅降價(jià),最高降價(jià)幅度高達(dá)97%;云棲大會(huì)上,通義千問(wèn)三款主力模型再次大幅降價(jià),最高降幅達(dá)85%。

自阿里在5月率先“開(kāi)卷”之后,字節(jié)跳動(dòng)旗下云服務(wù)火山引擎、百度智能云、騰訊云、科大訊飛等均官宣旗下大模型大幅下調(diào)價(jià)格,行業(yè)降價(jià)幅度達(dá)到了90%左右。

不僅國(guó)內(nèi)大模型廠商跟進(jìn)價(jià)格戰(zhàn),行業(yè)風(fēng)向標(biāo) OpenAI 也在今年7月推出了GPT-4o mini ,商用價(jià)格較GPT-3.5 Turbo 便宜了60% 以上。

可以預(yù)見(jiàn),在阿里再掀“價(jià)格戰(zhàn)”之后,大模型價(jià)格還將繼續(xù)下調(diào),甚至可能走向“負(fù)毛利”。在互聯(lián)網(wǎng)行業(yè)的發(fā)展史中,“虧本換規(guī)!辈⒉皇悄硞(gè)企業(yè)的孤例,要改變整個(gè)行業(yè)的商業(yè)模式,必然需要投入更高的成本。

但在這個(gè)過(guò)程中,如何平衡價(jià)格、質(zhì)量與服務(wù)也成為了大模型企業(yè)必須思考的問(wèn)題,企業(yè)想要“活下來(lái)”,就不能只吃“低垂的果實(shí)”。

01 規(guī)模比利潤(rùn)更重要

國(guó)內(nèi)大模型已從“以分計(jì)價(jià)”的定價(jià)模式走向“以厘計(jì)價(jià)”的新時(shí)代。今年5月,阿里通義千問(wèn)大模型的API調(diào)用輸出價(jià)格,從0.02元/千Tokens降至0.0005元/千Tokens。

在9月再次降價(jià)之后,阿里云Qwen-Turbo(128k)、Qwen-Plus(128k)、Qwen-Max 三款模型每千 tokens的最低調(diào)用價(jià)格再次刷新下限,分別降至0.0003元、0.0008元、0.02元。

圖片

對(duì)于再次降價(jià),阿里云CTO周靖人表示,每一次降價(jià)都是一個(gè)非常嚴(yán)肅的過(guò)程,要從整個(gè)產(chǎn)業(yè)發(fā)展,開(kāi)發(fā)者、企業(yè)用戶的反饋等各方面進(jìn)行權(quán)衡,(降價(jià))不是“價(jià)格戰(zhàn)”,(大模型價(jià)格)還是太貴了。

隨著一個(gè)行業(yè)的成熟發(fā)展,其走向降價(jià)趨勢(shì)也是必然的,比如半導(dǎo)體行業(yè)的“摩爾定律”,即處理器的性能大約每?jī)赡攴槐,但工藝的進(jìn)步會(huì)使成本下降為之前的一半。

但目前來(lái)看,大模型行業(yè)的降價(jià)速度已經(jīng)遠(yuǎn)超“摩爾定律”,降價(jià)幅度接近100%,在這樣的背景下,大模型企業(yè)還能盈利嗎?或許對(duì)大模型行業(yè)來(lái)說(shuō),當(dāng)前規(guī)模比利潤(rùn)更重要。

一方面,暫時(shí)讓渡利潤(rùn)已是大模型行業(yè)的共識(shí),業(yè)內(nèi)人士認(rèn)為,大模型行業(yè)甚至可能已經(jīng)到了“負(fù)毛利時(shí)代”。

據(jù)《財(cái)經(jīng)》雜志報(bào)道,阿里云、百度智能云等多位負(fù)責(zé)人曾透露,今年5月以前,國(guó)內(nèi)大模型推理算力毛利率高于60%,和國(guó)際同行基本一致,但在5月接連降價(jià)后,毛利率則跌至負(fù)數(shù)。

在大模型降價(jià)以后,使用者數(shù)量會(huì)持續(xù)增多,短期內(nèi)調(diào)用次數(shù)越多,大模型的虧損就越大,因?yàn)槊看握{(diào)用模型都要消耗價(jià)格不菲的算力,也就是說(shuō)大模型企業(yè)不僅要降低售價(jià),還要面臨更高的成本投入。

但另一方面,大模型降價(jià)帶來(lái)的效果也是顯著的。以阿里云為例,在大模型降價(jià)以后,阿里云百煉平臺(tái)的付費(fèi)客戶數(shù)比上一個(gè)季度增長(zhǎng)了超過(guò)200%,更多企業(yè)放棄私有化部署,選擇在百煉上調(diào)用各類AI大模型,目前百煉已服務(wù)超30萬(wàn)個(gè)客戶。

過(guò)去一年,百度文心大模型的降價(jià)幅度也超過(guò)90%,不過(guò),百度在2024年Q2財(cái)報(bào)電話會(huì)上披露,文心大模型日均調(diào)用量超6億次,半年內(nèi)增長(zhǎng)超10倍。

如此看來(lái),大模型企業(yè)寧愿犧牲利潤(rùn)也要降價(jià),所求的正是“預(yù)期”,即犧牲短期利益來(lái)?yè)Q取長(zhǎng)期回報(bào)。

有業(yè)內(nèi)人士估計(jì),目前各家大模型企業(yè)在模型調(diào)用領(lǐng)域的收入不會(huì)超過(guò)10億元,相較于百億元級(jí)別的總營(yíng)收,這筆收入只是“九牛一毛”。

但在未來(lái)1-2年,大模型調(diào)用次數(shù)至少有10倍以上的指數(shù)級(jí)增長(zhǎng),短期來(lái)看,用戶規(guī)模越大,大模型的算力成本越高;但長(zhǎng)期來(lái)看,在云服務(wù)領(lǐng)域,算力成本有望隨著客戶需求增長(zhǎng)逐漸攤薄,企業(yè)將會(huì)迎來(lái)“回報(bào)期”。

隨著行業(yè)的持續(xù)發(fā)展,AI對(duì)算力的拉動(dòng)會(huì)越來(lái)越明顯,阿里CEO吳泳銘曾表示,在算力市場(chǎng)上,超過(guò)50%的新需求都是由AI驅(qū)動(dòng)產(chǎn)生的,大模型正在加速商業(yè)化。

一方面,降價(jià)大大降低了企業(yè)客戶的使用門(mén)檻和試錯(cuò)成本,特別是對(duì)政務(wù)、制造、能源等傳統(tǒng)行業(yè)來(lái)說(shuō),它們的業(yè)務(wù)規(guī)模更大,增量空間也更大。

當(dāng)大模型能夠像其他基礎(chǔ)設(shè)施一樣人人可用時(shí),大模型的市場(chǎng)空間才能有望實(shí)現(xiàn)大幅增長(zhǎng),在這之前,大模型企業(yè)難免需要讓利給企業(yè)和開(kāi)發(fā)者。

另一方面,大模型降價(jià)后存量收入會(huì)下降,但增量收入會(huì)增長(zhǎng)。以百度為例,大模型不僅帶來(lái)了直接收入,比如文心大模型等產(chǎn)品的調(diào)用等,還能帶動(dòng)間接業(yè)務(wù)的收入,比如百度智能云業(yè)務(wù)。

過(guò)去幾年,外界對(duì)百度智能云戰(zhàn)略不乏質(zhì)疑,其在公有云市場(chǎng)并不占優(yōu)勢(shì),但在AI公有云這個(gè)細(xì)分市場(chǎng),百度開(kāi)始彎道超車。目前,百度智能云的大模型收入占比已從2023年四季度的4.8%提升到了2024年二季度的9%。

圖片

所以,目前大模型行業(yè)的共識(shí),就是規(guī)模比利潤(rùn)更重要,這一觀點(diǎn)在互聯(lián)網(wǎng)時(shí)代也是老生常談,比如“千團(tuán)大戰(zhàn)”“網(wǎng)約車大戰(zhàn)”“電商大戰(zhàn)”等。大模型企業(yè)不能回避“價(jià)格戰(zhàn)”,就只能將活過(guò)價(jià)格戰(zhàn)作為初步目標(biāo),希望能成為淘汰賽結(jié)束后的最終受益者。

02 阿里著力“AI大基建”

阿里也深知這一道理,其在近日宣布大模型再次降價(jià)后,也提出了“AI大基建”的概念。阿里云副總裁張啟表示,現(xiàn)在的AI相當(dāng)于1996年前后的互聯(lián)網(wǎng),當(dāng)時(shí)的上網(wǎng)資費(fèi)很貴,這也限制了移動(dòng)互聯(lián)網(wǎng)的發(fā)展,只有把資費(fèi)降下來(lái),才有可能談未來(lái)的應(yīng)用爆發(fā)。

所以,阿里除了在2024年云棲大會(huì)上提出大模型再次降價(jià)之外,還發(fā)布了新一代的開(kāi)源大模型,一口氣上架了100 多個(gè)模型,涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,創(chuàng)造了大模型開(kāi)源的“數(shù)量之最”。

圖片

阿里云CTO周靖人表示,阿里云堅(jiān)定不移地推進(jìn)開(kāi)源戰(zhàn)略,希望把選擇留給開(kāi)發(fā)者,讓開(kāi)發(fā)者會(huì)基于自己的業(yè)務(wù)場(chǎng)景去做模型能力增強(qiáng)和推理效率增強(qiáng)的權(quán)衡與選擇,同時(shí)也能更有效服務(wù)企業(yè)。

根據(jù)阿里的統(tǒng)計(jì),截至 2024 年 9 月中旬,通義千問(wèn)開(kāi)源模型下載量突破 4000 萬(wàn),Qwen 系列衍生模型總數(shù)超過(guò) 5 萬(wàn)個(gè),成為僅次于 Llama 的世界級(jí)模型群,而Llama正是大模型開(kāi)源界的“頭把交椅”,全球下載量接近3.5億。

在“百模大戰(zhàn)”結(jié)束之后,多位行業(yè)大佬均認(rèn)為“卷模型不如卷應(yīng)用”,大廠也開(kāi)始聚焦“卷生態(tài)”。百度董事長(zhǎng)李彥宏曾表示,“沒(méi)有構(gòu)建于基礎(chǔ)模型之上的、豐富的AI原生應(yīng)用生態(tài),大模型就一文不值!

目前,通過(guò)國(guó)家網(wǎng)信辦備案的大模型已達(dá)190多個(gè),注冊(cè)用戶超6億,但仍難以解決大模型“最后一公里”問(wèn)題,難點(diǎn)不僅是大模型應(yīng)用太少,還有大模型不夠“接地氣”,比如在醫(yī)療、金融等專業(yè)領(lǐng)域中,單純依靠“喂數(shù)據(jù)”訓(xùn)練,大模型還是很難直接落地應(yīng)用。

大廠不可能躬身入局每一個(gè)細(xì)分行業(yè)來(lái)完成“最后一公里”,但可以通過(guò)打造完整的應(yīng)用生態(tài),由下游企業(yè)或其他開(kāi)發(fā)者自行“煉成”符合需求的模型產(chǎn)品,不僅能進(jìn)一步優(yōu)化資源配置,也能在這個(gè)過(guò)程中積累更多高質(zhì)量數(shù)據(jù),最終反哺給基礎(chǔ)大模型開(kāi)發(fā)。

阿里選擇降價(jià)、開(kāi)源,本質(zhì)就是希望降低大模型的使用門(mén)檻,通過(guò)更低的價(jià)格來(lái)驗(yàn)證大模型的應(yīng)用價(jià)值,讓更多企業(yè)和創(chuàng)作者參與進(jìn)來(lái)。只有大模型能夠真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場(chǎng)景需求,生態(tài)才能發(fā)展起來(lái),行業(yè)才能進(jìn)入新的階段。

不過(guò),“百模大戰(zhàn)”最終可能只會(huì)留下3-5家大模型企業(yè),目前來(lái)看,行業(yè)第一梯隊(duì)已經(jīng)呼之欲出,它們也可能會(huì)是大模型行業(yè)未來(lái)最基本的底座。

因此,頭部的大模型企業(yè)更不可能主動(dòng)放棄價(jià)格戰(zhàn),讓出自己的市場(chǎng)份額。除此以外,不少獨(dú)角獸也希望憑借價(jià)格戰(zhàn)殺出一條“生路”,部分企業(yè)也認(rèn)為小模型或更具性價(jià)比。

事實(shí)上,今年5月的大模型價(jià)格戰(zhàn)并非始于阿里,而是一條名為“DeepSeek V2”的鯰魚(yú),在行業(yè)普遍推理價(jià)格還是百元/Tokens的背景下,其將支持32k上下文的模型API定價(jià)為1元/百萬(wàn)Tokens(計(jì)算)、2元/百萬(wàn)Tokens(推理)。

目前來(lái)看,大模型淘汰賽或還會(huì)持續(xù)2-3年,雖然最終留下的大模型企業(yè)并不會(huì)多,為了活下去,企業(yè)們也不得不使出渾身解數(shù),但問(wèn)題是,當(dāng)“低垂的果實(shí)”都被摘完之后,當(dāng)下大模型行業(yè)的解題思路早已不是“便宜就完事”。

03 0模型能力仍是關(guān)鍵

不過(guò),對(duì)于大模型“價(jià)格戰(zhàn)”一事,行業(yè)也有不同的看法。零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)曾表示,沒(méi)有必要打瘋狂的價(jià)格戰(zhàn),因?yàn)榇竽P筒还庖磧r(jià)格,還要看技術(shù),如果是技術(shù)不行,然后靠賠錢(qián)來(lái)做生意,(公司)不會(huì)對(duì)標(biāo)這樣的定價(jià)。

火山引擎總裁譚待在談及價(jià)格戰(zhàn)時(shí)也表示,當(dāng)前主要關(guān)注的是應(yīng)用覆蓋,而不是收入,要有更強(qiáng)的模型能力才能解鎖新場(chǎng)景,這才更有價(jià)值。

目前來(lái)看,“價(jià)格戰(zhàn)”的本質(zhì)還是因?yàn)楫a(chǎn)品能力不足,各家模型能力趨于同質(zhì)化,暫時(shí)無(wú)法形成斷檔的差距,所以才希望通過(guò)價(jià)格戰(zhàn)來(lái)增加大模型的普及,也能幫助廠商增加市場(chǎng)份額。

但等到市場(chǎng)摘完“低垂的果實(shí)”,新問(wèn)題也會(huì)接踵而來(lái),企業(yè)能否扛下下一階段的價(jià)格戰(zhàn);大模型能否和對(duì)手拉開(kāi)差距;自己會(huì)否成為最終能夠留下來(lái)的企業(yè),這些問(wèn)題依然需要解決。

所以,大模型企業(yè)在打價(jià)格戰(zhàn)的同時(shí),也深知產(chǎn)品、技術(shù)、現(xiàn)金流的重要性,既要抗住降價(jià)壓力,又要和對(duì)手拉開(kāi)技術(shù)差距,持續(xù)提升模型性能和產(chǎn)品落地,才能形成良性的商業(yè)閉環(huán)。

一方面,大模型企業(yè)并非單純依賴“價(jià)格戰(zhàn)”。通常來(lái)說(shuō),大模型的推理包含時(shí)間、價(jià)格、生成 Token 數(shù)量三個(gè)變量,不能拋開(kāi)單位時(shí)間內(nèi)的并發(fā)數(shù)量,只看 tokens 價(jià)格。

因?yàn)樵趯?shí)際跑業(yè)務(wù)的過(guò)程中,推理事件越復(fù)雜,越有可能要增加并發(fā)量。但目前降價(jià)大模型普遍使用的是預(yù)置模型(不支持增加并發(fā)量),真正大規(guī)模、高性能、支持高并發(fā)的模型推理均未有大幅降價(jià)。

另一方面,通過(guò)技術(shù)來(lái)進(jìn)一步優(yōu)化大模型的推理成本。以百度為例,旗下的百舸異構(gòu)計(jì)算平臺(tái)對(duì)智算集群的設(shè)計(jì)、調(diào)度、容錯(cuò)等環(huán)節(jié)進(jìn)行了專項(xiàng)優(yōu)化,能夠?qū)崿F(xiàn)萬(wàn)卡集群上的模型有效訓(xùn)練時(shí)長(zhǎng)占比超過(guò)98.8%,線性加速比、帶寬有效性分別高達(dá)95%,幫助客戶解決算力短缺和算力成本偏高等問(wèn)題。

微軟CEO薩蒂亞·納德拉曾舉例表示,過(guò)去一年 GPT-4 性能提升了6倍,但成本降低到了之前的1/12,性能/成本提升了70倍。不難看出,大模型技術(shù)的發(fā)展才是行業(yè)持續(xù)降價(jià)的底氣。

最后,則是打造出更有差異化的產(chǎn)品。低價(jià)策略能夠幫助大模型企業(yè)筑造生態(tài),但隨著AI領(lǐng)域的不斷發(fā)展,創(chuàng)新速度的加快也使得技術(shù)更新?lián)Q代周期縮短,是否能夠持續(xù)提供有競(jìng)爭(zhēng)力的產(chǎn)品,能否在實(shí)際應(yīng)用中解決用戶痛點(diǎn),才是大模型企業(yè)的核心競(jìng)爭(zhēng)力。

目前,大模型行業(yè)的商業(yè)邏輯,已經(jīng)從卷模式、卷成本,邁入到卷生態(tài)、卷技術(shù)的新階段。當(dāng)然,低價(jià)還是快速建立生態(tài)壁壘的重要手段,但通過(guò)技術(shù)降低成本,才是推動(dòng)大模型快進(jìn)到“價(jià)值創(chuàng)造階段”的關(guān)鍵要素。

接下來(lái),大模型企業(yè)的新戰(zhàn)場(chǎng)將會(huì)是“性價(jià)比”,要在當(dāng)前的價(jià)格基礎(chǔ)上,進(jìn)一步提高大模型的質(zhì)量和性能,讓模型能力更強(qiáng)、更多元,這么做或許不一定能孵化出“超級(jí)應(yīng)用”,但吸引更多中小企業(yè)、創(chuàng)業(yè)公司的加入,才有機(jī)會(huì)為大模型企業(yè)帶來(lái)爆發(fā)式增長(zhǎng)的機(jī)會(huì)。

文章封面首圖及配圖,版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無(wú)償使用,請(qǐng)及時(shí)聯(lián)系我們,本平臺(tái)將立即更正。 

 

       原文標(biāo)題 : 打完“價(jià)格戰(zhàn)”,大模型還要比什么?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)