訂閱
糾錯
加入自媒體

國產(chǎn)大模型狂飆,大廠跑步入場,誰能率先做出第一個中國版GPT

文 | 山核桃

熱火烹油的大模型賽道打起了“嘴仗”。 

搜狗前CEO王小川評價百度創(chuàng)始人李彥宏的采訪發(fā)言稱:“你們采訪的可能是平行世界的他,不是我們這個世界里的。” 

而針對王小川的評論,百度集團副總裁、搜索平臺負責人肖陽又回應道:“王小川脫離一線太久,確實跟我們不在一個宇宙,自然對國內(nèi)人工智能技術的發(fā)展缺乏了解。” 

意外的是,王小川在14日凌晨又“嘲諷”了一把,稱對 方是“脫離一線15年的人,去懟離開1.5年的人”。 

這場爭論也暴露出創(chuàng)業(yè)派與大廠間微妙的競爭關系。 

毋庸置疑,大模型技術徹底點燃了科技圈的熱情,創(chuàng)業(yè)者忙著招兵買馬,生怕錯過了新風口;一級市場關于大模型的投融資熱度攀升,不少FA們甚至跑去B站開始惡補AI知識。 

政策端也在吹來暖風,北京市經(jīng)濟和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》顯示,今年,北京將支持頭部企業(yè)打造對標ChatGPT的大模型。 

熱鬧只是硬幣的A面。 

無論是忙著官宣大模型的科技大廠,還是廣發(fā)英雄帖的創(chuàng)業(yè)公司,身處這股浪潮之中的人們都在思考一些關鍵問題:率先做出第一個中國版GPT的是誰?還有多久才能做出來?市場格局又會是發(fā)生怎樣的變化? 

這些問題都難以給出正確的答案,事實上,也沒有人能給出準確的回答。畢竟,人們總是高估一項科技所帶來的短期效益,卻又低估它的長期影響。 

本文將圍繞當下中國的大模型競爭現(xiàn)狀,基于行業(yè)資料與研究,主要回答三個問題: 

1. 為什么國內(nèi)科技公司要紛紛競逐大模型?

2. 火熱背后,中國科技公司究竟缺什么?

3. 中國科技公司“大模型之戰(zhàn)”的走向會是什么?

為什么極客們都愛大模型?

理解中國科技巨頭們的“大模型焦慮”,一張產(chǎn)品發(fā)布時刻表就夠了。 

在OpenAI發(fā)布GPT-4大模型后,百度用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,53歲的周鴻祎決定“把剛出生的孩子抱出來給大家看看”,他推出360的大模型產(chǎn)品,甚至倉促到名字都要現(xiàn)場取。 

隨后的一個多月里,科技巨頭、創(chuàng)業(yè)公司與高校研究院們展開了一輪關于“大模型”的軍備競賽,整個4月可以被稱為“大模型的發(fā)布月”,繼百度之后,華為、商湯、阿里已在4月亮出自己的大模型產(chǎn)品。 

最新的消息是,京東計劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”,被視為“京東版”ChatGPT。 

大模型也成為了互聯(lián)網(wǎng)大佬扎堆二次創(chuàng)業(yè)的熱門賽道。 

原美團聯(lián)合創(chuàng)始人王惠文、創(chuàng)新工場CEO李開復、前京東AI掌門人周伯文、前阿里技術副總裁賈揚清等均入局創(chuàng)業(yè)。前搜狗CEO王小川的百川智能已完成了5000萬美元融資,王小川給了自己一個DDL:“今年年底做到國內(nèi)最好的”。 

一位業(yè)內(nèi)人士這樣形容當下百花齊放的圖景:“(這波創(chuàng)業(yè))很像2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮。” 

普通讀者們很難理解科技圈對大模型的擁躉,畢竟類似的創(chuàng)業(yè)潮在元宇宙、XR行業(yè)也都復現(xiàn)過。但如果深入理解人工智能的發(fā)展歷史與傳統(tǒng)AI時代的困境,就能理解為何這群極客們?nèi)绱藷釔鄞竽P汀?nbsp;

關于大模型的定義,OpenAI創(chuàng)始人Altman與李開復更愿意將大模型定義為“一種新技術平臺”,而學界則將“大模型”對比“小模型”,定義為一種“基于大量數(shù)據(jù)訓練的、擁有巨量參數(shù)的模型”,這種模型能適應廣泛的下游任務。 

在AI1.0時代,比起創(chuàng)業(yè)者對AI智能化的疾呼,大多數(shù)人對人工智能只停留在一些單一場景產(chǎn)品端的理解。 

例如人工智能客服、人工智能質檢等,上述場景都是針對一項任務具體開發(fā)一個專用小模型,并不具備“理解能力”。就像周鴻祎將此前的人工智能產(chǎn)品形容為“人工智障”,在他看來:“在GPT之前,從來沒有一個人工智能的產(chǎn)品能真正的理解我們這個世界。” 

從人工智障到人工智能的進化,大模型的出現(xiàn)意味著人們正式進入到AI2.0時代,這背后是大模型的涌現(xiàn)性使然。 

涌現(xiàn)是人工智能領域經(jīng)常會被提及到的概念,代表一種從量變到質變的過程,當數(shù)據(jù)規(guī)模足夠大,參數(shù)達到千億級,即使在沒有專門訓練過的領域,AI也能涌現(xiàn)出知識理解和邏輯推理能力,華東政法大學人工智能與大數(shù)據(jù)指數(shù)研究院將“涌現(xiàn)性”定義為一個“多種技術融合的結果”:“(大模型)有效集成自然語言處理等多個人工智能核心研究領域的多項技術,實現(xiàn)1+1>2的融合式涌現(xiàn)。” 

換言之,大模型有望解決“人工智能如何理解世界”的問題,實則提供了一條可能邁向AGI(通用人工智能)的可能性。 

另一方面,大模型的通用性也在激發(fā)更多的商業(yè)圖景,解決了AI1.0時代的諸多問題。 

在上一波AI創(chuàng)業(yè)潮中,總結AI企業(yè)所面臨的問題主要兩點:一是成本問題,清洗與標注海量的數(shù)據(jù)需要耗費巨大的成本,商湯科技聯(lián)合創(chuàng)始人、副總裁楊帆曾表示,對于每一個新場景,公司都要重新收集新數(shù)據(jù),搭建定制化模型。 

這種開發(fā)模式很像“小作坊”,不但解決問題的成本極高,開發(fā)模式也十分低效。 

在實際落地過程中,應用場景的復雜性導致AI應用的“孤島化”,李開復曾提到一個例子:“如果今天一家銀行想做AI應用,但沒有任何數(shù)據(jù)可以用來冷啟動,還要收集、清洗、標注數(shù)據(jù),再去做模型,整個過程代價都很大。” 

而當大模型已成為上層應用的技術底座,可以實現(xiàn)在AI1.0時代無法實現(xiàn)的跨領域部署,支撐終端、平臺、系統(tǒng)等產(chǎn)品應用落地。這種像搭積木一樣“組合創(chuàng)新”的可能性,以及商業(yè)化的能力就像ChatGPT一樣,人們不僅發(fā)現(xiàn),它可以深夜聊天,撫慰人心,還會寫程序和講故事。 

成本問題之外,并不具備通用能力的小模型,由于無法向行業(yè)進行推廣與復用,難以形成規(guī)模效應,也就更難言盈利。 

這種“通用性”激發(fā)出諸多新的商業(yè)圖景,可以將其理解為AI時代的“操作系統(tǒng)”,在降低開發(fā)成本的同時,人人都可以是開發(fā)者,由此發(fā)現(xiàn)與生產(chǎn)出新的產(chǎn)品與應用場景。 

找錢、找人、找應用場景

大模型競賽的槍響之后,創(chuàng)投行業(yè)又復現(xiàn)“元宇宙”的熱潮。 

有大模型企業(yè)1個月見的投資人相當于去年一整年。一級市場關于大模型的投融資熱度攀升,不少FA們甚至跑去B站開始惡補AI知識,生怕錯過一個好項目。 

但搶到這張通往新世界的“船票”并非容易,區(qū)別于AI1.0時代, 找錢、找人與找應用場景的焦慮,在這一波競逐中,體現(xiàn)的尤為明顯。 

首先是找錢。 參考多位創(chuàng)業(yè)者的觀點,2億美元是行業(yè)普遍認為的啟動資金。拆解來看,以硬件成本為例,研究機構TrendForce在一份報告中指出,要處理1800億參數(shù)的GPT-3.5大型模型,需要的GPU芯片數(shù)量高達2萬顆,未來GPT大模型商業(yè)化所需的GPU芯片數(shù)量甚至會超過3萬顆。 

僅在算力門檻上,很多創(chuàng)業(yè)企業(yè)便無力與大廠抗衡。 

因此,表面上熱火朝天的大模型賽道,風大“魚”貴,但實際投資人們心里也知道,僅靠幾張PPT創(chuàng)新的時代過去了,投資既是要投靠譜的人,也要考慮賽道與具體的商業(yè)路徑,畢竟,錢也一定要投在刀刃上。 

云啟資本合伙人陳昱在接受《甲子光年》采訪時就表示:“做大模型創(chuàng)業(yè)的公司要融到大錢不容易了。” 

英諾天使基金合伙人王晟曾表示,“我們也經(jīng)常‘刷論文’,看到AI領域里很棒的論文,直接就去找作者了,看他是一個學霸,還是有創(chuàng)業(yè)潛質、業(yè)務沒有商業(yè)化的潛力,如果合適,我們也會建議他創(chuàng)業(yè)并考慮投資。” 

比起AI1.0時代的純科學家創(chuàng)業(yè),AI2.0時代更像是一場互聯(lián)網(wǎng)大佬與科學家們的“集體二次創(chuàng)業(yè)”。 

能夠融到“大錢”的要么是有創(chuàng)始人經(jīng)歷或個人魅力背書,要么就是此前長期跟蹤孵化,雙方一直保持著良好的合作關系。 

比如,目前融資總額已達數(shù)億元的瀾舟科技是創(chuàng)新工場從0到1孵化出的企業(yè),而由前京東技術委員會主席周伯文創(chuàng)立的銜遠科技,背后的參投方啟明創(chuàng)投等均是AI領域的長期捕手。 

其次,找到合適的人也并不容易,在這一點上,科技巨頭與創(chuàng)業(yè)公司面臨相同的處境。 在一檔播客節(jié)目中,已宣布加入光年之外的北京智源人工智能研究院副院長劉江曾發(fā)出呼吁:“所有的同學,如果你是AI的頂級人才,或者有這樣的人,歡迎來到光年之外。” 

“大數(shù)據(jù)+強算法+大算力”被視為支撐大模型落地的重要公式,大廠有算力,也有數(shù)據(jù),能夠提供標準化的產(chǎn)品,但算法背后對應的則是人才。大廠很難留住強算法人才的原因在于,大模型投入是一件長期主義的事,必定會面臨與既有業(yè)務之間的沖突,從大廠出走的諸多大模型創(chuàng)業(yè)者的經(jīng)歷已然說明了這一點。 

而對創(chuàng)業(yè)公司而言,即便有首席科學家的支撐,找到合適的人也并不容易。 

聆心智能創(chuàng)始人、清華大學計算機科學與技術系長聘副教授黃民烈認為,如OpenAI這種技術見長的公司需要很多特別牛的工程技術人才。 

對創(chuàng)業(yè)企業(yè)而言,回到前述的融資環(huán)境下,無論是基于創(chuàng)始人的背景背書,抑或是資源合作,都需要長期積淀。 

同時,在強調(diào)生態(tài)的大模型賽道,創(chuàng)業(yè)型企業(yè)勢必要面臨來自投資方、合作方乃至競對間的博弈,一個合適的伙伴不僅要在自己的細分領域內(nèi)做到頂尖(懂技術+懂產(chǎn)品),還有隨時保持戰(zhàn)略的獨立性,不輕易站隊。 

最后,能否找到合適的應用場景,另辟賽道,并迅速建立護城河壁壘,這一問題也同樣拷問著入局者。 

百度李彥宏將當前的大模型生態(tài)分為三類,他最看好應用層的市場機遇。 

第一類是新型云計算公司,云計算主流商業(yè)模式將會從IaaS變?yōu)镸aaS(模型即服務)。

第二類是進行行業(yè)模型精調(diào)的公司,介于通用大模型和企業(yè)之間的中間,這類企業(yè)可以基于對行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。

第三類是應用層的企業(yè),基于通用大語言模型開發(fā)應用服務,這可能才是真正的機會。

區(qū)別于國外專業(yè)化的分工,當前,國內(nèi)的大模型賽道的創(chuàng)業(yè)模式主要分類是三類: 一類是聚焦基礎層,對標OpenAI,發(fā)揮基礎設施的作用。一類是錨定中間層,不需要如OpenAI一樣花大錢做底層,掌握通用化能力,可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。還有一類就是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場景的應用,如Jasper。 

如果將大模型比喻成AI時代的電,那么基礎層與中間層擔任的都是“發(fā)電廠”的角色,需要極高的門檻,對資金、技術以及資源有嚴格的準入壁壘,大多也是大公司間的競逐。 

百度、阿里、華為頭部企業(yè)均采取“模型+工具平臺+生態(tài)”三層共建模式的模式,推動業(yè)務的正向循環(huán)。 

大廠的競逐中,也涌現(xiàn)出一些創(chuàng)業(yè)公司,既做大模型,又將其能力輸出至垂直行業(yè),形成定制化模型,雖然避開了與有錢有勢的大廠們的直接競爭,但也面臨三大難題。 

一是數(shù)據(jù)如何才能做專做細,很多行業(yè)定制化模型依舊難以形成數(shù)據(jù)飛輪與場景飛輪。二是大廠極容易摘低垂的果實,垂直大模型實現(xiàn)復用的前提是必須要在該行業(yè)建立壁壘與護城河,即“人無我有”的競爭優(yōu)勢。三是通用化往往是歷史的趨勢,因此“未來垂直大模型是否會最終被通用大模型取代”這一問題也值得思考。 

大船票or小船票?

人工智能專家侯世達的學生梅拉妮·米歇爾在《AI 3.0時代》里認為,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。從某種程度上來說,這種模式以5~10年為周期在不斷上演。 

正在興起的“大模型熱”也必定會經(jīng)歷從繁榮到擠去泡沫的過程。 

對中國的科技公司而言,“能不能做出一個中國版GPT”“中國創(chuàng)業(yè)公司里是否會出現(xiàn)一個OpenAI”。對上述大模型行業(yè)的叩問,從業(yè)者們看法不一。 

李彥宏在被問到“中國創(chuàng)業(yè)公司里會不會再出一個OpenAI?”時,他直接回答“基本不會了”,“沒有必要再重新發(fā)明一遍輪子。” 

但另一種觀點也認為,中國攻堅大模型依舊難以繞開OpenAI,這種危機感越發(fā)強烈。曠視科技聯(lián)合創(chuàng)始人印奇在接受鈦媒體采訪時表示,中國攻堅 AI 大模型要先把GPT-3.5復現(xiàn)出來,但面臨長期技術創(chuàng)新與短周期商業(yè)化兩重壓力: 

“未來的一段時間,能不能有一個公司首先把大模型真的做出來,且性能真的是達到GPT-3.5,這是所有事情的起點。就像菜你沒有炒過,不知道鹽和味精怎么放,而且GPT所消耗的資源、門檻都非常高。” 

是崇尚“大算力+大數(shù)據(jù)+強算法”的暴力美學,還是專注將一個垂直模型做透做專?中國企業(yè)的機會又在哪里?又可以在哪些方面深耕與挖掘? 

這些問題的答案都亟待解決。 

與此同時,人們也關注大模型行業(yè)未來的市場格局演進。未來究竟是兩三家企業(yè)間的競爭,還是百花齊放?“大船票”和“小船票”或牽引企業(yè)走向不一樣的結局。 

在關于大模型的這場游戲中,盡管尚未看到終局,但對入局者而言,有兩大方向是確定的: 

一個是應用與場景先行的邏輯。 國產(chǎn)大模型極為強調(diào)產(chǎn)業(yè)側的價值,一方面當前中國智能化浪潮下,產(chǎn)業(yè)側數(shù)字化實踐本就有廣闊的市場需求,另一方面在2B生態(tài)下,基于垂直應用的實踐本身也有利于形成數(shù)據(jù)飛輪與場景飛輪。 

以金融業(yè)為例,BloombergGPT的誕生已說明了這一領域既有數(shù)據(jù)基礎,也有多元化場景需求。但在此前的實踐中,存在的問題一是數(shù)據(jù)量龐大,AI專家培養(yǎng)成本高,因此只有頭部銀行機構愿意嘗試。二是金融機構對業(yè)務的連續(xù)性與數(shù)據(jù)的準確性有著嚴苛要求,因此也對大模型廠商對行業(yè)的理解能力提出了高要求。 

換言之,回到業(yè)務本質,需要什么就用什么。 

通用意味著泛化,這為能夠輸出精準能力的企業(yè)提供了機會窗口。如果能將一個垂直領域做專做透, 用高質量的數(shù)據(jù)持續(xù)優(yōu)化模型,將價值鏈做長。 對創(chuàng)企而言,金融、醫(yī)療、教育等領域都有市場空間。 

二是先行者已提供了路線參照。 如周鴻祎所言,差距并非是天壤之別,路線已經(jīng)明確。周鴻祎指出:“發(fā)展大語言模型,別人已經(jīng)指明了技術路線,剩下的就是長期主義指導下的時間問題。” 

很難回答,此輪的大模型競逐是否是人工智能競賽浪潮最后的哨聲,但幾乎每個從業(yè)者都害怕自己會成為“最后的一個”?萍即蠊緜兛謶直活嵏,創(chuàng)業(yè)公司恐懼被大公司們顛覆,更大的恐懼則來自于大模型超越摩爾定律的技術迭代速度。 

而在商業(yè)世界里,危機與恐懼往往是最好的原動力。 

       原文標題 : 國產(chǎn)大模型狂飆,大廠跑步入場,誰能率先做出第一個中國版GPT

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號