国产激情无码不卡,久久久G0G0午夜无码精品,日韩AV无码一区

圍剿Kimi，只是大模型“新賽季”play的一環(huán)

2024-04-05 09:06

大模型巨頭“圍剿”Kimi的戰(zhàn)役，已經(jīng)進(jìn)行了一段時(shí)間了。想必讀者們已經(jīng)從Kimi帶來的震撼中冷靜下來，開始理性審視2024的大模型“新賽季”。

毫無疑問，“卷”長文本，是基礎(chǔ)通用大模型在新賽季的首個(gè)賽點(diǎn)。3月18日，月之暗面宣布Kimi智能助手支持200萬字超長無損上下文，并開啟內(nèi)測。200萬字是什么概念呢？《紅樓夢》等古典名著、企業(yè)財(cái)報(bào)等專業(yè)文獻(xiàn)，Kimi都能“手拿把掐”，展現(xiàn)出了極強(qiáng)的理解分析能力。

打擂臺容易守擂難。Kimi這位新秀的亮相固然驚艷，但其他更早問世的TOP級基礎(chǔ)大模型，也都不是吃素的，很快百度文心一言、阿里通義千問，都宣布跟進(jìn)長文本能力，直接卷到1000萬字。

Kimi突如其來的熱度、巨頭的積極反撲、長文本賽事的狂飆，無不說明基礎(chǔ)大模型已經(jīng)進(jìn)入了新賽段。

Kimi不是來終結(jié)比賽的，而是來加入這個(gè)家的。而去年倉促備戰(zhàn)、緊跟ChatGPT的第一梯隊(duì)廠商，如今也對大模型的商業(yè)化前景、落地方向等，有了更成熟的思考。

Kimi掀起的“長文本之戰(zhàn)”，只是大模型“新賽季”paly中的一環(huán)，接下來還會有哪些看點(diǎn)，我們來預(yù)測一下。

Kimi，終結(jié)不了比賽

月之暗面（Moonshot AI）是大模型賽道上，第一波獲得較大規(guī)模融資的明星創(chuàng)業(yè)公司。而相比同時(shí)期動作不斷的AI大廠如BAT、明星企業(yè)如百川，月之暗面直到去年10月才交出了第一份成績單Kimi，頗有種“謀定而后動”的味道。

從參數(shù)上看，Kimi的長文本能力超越了當(dāng)時(shí)的谷歌gemini 1.5、Claude3，處于全球領(lǐng)先水平。

從市場動作看，Kimi的宣傳，也不像其他基礎(chǔ)通用大模型廠商那樣謹(jǐn)慎，而是大規(guī)模投流，廣告鋪天蓋地，在B站、抖音、小紅書等平臺都有信息流投放。據(jù)媒體報(bào)道，Kimi每天獲客成本都在20萬，正在“燒錢換規(guī)模”。

從實(shí)際效果看，有大量個(gè)人用戶和企業(yè)開發(fā)者在使用Kimi后表示，其在中文上的理解、分析、問答能力，確實(shí)優(yōu)于當(dāng)時(shí)主流的國產(chǎn)大模型，上下文銜接更好，總結(jié)能力更強(qiáng)。

幾重因素疊加，升級后的Kimi引爆了資本市場的新一波熱情，甚至出現(xiàn)了“Kimi概念股”。

那么，Kimi能“亂拳打死老師傅”，一舉終結(jié)基礎(chǔ)大模型的比賽嗎？子彈飛了這么久，結(jié)果已經(jīng)很明顯了，不能。

一方面，隨著用戶規(guī)模的增多、應(yīng)用場景和用例的增加，Kimi的能力局限越來越多地暴露出來，比如有用戶提到，Kimi的編程能力跟ChatGPT、GLM4、文心一言有很大的差距，ToC場景下長文本處理的需求并不高頻，新鮮感過了之后，感覺沒有其他太大用處。

同時(shí)，Kimi視為核心差異化優(yōu)勢的長文本能力，并不構(gòu)成真正的護(hù)城河。從其他巨頭很快就跟進(jìn)并上線了相關(guān)能力，就可以看出，長文本處理技術(shù)的壁壘并沒有很高，能做基礎(chǔ)通用大模型的頭部廠商，都有相關(guān)技術(shù)和人才積累。

而過去一年AI大廠在多模態(tài)大模型、智算基礎(chǔ)設(shè)施、ToC應(yīng)用、Tob客情關(guān)系等多個(gè)維度構(gòu)筑起的壁壘，則是月之暗面很難快速追趕的。比如，目前月之暗面還沒有發(fā)布多模態(tài)大模型，云服務(wù)運(yùn)維跟不上，難以保證B端用戶的體驗(yàn)。

目前Kimi面向大眾免費(fèi)試用，但其付費(fèi)API的定價(jià)，有的版本幾乎達(dá)到了GPT-3.5等領(lǐng)先大模型的數(shù)倍，后續(xù)付費(fèi)轉(zhuǎn)化也要打一個(gè)問號。

總的來說，Kimi是月之暗面在大模型技術(shù)上的一次成功“秀肌肉”，但別說直接終結(jié)比賽，要躋身“可規(guī)模落地大模型”這一賽道的TOP席位，恐怕為時(shí)尚早。

新賽季，“遭遇戰(zhàn)”告一段落

有讀者可能會問，既然大廠有做長文本處理的能力，為什么去年不卷，非要Kimi火了之后才卷？

所以說，Kimi爆火是一個(gè)很好的契機(jī)，標(biāo)志著中國大模型已經(jīng)從倉促備戰(zhàn)的“遭遇戰(zhàn)”，進(jìn)入到了步步為營的“陣地戰(zhàn)”。

簡單來說，2023年ChatGPT橫空出世，中國的AI大廠是在猝不及防的情況下，極短的時(shí)間內(nèi)統(tǒng)籌資源、組織人馬，快速跟上OpenAI的技術(shù)進(jìn)展，一度出現(xiàn)了“大模型日拋”的局面。這時(shí)候最重要的是爭取主動，避免中國AI在大模型浪潮中缺席。文心一言、訊飛星火、騰訊混元、華為盤古、百川智能、智譜AI等一大批基礎(chǔ)大模型廠商和初創(chuàng)機(jī)構(gòu)，確實(shí)讓中國在“遭遇戰(zhàn)”中拿下一城。

狂奔一年，無論海內(nèi)外都對大模型有了更清晰，也更務(wù)實(shí)的認(rèn)知。中國的基礎(chǔ)大模型廠商，已經(jīng)開始“高筑墻、廣積糧”，逐步進(jìn)入到充分準(zhǔn)備、保障嚴(yán)密、戰(zhàn)略穩(wěn)定的“陣地戰(zhàn)”了。

為什么之前不卷長文本，Kimi出現(xiàn)又快速集體圍剿？恰恰是新賽季“陣地戰(zhàn)”開始的信號。

信號一，不打沒意義的仗。

國內(nèi)基礎(chǔ)大模型的競爭基本告一段落了。

隨著Sora、Claude3等開源或閉源大模型都越來越強(qiáng)大，基礎(chǔ)通用大模型的投入門檻也更加高昂，不能長期拿出天文數(shù)字來卷的都心生退意，轉(zhuǎn)而去挖掘垂直場景和細(xì)分行業(yè)的機(jī)會，這也讓頭部廠商的認(rèn)知度和市場認(rèn)可度更加穩(wěn)固。

基礎(chǔ)大模型廠商也開始精打細(xì)算，關(guān)注如何從硬件中壓榨出更多算力、降低單位推理成本、構(gòu)建可持續(xù)的國產(chǎn)算力、挖掘商業(yè)化項(xiàng)目潛力等。而長文本處理要消耗大量的硬件資源，平白無故瞎卷，燒錢費(fèi)力還未必討好，確實(shí)沒必要。

但Kimi的爆火，更多是讓ToB場景，尤其是金融、政務(wù)客戶，看到了大模型的應(yīng)用價(jià)值，讀財(cái)報(bào)、讀合同、做客服，更長的文本確實(shí)能在這類知識密集型場景，發(fā)揮出更好的效果，減少幻覺問題。這代表了基礎(chǔ)模型的底層能力，所以Kimi的長文本之戰(zhàn)，必須打。

信號二，競爭更加立體復(fù)雜

2023年末，大模型熱度已經(jīng)開始降溫。應(yīng)用側(cè)落地困難，所謂的殺手級AI應(yīng)用似乎還是沒有出現(xiàn)，而投入成本持續(xù)加碼，基礎(chǔ)模型一升級就會覆蓋創(chuàng)業(yè)者的工作，導(dǎo)致投資市場態(tài)度也偏向謹(jǐn)慎。于是，很多人開始質(zhì)疑這一波大模型只是自嗨，唯一賺錢的只有賣鏟子的英偉達(dá)，焦慮情緒開始彌漫。

這時(shí)候，Kimi作為一款現(xiàn)象級產(chǎn)品，確實(shí)打破了僵局。

作為一個(gè)有實(shí)際意義的應(yīng)用層產(chǎn)品，Kimi讓大眾再一次感受并認(rèn)可了大模型的價(jià)值。根據(jù)產(chǎn)業(yè)規(guī)律，應(yīng)用爆發(fā)往往會在產(chǎn)業(yè)基礎(chǔ)平臺條件具備之后的一兩年內(nèi)出現(xiàn)，Kimi正處于這一時(shí)間軸的關(guān)節(jié)上，標(biāo)志著AI應(yīng)用爆發(fā)即將開始。

Kimi對大模型價(jià)值的再度確認(rèn)，也會讓接下來的通用大模型競爭，從卷參數(shù)、卷benchmark等基礎(chǔ)項(xiàng)PK，進(jìn)入到更加復(fù)雜、多元的能力角斗。

信號三，跑馬圈地白熱化。

這一競爭階段，“遭遇戰(zhàn)”時(shí)的靈活、機(jī)動、大干快上，就不太管用了，而需要細(xì)致部署、步步為營，跑馬圈地。

對Kimi的圍剿說明各家基礎(chǔ)大模型廠商的底層能力，會很快趨同。除非像OpenAI那樣，技術(shù)的飛輪效應(yīng)極強(qiáng)，跟競爭對手的差距越拉越大，否則，技術(shù)天然會擴(kuò)散，很難長期成為商業(yè)秘密與護(hù)城河。

壞消息是，國內(nèi)的基礎(chǔ)大模型，想要建立差異化優(yōu)勢越來越難，沒有人能獲得壟斷地位；好消息是，政企客戶更希望構(gòu)建“模型花園”，根據(jù)需要調(diào)用多個(gè)大模型，減少對單一供應(yīng)商的依賴，所以市場仍在增長，仍然開放，大家都還有機(jī)會。

（企業(yè)希望引入的模型數(shù)量）

a16z調(diào)研了七十多位財(cái)富500強(qiáng)企業(yè)和頂級企業(yè)領(lǐng)袖，發(fā)現(xiàn)這些公司2024年在AI上的支出預(yù)算比2023年增加了2-5倍。國內(nèi)市場的智能化速度也不會遜色，更增強(qiáng)了對基礎(chǔ)大模型的需求，所以接下來，會進(jìn)入到白熱化的跑馬圈地階段。

大模型新賽季，正式拉開帷幕。

長文本，只是“陣地戰(zhàn)”的一環(huán)

長文本，是“秀肌肉”的必爭之地，但解決政企客戶的切實(shí)需求，長文本卻未必那么實(shí)用。從Kimi的長短板，我們可以看到目前市場更需要怎樣的大模型。

首先說說短板。前面提到了，Kimi的長文本在很多場景下屬于低頻需求，再長的token只會帶來更大的計(jì)算量、更高的資源成本，對用戶來說性價(jià)比不高。對此，吳恩達(dá)也認(rèn)為，快速生成token，可能比使用更強(qiáng)的模型更重要。長文本處理導(dǎo)致的硬件資源需求、GPU短缺和云服務(wù)能力，也是Kimi面臨的現(xiàn)實(shí)挑戰(zhàn)。

而Kimi的長板在于，在文本摘要和知識管理等任務(wù)中，發(fā)揮出了極高的生產(chǎn)力效能，對企業(yè)的吸引力很大。應(yīng)用更友好，企業(yè)不需要從頭開始訓(xùn)練自己的LLM。

所以，長文本之戰(zhàn)引發(fā)的連鎖反應(yīng)，會讓一些能力，成為battle重點(diǎn)：

1.與云的深度融合。Maas服務(wù)會成為模型購買決策的首要原因之一，繼續(xù)深化、細(xì)化。

2.對Agent開發(fā)的支撐。基礎(chǔ)大模型很難提供所有端到端的解決方案，長文本處理是應(yīng)用層公司的舞臺，通過基礎(chǔ)大模型+Agent式工作流，去解決客戶的專有問題。而Agent式推理拼的是token生成速度，而非文本有多長。試想一下，如果一個(gè)金融客服助手半天憋不出一段話，即使生成的效果再好，用戶也不會有耐心等待。所以，長文本能力并非應(yīng)用型企業(yè)選擇基座模型的唯一標(biāo)準(zhǔn)，甚至不是最重要的標(biāo)準(zhǔn)。

3.生態(tài)規(guī)模。Kimi的爆火說明，大廠不可能壟斷所有應(yīng)用方向。利用新的技術(shù)能力（如長文本處理）來解決新的問題，創(chuàng)業(yè)公司和個(gè)人開發(fā)者更具備貼近客戶、深入場景的優(yōu)勢，為各類行業(yè)用戶的特定需求進(jìn)行微調(diào)、定制。大模型的商業(yè)城池，必須由眾多生態(tài)伙伴一起來守，誰能在2024奠定生態(tài)的規(guī)模優(yōu)勢，是接下來博弈的關(guān)鍵點(diǎn)。

總的來說，大模型落地，是一個(gè)復(fù)雜的系統(tǒng)工程。2024進(jìn)入“陣地戰(zhàn)”的大模型市場，準(zhǔn)備更加充分，作戰(zhàn)更有條理，商業(yè)化戰(zhàn)略也日益清晰�；A(chǔ)模型廠商，將在一次又一次的迎敵與防御中，構(gòu)筑起系統(tǒng)性的攻防能力。

一個(gè)平臺級的大模型公司，一定會是萬億級別，也一定會誕生在中國。讓我們拭目以待。

原文標(biāo)題 : 圍剿Kimi，只是大模型“新賽季”play的一環(huán)