訂閱
糾錯
加入自媒體

智譜AI戰(zhàn)略失焦,B端C端難兼顧

2024-12-11 14:35
科技新知
關注

“智譜AI被迫“多線進軍”的背后折射出,在中國AI創(chuàng)新生態(tài)與投資環(huán)境中,“快”往往比“深”更受青睞。”

@科技新知 原創(chuàng)

作者丨林書 編輯丨蕨影

在2024年的一個尋常冬日,國產AI再次改變了我們與技術交互的方式。

11月29日,智譜AI在其技術開放日上上演了一幕令人矚目的科技大戲:歷史上首次!AI發(fā)出了第一個紅包!

公司CEO張鵬僅僅通過三句語音指令,就讓旗下的智能體AutoGLM跨越微信、支付寶等多個應用,給現場和線上的觀眾發(fā)了兩個大紅包。

這一幕背后,折射出的是 AI Agent技術的革命性突破。

當前,傳統(tǒng)的AI助手停留在被動響應和單一場景的交互,而智譜AI的AutoGLM已經能夠主動理解復雜指令,跨應用協同,并精準執(zhí)行用戶意圖。

除了發(fā)紅包這樣的操作外,即使面對多個復雜操作的超長任務,例如訂外賣時橫跨多個APP比價,AutoGLM也能行云流水般自主執(zhí)行。

然而這樣的“驚喜”,只是今年智譜在AI方向上結出的眾多”碩果“之一。

今年7月,智譜AI 代碼生成大模型 CodeGeeX 第四代正式發(fā)布,支持代碼補全、代碼注釋、代碼修復、代碼翻譯等基礎功能;7月末,智譜AI的視頻生成模型「智譜清影」正式發(fā)布,可生成時長 6 秒,清晰度達到 1440×960的視頻。

到了10月,智譜推出并開源端到端語音模型 GLM-4-Voice,與GPT-4o的語音功能一樣, GLM-4-Voice可以進行實時語音對話,同時在情緒表達、多語言等方面實現突破,且可隨時打斷。

由此可見,今年的智譜,在代碼、多模態(tài)、Agent等多個方向上,都進行了“突擊”。這種全方位的技術布局,展示了智譜AI在追趕全球AI巨頭的決心。

然而,在這看似全面的進展背后,也不免讓人產生一種冷靜的思考:在體量、資本均不及OpenAI等巨頭的情況下,如此廣泛的技術覆蓋,是否會影響智譜在各個領域的深耕程度?

01

多線進軍的隱憂

從總體上離開,在今年的AI賽道上,身為“AI六小虎”之一的智譜,雖然布局甚廣,但其在每一條戰(zhàn)線上的表現,都相對比較“平均”,其產品方向更趨向于跟隨,而鮮少有獨創(chuàng)性的突破。

以智譜最近發(fā)布的旗艦大模型GLM-4-Plus為例,該模型定位是一種類似OpenAI 的o1那樣的深度推理模型。雖然其在深度推理、長文本處理和指令遵循等方面表現突出,且能夠處理更復雜的數學和邏輯問題,然而,這種“強大”并不意味著絕對的優(yōu)勢,反而暴露出一些潛在的矛盾。

這樣的矛盾就在于,GLM-4-Plus這種“類o1”的深度推理模型,實質上與智譜本身的生態(tài)定位之間,已經發(fā)生了錯位。

因為智譜的定位與OpenAI這類巨頭有所不同,雖然智譜AI確實更偏向于B端市場,但B端市場并非單一結構,而是由不同層級和類型的需求構成。

對高性能深度推理的需求,主要來自科研、高技術行業(yè)或特定領域(如編程或科學計算),這些領域的規(guī)模相對有限。

智譜AI的B端客戶,則聚焦于更廣泛的行業(yè)應用的B端客戶,包括金融、教育、能源,通信等行業(yè),這樣的企業(yè),更需要的是性價比高、易集成且靈活的模型,而非動輒需要高算力支持的深度推理大模型。

如果說,進入高端推理模型的競爭,只是智譜AI在“scaling Law 失效”威脅下,一種展示核心技術實力的必要手段,那么在多模態(tài)方向上的布局,則反映了其更深層次的“定位迷失”。

02

 力所不及的多模態(tài)

智譜AI在2024年發(fā)布的多模態(tài)語音助手功能,特別是其基于GLM系列的“智譜清言”系統(tǒng),通過融合實時語音、視頻通話和多模態(tài)理解技術,試圖在C端應用領域拓展新的場景。

然而,與科大訊飛的“星火”大模型和字節(jié)跳動的“豆包”語音AI相比,智譜AI的表現呈現出一些耐人尋味的矛盾。

科大訊飛已深耕語音領域多年,其語音識別、翻譯和場景化應用(如會議記錄、智能客服)不僅成熟,而且在實際場景中有良好的落地率。字節(jié)的“豆包”則依托強大的內容生態(tài),具有將語音AI應用到社交、娛樂和短視頻生成等消費級場景中的潛力。

在生態(tài)布局均不如人的情況下,智譜AI的多模態(tài)語音助手,卻仍未能體現亮眼的差異,其視頻通話功能雖然支持低延遲,更自然的交互,但智力水平的表現,卻與文本狀態(tài)下有著很大差距。與字節(jié)的“豆包”、訊飛的”星火都犯了同樣的通病。

除此之外,智譜AI在2024年的文生視頻領域也展現了雄心,通過其最新發(fā)布的CogVideoX v1.5模型和開放平臺“清影”,提供了從文本生成視頻(T2V)到多模態(tài)整合的一系列功能。其技術亮點包括支持5到10秒的高清視頻生成、4K分辨率、多通道輸出(一次性生成多個視頻)等。

然而,平心而論,與字節(jié)、快手等大廠的文生視頻大模型相比,“清影”的表現還是太嫩了點。

雖然其主打免費、高清,甚至還在后期加入了AI音效的選項,但從效果上看,其生成的視頻不僅古怪、扭曲,并且還有一些很明顯的運動錯誤。

例如,在輸入提示詞:“一片廣闊的海灘上,一個人形機器人和一只貓在一起散步”后,清影生成的視頻里,出現了兩個機器人,而非一個,同時它們還像螃蟹一樣,用一種橫著走路的奇怪方式在移動。

更詭異的則是畫面中的貓,走著走著,頭就變成了尾巴,仿佛器官發(fā)生了換位。

03

價格戰(zhàn)下的無奈

上述提到的種種“博而不精”的現象,反映出的更深層次的問題在于,智譜AI似乎在B端與C端兩個方向上出現了搖擺的情況。

以視頻生成為例,字節(jié)跳動通過其強大的內容生態(tài),將MagicVideo-V2緊密結合到TikTok和抖音等平臺,實現了技術與商業(yè)的雙向賦能。同樣地,快手也可將視頻生成嵌入自身的短視頻平臺。

短視頻賽道,是天然離C端最近,也最具親和力的一條賽道。

而現在的智譜AI,從生態(tài)布局來看,其整體戰(zhàn)略更偏向于B端市場,服務的客戶包括金融、教育、能源和制造業(yè),這些合作大多集中在需要高技術支持和私有化部署的場景中,如工業(yè)流程優(yōu)化、客戶服務智能化等。

但今年智譜AI的多線布局的策略,似乎表明了其既希望拓展ToB市場,又想在C端打造多模態(tài)互動的超級應用,形成一種“兩頭抓”的戰(zhàn)略。

在總體資源不及OpenAI,也不及BAT等巨頭的情況下,這一策略的結果最終導致了其資源分散,難以在一個方向上形成突出的競爭優(yōu)勢。

但實際上,這種多線進軍的策略,透露出的是一種在商業(yè)化困境下的“無奈突圍”。

《中國大模型中標項目監(jiān)測報告》顯示,2024年1-9月份,智譜華章中標的大模型項目達到22個,中標項目披露的中標金額為2472.3萬元。22個中標項目主要分布在通信、金融、能源、教科等行業(yè),以央國企客戶為主。

從大模型中標項目數量來看,智譜華章可以跟科大訊飛、百度一樣,位列第一梯隊。但是獲得這些項目的過程中,智譜華章付出的“代價”也不小。

這樣的“代價”,就是卷到極致的價格戰(zhàn)。

今年以來,為了應對同行的價格壓制,智譜AI將模型調用價格降低到行業(yè)最低水平,如GLM-4-Flash的價格僅0.06元/百萬tokens;對比之下,OpenAI的GPT-4 Turbo版本為 10美元/百萬tokens,差距超過千倍。在一年的時間里,智譜AI從最初的 0.5元/千tokens 降至當前價格,降幅接近1萬倍。

這種激進的降價策略,導致利潤空間進一步被壓縮。于是,作為大模型廠商的智譜AI,要活下來,只能依靠融資。

過去半年,資本對于國內大模型廠商的態(tài)度逐漸冷靜下來。如果大模型廠商想要拿到新一輪融資,最重要的就是要證明自己商業(yè)化的能力。

而這樣的“能力”,反映在具體的業(yè)務上,就是一個又一個的“技術奇觀”的出現。

過去幾個月,智譜AI接連發(fā)布了AI生成視頻模型清影(Ying)、情感語音模型GLM-4-Voice ,以及AI助理工具AutoGLM 等,這無一不是想通過追逐技術熱點,來吸引市場關注的表現。

然而,縱觀整個AI行業(yè)來看,即使在大模型商業(yè)化困難的瓶頸期,除了“多線出擊”的策略外,相關的AI企業(yè)并不是沒有其他選擇的余地。

在大模型尚未在C端取得明顯盈利化的階段,是否有AI企業(yè)保持住了自身的定力,專注于特定的方向,并取得了突破行業(yè)上限的進展?

答案當然是有的,OpenAI的勁敵——Anthropic就是個很好的例子。

與其他多線布局的大廠相比,Anthropic明確聚焦于機制可解釋性和AI對齊問題。它的研究目標高度集中,例如通過“憲法AI”的理念改進AI的安全性和倫理性,使其模型的行為更加透明和可控。這種專注不僅增強了其科研資源的深度與質量,也吸引了對該領域有長期投資意愿的資本,包括Sam Bankman-Fried的FTX基金會、Google Cloud等。

Anthropic之所以能做到這點,而智譜AI卻被迫“多線進軍”,背后折射出了一個深層次的現實:在中國的AI創(chuàng)新生態(tài)與投資環(huán)境中,“快”往往比“深”更受青睞。

這并非簡單的企業(yè)選擇問題,而是整個創(chuàng)新生態(tài)的產物。

智譜AI等國產大模型廠商普遍“追熱點”困境,本質上是一個“囚徒困境”:每家企業(yè)都知道深耕細作的重要性,但在激烈的市場競爭和資本壓力下,不得不選擇更激進的策略。這種現象的背后,是中國技術創(chuàng)新生態(tài)尚未形成對“慢變量”的充分理解和尊重。

       原文標題 : 智譜AI戰(zhàn)略失焦,B端C端難兼顧

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號