2025年被認(rèn)為將是智能體(Agent)落地元年,客戶更看重智能體的效果,生態(tài)各方為此已在摩拳擦掌。
文|趙艷秋 周享玥
編|;
智能體采購,正在成為市場熱點。
“如果說2023年項目中標(biāo)主要圍繞智算中心、模型中臺建設(shè),那么從今年下半年起,眾多客戶的招標(biāo)內(nèi)容全都轉(zhuǎn)向應(yīng)用,且越來越細分。” 眾數(shù)信科聯(lián)合創(chuàng)始人汪中告訴數(shù)智前線,智能體開始走上臺前。
智能體已成為客戶、大模型企業(yè)以及各類服務(wù)商關(guān)注的核心故事。甚至一家企業(yè)能把智能體做好,就能越過大廠,成功中標(biāo)。
對于大模型企業(yè)而言,智能體技術(shù)及工具鏈的支撐能力已成為基本要求。若在這方面表現(xiàn)欠佳,大概率難以與其他模型競爭。單純靠刷榜體現(xiàn)的優(yōu)勢,如今已很難得到客戶認(rèn)可。
不過,業(yè)界對于智能體的定義、涵蓋的具體內(nèi)容,尚未達成共識。有人認(rèn)為OpenAI 推出的 GPTs 是智能體;也有人認(rèn)為,只有能調(diào)用工具的才算是智能體。從形式上說,不管對話機器人還是各種形式的大模型應(yīng)用,從廣義上都屬于智能體范疇。
但有一點是業(yè)界公認(rèn)的,那就是智能體必須能切實解決業(yè)務(wù)問題,至少在降本增效方面要有 10 倍、20 倍的提升,才能獲得客戶認(rèn)可。因為業(yè)界越發(fā)意識到,大模型模式更難實現(xiàn)商業(yè)閉環(huán),單純的燒錢模式基本難以為繼。
而業(yè)界這種認(rèn)知,不僅重構(gòu)了軟件架構(gòu),甚至在促使大模型生態(tài)企業(yè)重塑了商業(yè)模式。正如王堅博士所說,AI 不應(yīng)被視為工具的革命,而應(yīng)被當(dāng)作革命的工具。
01
“客戶要求10倍~20倍效果”
“你說電商直播數(shù)字人好,那你就幫我賣東西。一單二三十元,我分你兩元。”從事生成式AI虛擬人研發(fā)的中科深智CTO宋健告訴數(shù)智前線。在電商領(lǐng)域,今年客戶在購買工具時變得格外謹(jǐn)慎,他們更傾向于按照效果付費,采用分潤或CPS(按銷售付費)模式。宋健預(yù)測,到明年,他們的直播電商數(shù)字人客戶可能 100% 都會采用這種模式。
“國內(nèi)外智能體存在很大差異。國外可能仍類似于傳統(tǒng) SaaS 模式,只是利用智能體重構(gòu)了以往的軟件架構(gòu)。” 宋健表示,國內(nèi)的情況則更為激進一些,在一些競爭激烈的行業(yè),比如電商領(lǐng)域,不僅重構(gòu)了軟件架構(gòu),還重塑了商業(yè)模式。
這是因為客戶關(guān)注的是智能體能否切實解決問題。“無論是降低成本還是提高效率,綜合起來至少要有 10 倍、20 倍的提升才行。” 宋健進一步解釋道。
“客戶現(xiàn)在對大模型技術(shù)已經(jīng)祛魅了。”眾數(shù)信科汪中向數(shù)智前線坦言,這些客戶從之前單純的基礎(chǔ)性采購,轉(zhuǎn)變?yōu)橐詰?yīng)用效果為導(dǎo)向,要求智能體在降本、提效或拓展新業(yè)務(wù)方面創(chuàng)造價值。
“客戶不關(guān)心你是怎么實現(xiàn)的,只要看效果。”汪中說。目前行業(yè)內(nèi)的采購模式通常是,技術(shù)廠商先迅速為客戶進行一個 PoC(概念驗證)場景驗證,雖然語料范圍可能較小,交互形式也較為單一,但要證明能夠完成客戶場景中的業(yè)務(wù)邏輯,并運用客戶專屬的業(yè)務(wù)知識。之后,客戶才會啟動采購流程。當(dāng)然,他們也愿意為這些創(chuàng)新投入一定成本。
眾數(shù)信科最近做的一個PoC是氣象部門的緊急預(yù)警方案助手。廈門每年都會遭受臺風(fēng)侵襲,氣象部門預(yù)測后,需要向港務(wù)局、城管等多個部門發(fā)送應(yīng)急通知。這些應(yīng)急報告原來需要4個專家花費3個小時才能完成。PoC的演示效果顯示,借助助手,只需1位專家1小時就能完成,效率大約提升了12倍。
在另一個案例中,原本無法實現(xiàn)的事情,現(xiàn)在成為了可能。在高校學(xué)生培養(yǎng)計劃中,存在大量評測維度。如果依靠現(xiàn)有的編程技術(shù),針對上萬乃至數(shù)萬學(xué)生,只能進行一些通用評測,很難實現(xiàn)個性化定制。在這個案例中,針對課堂環(huán)節(jié),多個智能體協(xié)同合作,實現(xiàn)了創(chuàng)新。例如,有的智能體負(fù)責(zé)轉(zhuǎn)錄授課語音,有的進行授課水平的分析對比;有的生成隨堂小測試卷,有的現(xiàn)場批改試卷;還有的針對每個學(xué)生的薄弱點,進一步推薦學(xué)習(xí)材料…… 因此,在學(xué)生評價系統(tǒng)中,新增了多個評測維度。
“每一步背后都有智能體的支撐。” 汪中總結(jié)道,隨著基礎(chǔ)模型能力的發(fā)展,智能體的能力和形態(tài)更為豐富,已經(jīng)初步具備協(xié)同的基礎(chǔ)。汪中說,他們在實踐中認(rèn)識到,每個智能體都要扮演一個人類的社會角色,進行社會化分工并有產(chǎn)出,進而有可能形成群體智慧。智能體不再是單一的工具,未來也不僅僅是單個超級智能體的出現(xiàn)。
為了達到這樣的狀態(tài),智能體需要具備三個主要特征:能夠進行交流和理解;依據(jù)反饋和結(jié)果進行反思和自我規(guī)劃;與外部能力單元,如業(yè)務(wù)系統(tǒng)、其他智能體、工具級應(yīng)用等進行互動和協(xié)同。
在智能體落地應(yīng)用過程中,客戶從購買產(chǎn)品向購買服務(wù)的轉(zhuǎn)變趨勢愈發(fā)顯著。智能體與以往信息技術(shù)的不同之處在于,它需要持續(xù)優(yōu)化和調(diào)整,而目前客戶完全依靠自身力量實現(xiàn)這一點,還存在難度。汪中發(fā)現(xiàn),以規(guī)模在200萬元左右的項目為例,后續(xù)每年服務(wù)費的占比已從傳統(tǒng)信息化項目的 10%~15% 提升到 25%~30%。
而在競爭更為激烈的電商領(lǐng)域,變化更是翻天覆地。宋健注意到,電商直播數(shù)字人的迭代速度已經(jīng)以天計。一旦從銷售工具轉(zhuǎn)變?yōu)樘峁┓⻊?wù),涉及的環(huán)節(jié)會變得極為繁雜。例如,需要密切關(guān)注平臺的各種規(guī)則及其調(diào)整變化;之前那種研發(fā)、產(chǎn)品和業(yè)務(wù)相互分離的模式已經(jīng)行不通了,現(xiàn)在必須協(xié)同作戰(zhàn),技術(shù)人員要深入一線,每天查看數(shù)據(jù)、分析運營情況,進行優(yōu)化迭代;當(dāng)優(yōu)化措施不再奏效時,要果斷更換產(chǎn)品、調(diào)整客戶群體。“CPS 模式的優(yōu)勢就在于,各方更容易達成共識。”
02
生態(tài)全都動起來了
在智能體的落地巨變中,雖然大廠仍是當(dāng)下的主要推動者,但人們認(rèn)為,由于智能體更看重對客戶需求的響應(yīng),未來行業(yè)智能體的產(chǎn)出來源主要將是兩類玩家:
一類是有AI原生能力的服務(wù)商。另一類則是行業(yè)傳統(tǒng)信息化服務(wù)商。智能體的落地并非易事,核心技能有業(yè)務(wù)場景遴選、知識萃取、智能體訓(xùn)練和編排。如果不了解業(yè)務(wù)場景以及大模型的能力邊界,那么在技術(shù)響應(yīng)、經(jīng)驗和效率上就會非常低。這需要人工智能人士和業(yè)務(wù)人士的雙向奔赴。
而大廠在這一過程中,將扮演生態(tài)鏈普及角色。百度、阿里、字節(jié)、騰訊等大廠均推出了一站式智能體開發(fā)平臺。他們走的是標(biāo)準(zhǔn)路線,目的是降低智能體落地門檻、應(yīng)用廣度和深度。比如,無論百度、智譜還是浪潮云,最近發(fā)布的新品,都在關(guān)注用智能體接管手機等設(shè)備的能力,實現(xiàn)一些擬人化操作。
“大家目前都在基于自身大模型,構(gòu)建整體的智能體生態(tài)。”IDC中國高級分析師楊雯告訴數(shù)智前線,差異在于各家應(yīng)用場景、數(shù)據(jù)積累不同,發(fā)力的優(yōu)先場景和方向選擇也有所不同。業(yè)界觀察,這些企業(yè)在智能體支撐策略上差異也較大:
業(yè)界反饋,百度生態(tài)布局上覆蓋較全,有基礎(chǔ)模型,APP builder、Agent builder平臺,也有對應(yīng)的硬件如一體機,可直接在客戶機房中部署。百度也支撐聯(lián)合方案開發(fā),定制化產(chǎn)品適配。業(yè)界分析,這與李彥宏號召業(yè)界不卷模型、卷應(yīng)用有關(guān)。
一些人士建議,千帆平臺可以加強除文心之外的商業(yè)化模型納管,并支持更多常見互聯(lián)網(wǎng)服務(wù)的插件開發(fā)。
在智能體方面,今年11月,百度推出工具流Agent。“Agent去年一出來特別火,但很快一盆冷水潑下來,大家發(fā)現(xiàn)很難用起來。我們的客戶里,90%是RAG,10%是Agent。”千帆AppBuilder產(chǎn)品負(fù)責(zé)人朱廣翔告訴數(shù)智前線。因為要完成一個企業(yè)級任務(wù),可能需要幾步甚至更多,如果每一步準(zhǔn)確率是95%,多步驟下來,衰減將非?。它沒辦法支撐長思考和推理。采用工作流方式,專家把流程描述好,Agent就會穩(wěn)定很多,會更加落地。
阿里的通義千問模型能力在國內(nèi)較強、反饋好,其開源模型在業(yè)界應(yīng)用較多。阿里更多通過云端形態(tài)支撐應(yīng)用,私有化支撐較少。這可能與阿里云的“AI驅(qū)動、公共云優(yōu)先”戰(zhàn)略有關(guān)。在智能體產(chǎn)品方面,阿里通義實驗室新推出了自適應(yīng)規(guī)劃的多模態(tài)檢索智能體OmniSearch,能模擬人類,將復(fù)雜問題逐步拆解進行智能檢索規(guī)劃。
字節(jié)目前在大力推廣扣子私有化部署產(chǎn)品,即今年8月推出的HiAgent企業(yè)專屬AI應(yīng)用創(chuàng)新平臺。與年初打響大模型價格戰(zhàn)異曲同工,這次仍通過價格戰(zhàn),搶占市場。不過,它目前還不搭配模型,即字節(jié)豆包模型還沒有私有化;不做應(yīng)用,沒有硬件,嘗試基于HiAgent平臺教會客戶去搭建Agent應(yīng)用。它的打法和支撐條件還有待體系化,這與其剛剛啟動大模型私有化業(yè)務(wù)線不無關(guān)系。
而騰訊在智能體上的布局,也和其在大模型落地上優(yōu)先賦能自身產(chǎn)品矩陣的“全家桶”策略類似,更加關(guān)注與自身擁有龐大流量的自家產(chǎn)品的結(jié)合。比如今年9月,騰訊元器上線的新功能,就支持公眾號運營者自主打造專屬智能體應(yīng)用,在公眾號內(nèi)提供陪伴、互動、答疑、知識交流等智能化功能,目的是提升用戶體驗和公私域運營效率。
除了大廠,“AI六小虎”的智譜AI最近不斷更新智能體技術(shù)。智譜的優(yōu)勢在于科研能力較強,一些開發(fā)者反饋,其模型的某些性能,超過了通義千問。但目前生態(tài)方面的支持還有待加強。
在前不久召開的智譜Agent OpenDay上,智譜CEO張鵬表示,Agent可以看作是大模型通用操作系統(tǒng)的雛形,理論上,可以將其推廣到手機端、PC端、車端等各類智能設(shè)備上,實現(xiàn)基于大模型的互聯(lián)互通。
“將來的智能體,一定是跨系統(tǒng)操作的,這是0跟1的區(qū)別,而不是60分和70分的區(qū)別。”一位資深行業(yè)人士觀察,跨系統(tǒng)、跨App的能力,目前已成為兵家必爭之地。
中國電信在今年9月開始智能體平臺的開發(fā),近期展出了星辰智能體應(yīng)用平臺。中國電信相關(guān)人士告訴數(shù)智前線,目前針對政企的標(biāo)桿項目正在打造之中。
雖然大廠動作不斷,但業(yè)界期望他們支撐智能體的速度要更快。“目前的速度無法跟上廣泛的客戶需求。更多業(yè)務(wù)邏輯沒有充分體現(xiàn),也就是客戶專屬知識與大模型技術(shù)的結(jié)合問題,這也是業(yè)界在落地上非常關(guān)注的。這側(cè)面說明,大模型企業(yè)向客戶方向靠攏,尚需一個過程。
03
智能體,何時爆發(fā)?
智能體的大方向已成,但何時能夠真正爆發(fā)?
多位行業(yè)人士均向數(shù)智前線表示,這很大程度取決于模型能力的發(fā)展及市場教育進程。
“我們有一個簡單判斷,GPT5什么時候能出來,會是一個很直觀的對標(biāo)時間點。”眾數(shù)信科聯(lián)合創(chuàng)始人汪中說。
智譜AutoGLM 技術(shù)負(fù)責(zé)人劉瀟也告訴數(shù)智前線,去年智能體還只能滿足用戶10%-20%的預(yù)期,用戶就不太愿意買賬,今年達到了50%-60%,一些用戶開始意識到這件事情有用,而當(dāng)智能體能滿足用戶70%-80%的預(yù)期時,應(yīng)用鋪開的速度將非常快。他判斷大模型能力達標(biāo)大概還需半年。
中科深智CTO宋健則表達了不一樣的觀點。他認(rèn)為,Agent要真正爆發(fā),必須真的滲透到行業(yè)里頭,但To b鏈條的爆發(fā),“明年應(yīng)該還到不了特別大的規(guī)模”。
IDC中國高級分析師楊雯也告訴數(shù)智前線,于B端來說,若無法徹底解決大模型的幻覺問題,達到100%的精準(zhǔn)度,大規(guī)模應(yīng)用仍然難以實現(xiàn)。智能體爆發(fā),預(yù)計可能要1至1.5年時間。
“目前而言,智能體仍處于市場混戰(zhàn)階段,距離成為終極入口標(biāo)準(zhǔn)還有一定的路程。”楊雯說。
但不可否認(rèn)的是,面向這一確定的方向,處在智能體爆發(fā)前夕的玩家們,無一例外,都在通過各種工程化的能力和一系列技術(shù),彌補模型能力不足,提前搶占先機。
“我們測試過大量基礎(chǔ)模型,它們的Function Call能力在10個工具里去選,還是比較準(zhǔn)的,一旦超過10個,準(zhǔn)確度就大幅衰減,但在實際的應(yīng)用場景中,執(zhí)行步驟大概率都超過了10個,為了更好的實現(xiàn)業(yè)務(wù)可控性,我們首創(chuàng)了基于狀態(tài)機的智能體workflow(工作流),在保證智能體自規(guī)劃、自治性能力不受影響的前提下,實現(xiàn)業(yè)務(wù)的精準(zhǔn)可控。”汪中說。
智譜劉瀟也透露,他們正通過更好的強化學(xué)習(xí)策略,讓智能體能夠執(zhí)行更長的步驟操作。
業(yè)界目前也都在研究工作流。“正因為有了工作流,我們發(fā)現(xiàn)雖然只增加了一層,但是Agent的落地增長就非?,能看到很快到兩成。”百度朱廣翔說,預(yù)測明后兩年,Agent會逐漸超過RAG應(yīng)用,因為RAG場景較少,只是問答;但Agent可以實現(xiàn)客服、營銷、企業(yè)調(diào)度、一站式平臺,天花板更高。
有行業(yè)人士認(rèn)為,智能體的應(yīng)用可以至少分為從低到高三個應(yīng)用層級,目前市場上已經(jīng)出現(xiàn)不少初級應(yīng)用和中級應(yīng)用,高級應(yīng)用則還需進一步實現(xiàn)。
比如豆包、kimi、文小言等,被認(rèn)為可以看作是最為初級的智能體。它們具備簡單的語言交互和任務(wù)理解能力,聽得懂人話,能夠根據(jù)指令,去執(zhí)行一些簡單的操作。“目前絕大多數(shù)的智能體是單智能體的初級應(yīng)用,包括很多GPTs,能夠簡單的做問答等任務(wù)執(zhí)行。”IDC楊雯說。
中級應(yīng)用還要更深一層,展現(xiàn)形式已經(jīng)脫離單純的Chatbot形態(tài),不再僅僅是對話框模式,規(guī)劃能力和復(fù)雜度也進一步提升,使用的工具不再是聯(lián)網(wǎng)搜索、天氣查詢等簡單插件,而是需要有對應(yīng)場景內(nèi)的專業(yè)插件和能力,能完成更復(fù)雜的場景任務(wù)。
“比如智能客服,就是非常典型的一個Agent應(yīng)用,比以前可能會有10倍甚至20倍的一個變化,現(xiàn)在我們接到的很多電話,其實都是新的Agent打出來的,你跟它聊半天,可能還以為它是個真人。”宋健說,而且,與傳統(tǒng)客服相比,軟件設(shè)計也變得更加簡便。
“第三個級別,也是我們現(xiàn)在在努力去實現(xiàn)的。它除了更豐富的交互形態(tài),能夠完成復(fù)雜任務(wù),還會額外再增加兩個標(biāo)簽。”汪中告訴數(shù)智前線。
其一是能夠了解場景背后的業(yè)務(wù)邏輯和知識脈絡(luò)。“它可能不再那么通用,但它的專業(yè)性更強。而如果沒有,它還會主動去尋求這些行業(yè)知識的支撐。”
其二,從插件和工具的使用能力上來說,它能夠讀懂現(xiàn)有的業(yè)務(wù)系統(tǒng),將現(xiàn)有的業(yè)務(wù)系統(tǒng)作為其能力插件來源的一部分,而不再只能使用為它定制的插件。
汪中舉例說,他們正在與船舶貨運公司進行港務(wù)調(diào)度助手的研發(fā)試點,在他看來就是一種高級應(yīng)用。
一艘船靠岸后,往往需要進行卸貨、轉(zhuǎn)運、洗艙、船員登記、物資補給等大量工作,原來這些工作主要靠人工去安排和調(diào)度,再登記進入車輛管理系統(tǒng)、補給管理系統(tǒng)等對應(yīng)的若干個系統(tǒng)里,給到對應(yīng)的執(zhí)行單位執(zhí)行。而現(xiàn)在,客戶提出,希望用AI智能體來幫助現(xiàn)場員工,在繁雜的信息流和工作流中,由智能體進行初步的信息收集、分析、業(yè)務(wù)建議,成為現(xiàn)場員工的“數(shù)字同事”。
當(dāng)然,更高級的應(yīng)用,仍然有賴于模型能力和工程化能力的提升。