訂閱
糾錯(cuò)
加入自媒體

寫(xiě)在智能體大爆發(fā)前夜:全民 Agent時(shí)代即將來(lái)臨

隨著技術(shù)的成熟和應(yīng)用場(chǎng)景的明確,AI Agent的能力維度逐步完善,用戶體驗(yàn)效果也會(huì)更好。這對(duì)于企業(yè)級(jí)智能體應(yīng)用也將十分有價(jià)值。

 內(nèi)容/阿文

編輯/詠鵝

校對(duì)/莽夫

智能體,正處于大爆發(fā)的前夜。

近日,在Agent OpenDay上,智譜AI展示了在AI Agent(智能體)方面最新成果,發(fā)布了用AI替代人類執(zhí)行任務(wù)的三款智能體,分別是面向手機(jī)的phone use——AutoGLM,面向電腦的compute use——GLM PC,以及面向網(wǎng)頁(yè)的GLM-Web能力。

此前,微軟也宣布,已建立全球規(guī)模最大的企業(yè)級(jí)AI Agent生態(tài)系統(tǒng)。加之谷歌Jarvis意外泄露、OpenAI即將推出Operator……似乎過(guò)不了多久,AI Agent就將接管我們的生活和工作。

那么AI Agent到底是什么?

從概念上來(lái)說(shuō),AI Agent是一種不需要持續(xù)人類干預(yù)的AI系統(tǒng),可以基于環(huán)境和背景信息,自主分析各種問(wèn)題,做出邏輯決策,并且在沒(méi)有持續(xù)人類輸入的情況下處理多種任務(wù),比如AlphaGo是一個(gè)典型的AI Agent,它可以在和人類對(duì)弈圍棋的過(guò)程中,根據(jù)當(dāng)前的棋局和對(duì)手的行動(dòng),自主決策下一步的動(dòng)作。

AI技術(shù)從基礎(chǔ)模型到Agent概念興起,再到如今能自主推理,還能操作執(zhí)行特定任務(wù)的軟件,經(jīng)歷了一個(gè)漫長(zhǎng)而復(fù)雜的技術(shù)演變過(guò)程。

強(qiáng)化學(xué)習(xí)是AI Agent發(fā)展的關(guān)鍵技術(shù)之一,大語(yǔ)言模型(LLM)的發(fā)展為AI Agent提供了新的可能性。LLM作為AI Agent的核心大腦,可以實(shí)現(xiàn)復(fù)雜問(wèn)題的拆解、類人的自然語(yǔ)言交互等能力。

AI Agent代表著AI技術(shù)邁向更智能、更自主交互的新階段。它不再僅僅是簡(jiǎn)單地執(zhí)行指令,而是能夠像人類助手一樣,根據(jù)復(fù)雜的情境和目標(biāo)進(jìn)行自主規(guī)劃、決策與執(zhí)行任務(wù)。想象一下,如果你餓了,你只需要給AI助手下達(dá)“點(diǎn)個(gè)外賣”的指令,AI助手就能自動(dòng)幫你完成從外賣搜索、查詢、下單、確認(rèn)的全部動(dòng)作。

這不僅僅是提升效率的表現(xiàn),還是一種全新的人機(jī)交互模式,可以讓機(jī)器和人之間的關(guān)系更加緊密。去年12月比爾·蓋茨曾預(yù)測(cè),Agent不僅將改變?nèi)藗兣c計(jì)算機(jī)的互動(dòng)方式,還將顛覆軟件行業(yè);李彥宏也認(rèn)為,智能體是AI時(shí)代的網(wǎng)站,將會(huì)有幾百萬(wàn),甚至更大量的智能體出現(xiàn)形成龐大生態(tài)。

Part.1

AI Agent進(jìn)化史:

從簡(jiǎn)單對(duì)話到私人助理

Agent概念并非是人工智能第三次浪潮的產(chǎn)物,而是伴隨人工智能出現(xiàn)的“智能實(shí)體”概念不斷進(jìn)化的結(jié)果。

1966年,MIT人工智能實(shí)驗(yàn)室的Joseph Weizenbaum開(kāi)發(fā)出了歷史上第一個(gè)聊天機(jī)器人ELIZA,名字源于蕭伯納戲劇作品《賣花女》中的主角名,它只有200行程序代碼和一個(gè)有限的對(duì)話庫(kù),可以針對(duì)提問(wèn)中的關(guān)鍵詞,進(jìn)行答復(fù)。

ELIZA其實(shí)沒(méi)有任何智能性可言。它基于規(guī)則運(yùn)作,既不理解對(duì)方的內(nèi)容,也不知道自己在說(shuō)什么。但即便如此,它還是開(kāi)創(chuàng)了人機(jī)對(duì)話的先河。ELIZA可以說(shuō)是現(xiàn)在Siri、小愛(ài)同學(xué)等問(wèn)答交互工具的鼻祖。

進(jìn)入21世紀(jì)后,隨著技術(shù)的不斷發(fā)展,AI Agent的發(fā)展進(jìn)入平穩(wěn)期,機(jī)器學(xué)習(xí)技術(shù)的興起為AI Agent的智能提升提供了動(dòng)力,深度學(xué)習(xí)技術(shù)的突破為AI Agent的發(fā)展帶來(lái)了革命性的進(jìn)步,使得AI Agent在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域取得了重大突破。

目前,人工智能已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,如醫(yī)療、教育、交通、金融等,AI Agent在這些領(lǐng)域的應(yīng)用提高了工作效率。

2011年,可以說(shuō)具備關(guān)鍵轉(zhuǎn)折意義的一年。首先,IBM Watson在智力問(wèn)答節(jié)目Jeopardy!中戰(zhàn)勝人類選手,展示了AI的強(qiáng)大潛力;其次,這一年,蘋果推出Siri,開(kāi)創(chuàng)了移動(dòng)智能助手的新時(shí)代。2014年,微軟在中國(guó)推出AI聊天機(jī)器人“小冰”,首次展現(xiàn)了AI在情感計(jì)算和社交互動(dòng)方面的潛力。

但嚴(yán)格意義上來(lái)說(shuō),AI Agent真正到來(lái)的開(kāi)端是2022年11月,OpenAI發(fā)布ChatGPT,掀起了全球AI熱潮。2023年3月14日多模態(tài)大模型GPT-4發(fā)布,支持圖像輸入,其理解力和生成能力大幅提升,開(kāi)創(chuàng)了自主AI Agent的先河?梢哉f(shuō),ChatGPT的問(wèn)世,實(shí)現(xiàn)了從“說(shuō)”到“做”,不再僅僅停留在對(duì)話層面,而是能夠自主執(zhí)行復(fù)雜任務(wù)。

AI Agent能有如今的發(fā)展速度,離不開(kāi)關(guān)鍵技術(shù)的突破,如深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的發(fā)展、大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型、強(qiáng)化學(xué)習(xí)與人類反饋、多模態(tài)交互能力以及工具使用和環(huán)境適應(yīng)能力等等。

據(jù)悉,智能體的數(shù)量呈爆發(fā)式增長(zhǎng),國(guó)內(nèi)智能體總數(shù)1年超1000萬(wàn)個(gè),是蘋果應(yīng)用商店每年上線應(yīng)用數(shù)量的85倍。智能體創(chuàng)作平臺(tái)也被比爾·蓋茨認(rèn)為是繼Android、iOS和Windows后的下一代應(yīng)用開(kāi)發(fā)平臺(tái)。

Part.2

大廠紛紛下場(chǎng)

AI Agent涌向終端市場(chǎng)

智能體或?qū)⒊蔀槔^PC、移動(dòng)終端后的下一個(gè)爆發(fā)點(diǎn)。李彥宏曾公開(kāi)表示,基礎(chǔ)模型本身是需要靠應(yīng)用才能顯現(xiàn)出來(lái)的價(jià)值。智能體就是一個(gè)幾乎可以是放之四海而皆準(zhǔn)的基于大模型的應(yīng)用。

數(shù)據(jù)顯示,2024年1月到10 月,中國(guó)AI原生應(yīng)用(App)累計(jì)下載量排名前5的應(yīng)用豆包、文小言(原文心一言)、Kimi、星野、天工AI累計(jì)下載量分別為1.08億、2260萬(wàn)、2100萬(wàn)、1790萬(wàn)、1170萬(wàn)。

國(guó)內(nèi)最早上線大模型原生應(yīng)用的是百度,于2023年3月16日上線文心一言,與OpenAI發(fā)布ChatGPT僅相距三個(gè)月時(shí)間。隨后國(guó)內(nèi)互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)新秀們陸陸續(xù)續(xù)上線國(guó)產(chǎn)AI大模型應(yīng)用,如阿里通義千問(wèn)大模型2023年4月上線,訊飛星火大模型2023年5月上線,智譜AI 2023年9月上線,后起之秀Kimi智能助手稍晚,但也于2023年10月上線,距ChatGPT發(fā)布不過(guò)10個(gè)月。

2024年6月25日OpenAI宣布中國(guó)不在當(dāng)前支持API服務(wù)的188個(gè)國(guó)家和地區(qū)名單中,這意味著ChatGPT將終止在中國(guó)的服務(wù)。而對(duì)于國(guó)內(nèi)的AI玩家和智能體開(kāi)發(fā)者來(lái)說(shuō),這無(wú)疑是天大的利好機(jī)會(huì)。

據(jù)悉,互聯(lián)網(wǎng)大廠中,百度、阿里、騰訊、字節(jié)跳動(dòng)、華為等皆已布局智能體賽道,并推出一站式智能體開(kāi)發(fā)平臺(tái)。一時(shí)間,字節(jié)跳動(dòng)的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺(tái)百煉、科大訊飛星火智能體平臺(tái)等智能體開(kāi)發(fā)平臺(tái)百花齊放。

相較于大廠的算力、數(shù)據(jù)、人才等資源優(yōu)勢(shì),能夠在模型端、應(yīng)用端以及中間層智能體開(kāi)發(fā)平臺(tái)協(xié)同閉環(huán)發(fā)展,其他規(guī)模廠商的大模型技術(shù)路徑雖各有側(cè)重,但都有一定的大模型研發(fā)基礎(chǔ)。

2023年4月,商湯科技推出名為“日日新SenseNova”的大模型,集成了自然語(yǔ)言處理、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種強(qiáng)大功能。

再比如百川智能,由搜狗創(chuàng)始人王小川創(chuàng)立,自2023年成立以來(lái)便以驚人的速度發(fā)展。短短半年多時(shí)間,百川智能便接連發(fā)布了Baichuan-7B/13B、Baichuan2-7B/13B四款開(kāi)源可免費(fèi)商用大模型,以及Baichuan-53B、Baichuan2-53B兩款閉源大模型,平均每28天就會(huì)有一款新的大模型問(wèn)世。

智譜AI自2019年成立以來(lái),便深耕于大模型研發(fā)領(lǐng)域,憑借著清華大學(xué)知識(shí)工程實(shí)驗(yàn)室(KEG)的強(qiáng)大技術(shù)支撐。2023年,其推出面向C端用戶的聊天對(duì)話應(yīng)用“智譜清言”。

和互聯(lián)網(wǎng)大廠不同的是,智譜AI、百川智能等初創(chuàng)企業(yè),更多的是以AI應(yīng)用助手的產(chǎn)品形式為主,暫未推出智能體開(kāi)發(fā)平臺(tái)。

值得注意的是,2024年,越來(lái)越多的手機(jī)廠商開(kāi)始頻繁提及手機(jī)智能體相關(guān)概念。近日,vivo在其2024開(kāi)發(fā)者大會(huì)上推出了名為PhoneGPT的手機(jī)智能體,是手機(jī)中可以基于用戶意圖主動(dòng)完成任務(wù)的多模態(tài)助理,它可以準(zhǔn)確地識(shí)別手機(jī)屏幕界面中的內(nèi)容,自動(dòng)操作手機(jī)中各種各樣的應(yīng)用,完成用戶交代的任務(wù),比如打電話、短信等。

早在今年9月,榮耀在2024德國(guó)柏林消費(fèi)電子展上發(fā)布跨應(yīng)用開(kāi)放生態(tài)智能體。更早之前,6月,華為也在其開(kāi)發(fā)者大會(huì)期間宣布了“鴻蒙原生智能”(Harmony Intelligence),小藝升級(jí)為系統(tǒng)級(jí)智能體。

比爾·蓋茨曾預(yù)測(cè),AI Agent將是大模型之后的下一個(gè)平臺(tái),越來(lái)越多的大模型公司和科技企業(yè)都開(kāi)始布局Agent。在大模型這場(chǎng)競(jìng)爭(zhēng)裝備賽中,如果說(shuō)上半場(chǎng)卷的是基礎(chǔ)能力,那么現(xiàn)在,AI Agent的應(yīng)用落地成為最重要的產(chǎn)品競(jìng)爭(zhēng)形態(tài)。

Part.3

爆發(fā)前夜:

全民智能體能否成為現(xiàn)實(shí)?

AI Agent的能力會(huì)不斷完善。首先,能夠分解任務(wù)并制定執(zhí)行計(jì)劃;其次,可以調(diào)用API、訪問(wèn)網(wǎng)絡(luò)、操作軟件;第三,具備持續(xù)學(xué)習(xí)和知識(shí)積累能力。最后,能夠在復(fù)雜環(huán)境中做出自主判斷。

智能體不僅能對(duì)話,還具有反思和規(guī)劃能力。如果用戶反饋結(jié)果不對(duì),它會(huì)自己思考哪里出問(wèn)題了,還能夠?qū)Ψ峙涞娜蝿?wù)進(jìn)行自主規(guī)劃、思考調(diào)用什么工具能夠?qū)崿F(xiàn)最終目標(biāo)。

因此也可以預(yù)判,隨著技術(shù)的成熟和應(yīng)用場(chǎng)景的明確,AI Agent的能力維度逐步完善,用戶體驗(yàn)效果也會(huì)更好。這對(duì)于企業(yè)級(jí)智能體應(yīng)用也將十分有價(jià)值。未來(lái),企業(yè)級(jí)AI Agent或?qū)⒂瓉?lái)快速增長(zhǎng)期,各行各業(yè)都將開(kāi)始大規(guī)模采用定制化的Agent解決方案。

此外,未來(lái)的AI系統(tǒng)將不再是獨(dú)立運(yùn)行的單個(gè)Agent,而是多Agent協(xié)作將取代單Agent系統(tǒng),即由多個(gè)專業(yè)化Agent組成的協(xié)作網(wǎng)絡(luò),它們能夠分工合作,共同完成復(fù)雜任務(wù)。

銀河證券研報(bào)指出,AI Agent的崛起正重塑AI產(chǎn)業(yè)鏈并帶來(lái)投資新機(jī)遇。預(yù)計(jì)到2028年,中國(guó)AI代理市場(chǎng)規(guī)模將激增至8520億元,年復(fù)合增長(zhǎng)率達(dá)72.7%。AI Agent產(chǎn)業(yè)鏈?zhǔn)嵌嘣腋叨葏f(xié)同生態(tài)系統(tǒng),未來(lái)市場(chǎng)空間廣闊。AI Agent推動(dòng)App生態(tài)逐漸向端側(cè)生態(tài)轉(zhuǎn)變,將成為AI應(yīng)用發(fā)展新趨勢(shì)。傳統(tǒng)端側(cè)AI之前的痛點(diǎn)之一是無(wú)法通過(guò)用戶指令調(diào)用操作界面并實(shí)現(xiàn)用戶目標(biāo)。AI Agent模型通過(guò)實(shí)現(xiàn)自然語(yǔ)言與硬件的交互,解決端側(cè)AI痛點(diǎn)。

AI Agent雖然帶來(lái)了諸多想象力,但在真正的落地應(yīng)用中還存在諸多挑戰(zhàn)。比如,可靠性、性能和成本依舊是一個(gè)大難題。眾所周知,LLM容易產(chǎn)生幻覺(jué)和不一致性,將多個(gè) AI步驟連接起來(lái)會(huì)加劇這些問(wèn)題,尤其是對(duì)于需要精確輸出的任務(wù)。此外,GPT-4、Gemini-1.5和Claude Opus在使用工具/函數(shù)調(diào)用方面表現(xiàn)不錯(cuò),但它們?nèi)匀惠^慢且成本高,特別是需要進(jìn)行循環(huán)和自動(dòng)重試時(shí)。

風(fēng)口之上,任何一家企業(yè)與個(gè)體都想要抓住它,但Agent如何保證用戶的數(shù)據(jù)安全和隱私一直是業(yè)界討論最多的問(wèn)題之一。

Agent一旦投入應(yīng)用,勢(shì)必會(huì)接觸到客戶的核心數(shù)據(jù),倘若數(shù)據(jù)泄漏,可能讓用戶和社會(huì)蒙受巨大損失。如若在賬單、密碼、購(gòu)物等涉及支付或個(gè)人信息的敏感動(dòng)作中,用戶信任很難建立。但數(shù)據(jù)又是模型訓(xùn)練不可缺少的“生產(chǎn)資料”。

當(dāng)前,中國(guó)正處于AI智能體應(yīng)用快速發(fā)展的關(guān)鍵節(jié)點(diǎn),有挑戰(zhàn)是正,F(xiàn)象。誰(shuí)能快速適應(yīng)并利用好智能體技術(shù),將直接影響該企業(yè)未來(lái)能否在市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。而AI Agent的火爆,會(huì)迎來(lái)一個(gè)比互聯(lián)網(wǎng)時(shí)代還要火爆的黃金年代嗎?我們拭目以待。

       原文標(biāo)題 : 寫(xiě)在智能體大爆發(fā)前夜:全民 Agent時(shí)代即將來(lái)臨

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)