重讀百度:文心一言意味著什么?
AI原生時代正在加速到來。
@新熵 原創(chuàng)
作者丨樟稻 編輯丨伊頁
2022年11月30日,人工智能領(lǐng)域可能也迎來了與網(wǎng)景導(dǎo)航者的問世同樣重要的關(guān)鍵時刻。當天,OpenAI的首席執(zhí)行官山姆·阿爾特曼發(fā)推文稱:“今天我們發(fā)布了ChatGPT。歡迎點擊這里與它聊天。”
沒承想,這一應(yīng)用以迅雷不及掩耳之勢成為眾人茶余飯后討論的話題。據(jù)瑞銀的一份報告顯示,在ChatGPT推出僅兩個月后,它的月活用戶已經(jīng)突破1億,成為史上用戶增長速度最快的消費級應(yīng)用程序。
隨著ChatGPT的爆火,眼下其產(chǎn)生的巨大吞噬力如同黑洞一般,吸引著國內(nèi)外各大科技互聯(lián)網(wǎng)企業(yè),紛紛宣布要在ChatGPT背后的大語言模型賽道布局。
在外界看來,大語言模型的成熟是人工智能里程碑,更是分水嶺,這意味著AI技術(shù)發(fā)展到臨界點,也同樣預(yù)示著將對原有商業(yè)模式進行重塑。由于大語言模型影響最大的將是搜索引擎行業(yè),市場紛紛聯(lián)想到百度。
作為國內(nèi)搜索引擎和人工智能的代表,百度自然不會錯過這次機會。此前在2月7日,百度確認大語言模型名為“文心一言”,英文名“ERNIE Bot”,預(yù)計三月份完成內(nèi)測,面向公眾開放。
就在2023年2月22日,百度發(fā)布了截至2022年12月31日的第四季度及全年未經(jīng)審計的財務(wù)報告。2022年,百度實現(xiàn)營收1236.75億元,歸屬百度的凈利潤(非美國通用會計準則)206.8億元,同比增長10%。第四季度,百度實現(xiàn)營收330.77億元,歸屬百度的凈利潤(非美國通用會計準則)53.71億元,同比增長32%。2022財年,百度核心連續(xù)四個季度業(yè)績超市場預(yù)期。
輔以財報數(shù)據(jù),我們可以嘗試探尋,在人工智能領(lǐng)域深耕數(shù)十年的百度,能否乘文心一言東風(fēng)完成自我變革,引發(fā)行業(yè)“重讀”。
01
搜索的代際變革
早在ChatGPT發(fā)布的第一天,就有生成式AI要取代搜索引擎的聲音出現(xiàn),原因在于,ChatGPT本質(zhì)上是自然語言生成式AI,天然適用于搜索場景,提供高度智能的對話式搜索結(jié)果。
對此,行業(yè)形成的共識是,ChatGPT在中短期內(nèi)仍無法完全取代傳統(tǒng)搜索引擎,但將會加速搜索引擎演化進程,并在中期形成以傳統(tǒng)搜索為主、ChatGPT類模型為輔的新搜索引擎形態(tài)。也就是說,生成式AI是搜索引擎的新奇點。
這與百度的想法不謀而合。
今年1月Create AI開發(fā)者大會前夕,百度搜索宣布將基于百度自研的生成式模型,升級“生成式搜索”能力,并指出,生成式AI和搜索引擎是互補關(guān)系而不是替代,搜索底層技術(shù)和AI底層技術(shù)是相通的。
更早之前,百度董事長兼首席執(zhí)行官李彥宏曾在一場內(nèi)部直播中表示,AIGC(AI生成內(nèi)容)和ChatGPT這些都是AI技術(shù)發(fā)展到一定地步后產(chǎn)生的新機會。“這個事情很難,但百度必須要做。”
彼時,市場還在觀望百度將如何參與這場熱潮,答案很快被揭曉——2023年2月7日,百度官宣即將發(fā)布的大模型新項目:文心一言(英文名ERNIE Bot)。
此后時隔一日,經(jīng)媒體披露,百度董事長兼首席執(zhí)行官李彥宏2023年一季度OKR關(guān)鍵任務(wù)為“引領(lǐng)搜索體驗的代際變革”。顯然,文心一言將在這輪變革中起到核心作用。
譬如,文心一言是搜索引擎實現(xiàn)“模糊搜索”到“精準推送”跨越的關(guān)鍵:生成式AI問世之前,搜索引擎以“模糊搜索”為主,用戶需要根據(jù)在搜索引擎中打入關(guān)鍵字找到需要的內(nèi)容或鏈接,而通過文心一言,用戶可以通過自然語言交互的方式輕松獲得需要的內(nèi)容或鏈接,且內(nèi)容較為精準,即“精準推送”。
與此同時,生成式內(nèi)容也會極大豐富內(nèi)容生態(tài)和內(nèi)容供給,讓成熟的搜索業(yè)務(wù)和搜索體驗煥發(fā)生機。這在于,決定一個內(nèi)容產(chǎn)品平臺優(yōu)質(zhì)與否最關(guān)鍵的因素是內(nèi)容數(shù)量、內(nèi)容質(zhì)量、客戶互動。
從這個角度來看,文心一言勢必提高百度在內(nèi)容層面的核心驅(qū)動力。例如,文心一言可有效對已有信息進行語言整合、文字輸出,人類只需扮演提供靈感的角色,AI將協(xié)助創(chuàng)作過程生成個性化的文本內(nèi)容。
至于被市場關(guān)注的生成式AI整合進搜索引擎對于商業(yè)模式的挑戰(zhàn),百度并沒有這方面的擔憂。
首先,百度營收更趨多元化,非廣告營收占比逐季增加。根據(jù)財報數(shù)據(jù),2022年Q4,百度核心收入為257億元人民幣 ,其中,廣告收入為181億元人民幣,非廣告收入為76億元人民幣,同比上升11%,主要受百度智能云及其他AI驅(qū)動業(yè)務(wù)的推動。
其次,文心一言對于廣告業(yè)務(wù)更是一次重大利好。原理很簡單,有機器學(xué)習(xí)行業(yè)人士解釋道,“從商業(yè)模式的角度,廣告業(yè)務(wù)最大的關(guān)鍵點是平臺的控制力,平臺的控制力越大,粒度越細,變現(xiàn)的空間越大!
可以預(yù)見的是,伴隨文心一言接入搜索,除開因文心一言帶來的DAU及用戶使用時長的攀升,同時搜索將能夠充分利用類ChatGPT技術(shù)完善升級,形成搜索代際變革。
02智能云有了最新解
文心一言為搜索業(yè)務(wù)帶來的改變毋庸置疑,而在搜索之外,一場云計算行業(yè)的“AI浪潮”,也正在醞釀當中。
需要了解到,百度整體劃分為三條核心業(yè)務(wù)線,一是成熟的移動生態(tài)業(yè)務(wù),二是快速發(fā)展的智能云業(yè)務(wù),三是未來硬科技的智能駕駛業(yè)務(wù)。當下,智能云已經(jīng)成為百度的第二增長曲線。
今年1月5日,IDC發(fā)布《2022 H1中國AI云服務(wù)市場研究報告》,數(shù)據(jù)顯示,AI公有云服務(wù)廠商市場格局相對穩(wěn)定,2022上半年百度智能云仍然穩(wěn)居第一,整體市場份額占比28.1%,這也是百度智能云連續(xù)四年市場份額第一。
從這方面來看,憑借智能云“云智一體”的獨特競爭優(yōu)勢,百度將幫助企業(yè)實現(xiàn)云和AI技術(shù)與業(yè)務(wù)實踐的結(jié)合,為企業(yè)實現(xiàn)全場景的解決方案,加速企業(yè)數(shù)字化轉(zhuǎn)型、產(chǎn)業(yè)智能化升級進程。
眼下,在ChatGPT爆火后,微軟宣布Azure OpenAI服務(wù)全面上市,通過該服務(wù)可以訪問OpenAI開發(fā)的AI模型。目前,已經(jīng)使用該服務(wù)的客戶有半導(dǎo)電視臺、畢馬威、RPA廠商Moveworks等等。
對于微軟而言,自2017年轉(zhuǎn)變戰(zhàn)略,由“移動為先,云為先”轉(zhuǎn)向“智能云、智能邊緣計算”,為AI、云計算、數(shù)據(jù)等領(lǐng)域服務(wù),AI已經(jīng)成為微軟贏得下一時代的重要棋子,也是此次從ChatGPT受益的前提。
而百度也可將文心一言通過百度智能云提供給企業(yè)和機構(gòu)客戶,在同一思路下,文心一言將作為云業(yè)務(wù)的一部分,為百度智能云贏下更多的市場空間。
如同百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖所述,文心一言是基于百度智能云技術(shù)打造出來的大模型,它將根本性地改變云市場的游戲規(guī)則,云服務(wù)將從數(shù)字時代躍遷到智能時代。
這里其實還有一筆“隱藏收入”?紤]國內(nèi)生成式AI的創(chuàng)業(yè)潮攀升,算力需求將成為擺在面前的一大問題。對此,根據(jù)投資機構(gòu)A16Z最新推測,生成式AI市場里的大量資金,其實最終流向了基礎(chǔ)設(shè)施公司。
A16Z估計,應(yīng)用程序公司平均將約20%-40%的年收入,用于推理和定制化的微調(diào)。這部分通常直接支付給云服務(wù)提供商以獲取實例,或支付給第三方模型提供商,后者將大約一半的收入投入于云基礎(chǔ)設(shè)施。
除此之外,訓(xùn)練著自有模型的初創(chuàng)公司們,已經(jīng)籌集了數(shù)十億美元的風(fēng)險投資,其中大部分(早期階段高達80%-90%)通常也花在云服務(wù)提供商身上。
據(jù)此,有理由推測,生成式AI總營收的10%-20%將流向云服務(wù)提供商。百度作為在AI領(lǐng)域最有話語權(quán)的國內(nèi)云廠商,無疑是生成式AI初創(chuàng)公司的最佳選擇。
總體而言,伴隨大模型、AIGC為代表的AI應(yīng)用不斷成為行業(yè)熱議話題,AI原生時代正在加速到來。而早期就選擇在智能云方向深耕的百度,理所當然成為國內(nèi)最為受益的云廠商。03借由文心一言,重讀百度
眼下,國內(nèi)眾多科技企業(yè)紛紛開啟軍備競賽,一個問題也隨之被拋出,誰能在大語言模型的競爭中搶占先機?從這個角度來看,已經(jīng)有超過20年發(fā)展歷史、最鮮明的標簽始終是AI的百度,無疑是“無冕之王”。
早在2010年,百度開始探索AI技術(shù),成為中國最早布局AI技術(shù)的巨頭企業(yè)。在這十年中,百度在AI技術(shù)研發(fā)上的投入早已超過1000億元,幾乎構(gòu)成了百度過去十年的主旋律。
從本次財報中也能看到,2022全年,百度核心研發(fā)費用達到214.16億元,占百度核心收入比例達22.4%。過去十年,百度的年研發(fā)投入占營收比例均超過15%。
持續(xù)高強度研發(fā)投入,使百度的AI 技術(shù)全面領(lǐng)先。根據(jù)《2022 年百度人工智能專利白皮書》,截至2021年底,百度全球人工智能專利申請超2.2萬件,其中中國專利申請量超1.6萬件,授權(quán)專利超4600件。
去年12月27日,百度智能云發(fā)布國內(nèi)首個全棧自研的AI基礎(chǔ)設(shè)施“AI大底座”,并全面升級25項產(chǎn)品和技術(shù)。簡單來說,AI原生時代,百度把芯片、大模型、深度學(xué)習(xí)框架等高門檻的技術(shù),變成像水電一樣供客戶按需取用。
聚焦到開發(fā)大語言模型需要的技術(shù)上。人工智能的快速發(fā)展依賴于三個核心要素:數(shù)據(jù),算法,算力,在這三項上,百度在芯片層、框架層、模型層和應(yīng)用層進行全方位布局,具備堅實技術(shù)底座。
數(shù)據(jù)層面,大語言模型訓(xùn)練使用主要來自互聯(lián)網(wǎng)的文本數(shù)據(jù)庫,而百度的搜索業(yè)務(wù)在真實數(shù)據(jù)和用戶需求理解方面積累有先發(fā)優(yōu)勢,這些大規(guī)模結(jié)構(gòu)化非結(jié)構(gòu)化數(shù)據(jù)有望支撐文心一言的充分預(yù)訓(xùn)練。
算力、算法層面,百度自研AI芯片昆侖,可為不同場景中的AI應(yīng)用提供多元化、高性能、彈性易運維的算力服務(wù)。此外,百度擁有多個云計算可用區(qū)、龐大的超算集群,奠定大模型訓(xùn)練的基礎(chǔ)設(shè)施。
再結(jié)合與GPT3大模型對標的百度文心大模型——2021年發(fā)布的“鵬城-百度·文心”(ERNIE 3.0 Titan)參數(shù)規(guī)模已達到2600億,是目前全球最大的中文單體模型。
從這幾方面來看,得益于四層技術(shù)棧,在大語言模型相關(guān)技術(shù)的科技競賽中,百度在中國乃至全球范圍均具有綜合優(yōu)勢。
據(jù)了解,目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險、汽車、企業(yè)軟件等行業(yè)的近300家頭部企業(yè)宣布加入百度文心一言生態(tài),百度的AIGC生態(tài)圈已初具雛形并即將快速拓展。
隨著文心一言商業(yè)生態(tài)的逐漸成熟,后續(xù)對百度業(yè)務(wù)(搜索、云業(yè)務(wù))帶來的賦能,勢必將引發(fā)行業(yè)“重讀”寄身于AI信仰的百度。
原文標題 : 重讀百度:文心一言意味著什么?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設(shè)計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容