云+AI治標(biāo)不治本,產(chǎn)業(yè)需要“一云多芯”的AI原生云
過去一年的云計算市場,冷熱交織。價格戰(zhàn)、“下云潮”,以及越來越單向度的內(nèi)卷等因素下,云計算遭遇全球IT疲軟,而AIGC領(lǐng)域卻是另一番景象。
規(guī)模化的云廠商均將AI作為拉動業(yè)務(wù)的馬車,只是諸多嘗試還停步在布局AI基礎(chǔ)設(shè)施與云產(chǎn)品的智能化之上。這種路徑盡管對自身業(yè)務(wù)流程的幫助不小,但在向外輸出方面卻非常匱乏,這客觀造成了產(chǎn)業(yè)智能化進程局限于點與線,無法推進到面。此外,大模型的出現(xiàn)將人類知識壓縮,云上開發(fā)的管理對象也悄然生變。
AI時代用云與云上AI開發(fā)需要一個嶄新的動能,好比正在逐步替代傳統(tǒng)內(nèi)燃機列車的高鐵一般,雖當(dāng)下的鐵路網(wǎng)絡(luò)中仍有不少普快徐徐慢行,但它們已不再是人們便捷出行的首選。
云+AI是跑在舊鐵軌的綠皮車,而AI云則是一條全新的高鐵線路。
要AI云,而非云+AI
“傳統(tǒng)的云計算系統(tǒng)依然重要,但不再是主角,我們需要一個全新的操作系統(tǒng),對新的計算平臺,也就是智能計算做好抽象和封裝,重新定義人機交互,為開發(fā)者提供更簡單、更流暢的開發(fā)體驗。”百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖近期表示。
過去一年,大模型不斷演進,已開始深度重構(gòu)人機交互。例如,隨著NLP的成熟,通過自然語言處理編程不再是無法落地的事情。事實上,由于應(yīng)用場景、技術(shù)發(fā)展、語言競爭等因素,編程早已陷入“巴別塔魔咒”之中,單常見的計算機編程語言便有C語言、C++、Java、Python、Go等等。這導(dǎo)致編程不得不面向過程與對象,而無法正視需求。
當(dāng)編程過程變?yōu)殚_發(fā)者表達愿望的過程時,整個操作系統(tǒng)的迭代便是題中之義。例如底層硬件,過去以CPU的算力為主,主要依賴低延遲、高復(fù)雜性運算,應(yīng)用于算數(shù)與邏輯運算。而誕生于圖形渲染的GPU則依賴于高吞吐量、低復(fù)雜性運算,長于處理大規(guī)模數(shù)據(jù)集。
此外,大模型的出現(xiàn)將人類知識壓縮,操作系統(tǒng)管理的對象也悄然發(fā)生了改變。
AI大模型從最初的框架構(gòu)建,逐步走到落地階段。然而,隨著AI大模型深入到千行百業(yè)中,市場開始意識到通用大模型雖然功能強大,但卻難以滿足個性化需求,導(dǎo)致服務(wù)商成為“高科技施工隊”,而用戶遇到問題處于兩眼一抹黑的極端情況。
“上云容易下云難”,過去幾年,部分行業(yè)在上云與下云之間反復(fù)橫跳。
南方某醫(yī)療機構(gòu)技術(shù)中心負責(zé)人此前提到,因為一把手都意識到上云是一種趨勢,在一次會后,便拍上云。他們先在業(yè)務(wù)量不大的分院將影像歸檔和通信系統(tǒng)上云,等到成本、應(yīng)用、維護等一系列驗證有效后再復(fù)刻到總部。然而,當(dāng)時的云上系統(tǒng)多次出現(xiàn)變慢,也曾受宕機拖累。
“我們排查不出問題,找云服務(wù)廠商、影像歸檔和通信系統(tǒng)廠商、檢查本地系統(tǒng),而且還要在院里協(xié)調(diào)各部門,簡直自找麻煩。”最終,這家醫(yī)療機構(gòu)決定下云,花錢將數(shù)據(jù)遷移回來,回到此前“膈應(yīng)”的老系統(tǒng)。
各行各業(yè)面臨的共性問題,如今似乎看到了答案。
4月16日,Create2024百度AI開發(fā)者大會期間,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布了新一代智能計算操作系統(tǒng)——萬源。
萬源主要由Kernel(內(nèi)核)、Shell(外殼)、Toolkit(工具)三層構(gòu)成。并且第一次增加了硬件和軟件以外的資源,也就是被大模型壓縮的世界知識。通過對AI原生時代的智能計算平臺進行抽象與封裝設(shè)計,為用戶屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復(fù)雜性,提升AI原生應(yīng)用開發(fā)效率與體驗。
這意味著,模型與AI原生開發(fā)的操作、算力、語言等門檻的進一步下放。更關(guān)鍵的是,百度憑此“橋接”不同開發(fā)深度的生態(tài)以及其中的不同角色,一個需求驅(qū)動的動態(tài)耦合的大系統(tǒng)就此形成。
“一云多芯”發(fā)起算力革命
每個時代都有其對應(yīng)的底層載體作支撐,工業(yè)革命的蒸汽機、發(fā)動機或是信息時代的CPU均是如此。因循此邏輯,AIGC開啟的全面智能化同樣需要必須一個核心載體作為支撐,這便是上文提到的智能計算系統(tǒng)。
值得注意的是,智能計算并非既往計算技術(shù)的替代或是簡單整合。相反,它是一種計算形式,根據(jù)任務(wù)要求系統(tǒng)地、全面地優(yōu)化現(xiàn)有的計算方法和資源來解決實際問題。
要知道,算力早在在過去一年多內(nèi)便被公認為是制約AIGC商業(yè)化與進一步發(fā)展的卡點,即使中國算力總規(guī)模位居全球第二,算力規(guī)模近5年更是年均增速近30%,算力卡脖子的焦慮依舊蔓延于行業(yè)上空——英偉達GPU一“芯”難求,而向開發(fā)者提供GPU托管服務(wù)的“算力黃牛”CoreWeave卻在短短四年內(nèi)估值增長至560億元。
為了彌合算力供需之間的溝壑,也讓算力更好用,萬源為智能計算打出的“銀彈”是百舸·AI異構(gòu)計算平臺。
在萬源的內(nèi)核層,在算力資源管理方面,百度百舸·AI異構(gòu)計算平臺針對大模型訓(xùn)練、推理等任務(wù),對智算集群的設(shè)計、調(diào)度、容錯等環(huán)節(jié)進行了專項優(yōu)化。目前,百舸能夠?qū)崿F(xiàn)萬卡集群上的模型有效訓(xùn)練時長占比超過98.8%,線性加速比、帶寬有效性分別高達95%,算力效能業(yè)界領(lǐng)先。
要知道,即使是在國內(nèi)頂尖的大模型廠商的視域內(nèi),模型有效訓(xùn)練時長占比達到90%的智算集群,大多都還局限于千卡集群。此外,百舸更關(guān)鍵的突破在于“一云多芯”在模型訓(xùn)練場景中的優(yōu)異表現(xiàn),稱得上是從根本上緩解算力焦慮。
目前,百舸能夠兼容昆侖芯、昇騰、海光DCU、英偉達、英特爾等國內(nèi)外主流AI芯片,支持用戶以最小代價完成算力適配。
過去,智算集群中的多個模型訓(xùn)練任務(wù)往往是單一廠商芯片服務(wù)于單一任務(wù),不論是不同廠商芯片算力切分、芯片間通信效率或是根本的模型訓(xùn)練效率問題,都使得算力焦慮在在硬件差異之下被無限放大。
不過,在百舸的智能調(diào)度下,不同廠商芯片在單一任務(wù)混合訓(xùn)練已經(jīng)成為現(xiàn)實,且百卡規(guī)模性能損失不超過3%,千卡規(guī)模性能損失不超過5%。百度方面表示,百舸平臺的應(yīng)用能最大程度上屏蔽硬件之間差異,幫助用戶擺脫單一芯片的依賴,實現(xiàn)更優(yōu)成本,打造更具彈性的供應(yīng)鏈體系。
面對業(yè)內(nèi)領(lǐng)先的重大突破,百度內(nèi)部狂喜的同時也有些無奈。“以這么小的性能損耗完成混合多種芯片的單任務(wù)訓(xùn)練,業(yè)界基本沒有廠商能做到,甚至我們的一些用戶都不敢相信這是真的”。
當(dāng)硬件差異在計算調(diào)度層面被盡可能抹平后,模型訓(xùn)練的成本與使用門檻也將隨之降低,甚至直擊算力需求與供給的錯配也未嘗不可。在硬件設(shè)施未有根本性變化的情況下,百度的底層技術(shù)打響了智能算力革命的發(fā)令槍。
授人以漁,重塑開發(fā)生態(tài)
借由對智能的管理能力,萬源得以成為百度“橋接”算力效能與應(yīng)用創(chuàng)新的橋梁,Kernel(內(nèi)核)、Shell(外殼)、ToolKit(工具)三層高效互聯(lián)起來,并形成了端到端的效能優(yōu)化閉環(huán)。
內(nèi)核層除了百舸·AI異構(gòu)計算平臺之外,還包含不同規(guī)格文心模型和第三方模型,外殼層是解決模型的管理、調(diào)度與二次開發(fā)ModelBuilder,而工具層則是具體應(yīng)用的開發(fā)平臺即AgentBuilder、AppBuilder。
行業(yè)視域下,大多模型服務(wù)商均在2024年前后推出了觸達C端的開發(fā)工具,面向C端用戶的封裝應(yīng)用、面向開發(fā)者的AI原生開發(fā)工具以及企業(yè)側(cè)的精細定制化MaaS不一而足。百度根據(jù)基礎(chǔ)設(shè)施、模型和AI原生應(yīng)用構(gòu)建三種不同開發(fā)深度而設(shè)計的分層于業(yè)內(nèi)并非鮮見。
但難能可貴的是,百度通過萬源,更進一步地將相互隔離的小體系整合成為一個大的體系。閉環(huán)之內(nèi),用戶、開發(fā)者與企業(yè)側(cè)三種角色都能共享生態(tài)內(nèi)的計算資源與模型能力來進行高效開發(fā)。
用戶或開發(fā)者可以通過自然語言的形式,以極少的計算資源進行有針對性的智能體等AI原生應(yīng)用開發(fā)。例如,百度CEO李彥宏在大會上演示的“新加坡旅游局”智能體,只需在直接生成的基礎(chǔ)智能體之上添加知識庫內(nèi)容,即可在數(shù)分鐘內(nèi)打造一個經(jīng)驗豐富的專屬“背包客”。
正如沈抖所言,“隨著大模型技術(shù)的不斷演進,通過自然語言進行編程正在成為現(xiàn)實。編程將不再面向過程或者面向?qū)ο,而是面向需?rdquo;。百度以萬源為基底,向業(yè)界提供了一個達到“編輯器”級別的開發(fā)工具與分發(fā)平臺,帶動AI原生應(yīng)用進入下一階段。
端云協(xié)同的飛輪
一個開發(fā)生態(tài)的初步完善僅是開啟下一個想象空間的第一步,我們需要尋找的還有展現(xiàn)開發(fā)價值的載體。
對于開啟智能手機時代的“iPhone時刻”而言,第一個展現(xiàn)巨大價值的載體是以《憤怒的小鳥》為代表的移動游戲;于AIGC而言,AI原生開發(fā)側(cè)的價值落地在于端側(cè)與端云協(xié)同。
僅需粗略掃視而今的手機行業(yè),足見智能手機+AI已然成為各大手機廠商的核心戰(zhàn)略。IDC預(yù)計2024年全球新一代 AI 手機的出貨量將超過1.7億部,約占智能手機整體出貨量的15%,Counterpoint預(yù)計2027年出貨量達到5.22億部,滲透率達到40%。
另一方面,AI的能力觸達同樣需要一個距離用戶最近的載體,無論是個人數(shù)據(jù)的安全讀取還是進一步對人類行為、指令等進行分析、梳理,手機都無疑是當(dāng)下的絕佳選擇。
事實上,百度早在本次大會前便錨定了萬源系統(tǒng)的價值實現(xiàn)標(biāo)的。2024年1月10日,在榮耀MagicOS 8.0發(fā)布會及開發(fā)者大會上,榮耀終端有限公司CEO趙明宣布了“百模生態(tài)計劃”,并與百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖共同宣布,百度智能云成為榮耀大模型生態(tài)戰(zhàn)略合作伙伴。
早在2017年11月,榮耀便發(fā)布了搭載AI應(yīng)用與麒麟970處理器的榮耀view10,在彼時尚未成型的AI手機賽道初露崢嶸,近期更是掏出100億真金白銀與2000余項相關(guān)專利,宣告其發(fā)力端側(cè)AI的堅定決心。更重要的是,榮耀還是智能手機賽道的頭部玩家,據(jù)IDC數(shù)據(jù),去年第四季度榮耀以16.8%份額占比,排名安卓陣營第一。
以此前披露的合作細節(jié)來看,有別于行業(yè)普遍的拍照、實時通話翻譯、智能搜索等簡單升級,兩者是通過MagicOS來展開端云協(xié)同的范式創(chuàng)新——由端側(cè)的榮耀魔法大模型負責(zé)理解用戶意圖,在后臺將用戶的簡單提示轉(zhuǎn)化為更專業(yè)的提示,再由云上的文心大模型提供知識問答、生活建議等專業(yè)服務(wù)。
例如日常助理需求中的“幫我安排日程表”或“幫我設(shè)定運動規(guī)劃”,魔法大模型會分析用戶的出行、健康等使用數(shù)據(jù),生成初步提示詞,以此調(diào)度文心大模型來生成足夠全面的規(guī)劃。在此過程中,魔法大模型將通過端側(cè)防護網(wǎng),濾掉敏感信息并確保個人隱私不上云,來解決用戶對個人數(shù)據(jù)的隱憂。
然而這僅是AI在這個端云協(xié)同范式下的初步應(yīng)用,更進一步的是依據(jù)用戶自行上傳的端側(cè)數(shù)據(jù)而形成的個人知識庫,以極短的鏈路提高勞動生產(chǎn)率并延伸腦力的可觸達空間。
在安全性、可解釋性、易用性等綜合指標(biāo)早已成為AI軍備競賽關(guān)鍵的當(dāng)下,打開大模型的黑箱從而觸達公眾認知,無疑是大模型進入“創(chuàng)新擴散”下一周期的勝負手。開發(fā)者視角下的黑箱在于算法和訓(xùn)練過程,對于用戶而言,不可見的黑箱則是模型能力的易用性與普適性。
面對不同角色的“開箱”需求,客制化產(chǎn)品不斷涌現(xiàn)。然而唯有百度率先向底層進軍,通過智能計算能力大幅降低開發(fā)門檻,將相對隔離的不同開發(fā)與反饋體系融為一體。體系的率先建立往往意味著商業(yè)壁壘,尤其是對于to B賽道而言。
AI與云的深度融合,端云協(xié)同的深度耦合下,我們亦看到了李彥宏在內(nèi)部講話中堅持閉源路線的底氣所在。“搶灘”智能計算的百度再次在AI軍備競賽中保持了身位的領(lǐng)先。
原文標(biāo)題 : 云+AI治標(biāo)不治本,產(chǎn)業(yè)需要“一云多芯”的AI原生云
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設(shè)計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容