2023WAIC大會后記:我們距離AGI還有多遠(yuǎn)?
只有解決了算力問題,才能離大模型的商業(yè)化之路更進(jìn)一步,等等問題,都在成為當(dāng)下限制我們想象力的關(guān)鍵因素。繼2023世界人工智能大會后,大模型還有多少想象力?
作者|思杭
編輯|皮爺
出品|產(chǎn)業(yè)家
1億用戶,似乎是每個App都想踏過的“門檻”。TikTok用時九個月,ChatGPT用時兩個月,而被稱之為“Twitter Killer”(推特殺手)的Threads僅用不到五天的時間,就達(dá)到用戶量破1億的水平。
Threads的定位是基于Instagram上的對話App。也就是說,Instagram的用戶可以用賬號注冊Threads,并且他們在Ins關(guān)注的人也都會轉(zhuǎn)移到Threads上。這也是為什么,擁有了聊天功能的Threads,也號稱復(fù)刻版推特,或推特殺手。自此,人工智能領(lǐng)域?qū)⒄归_馬斯克與扎克伯格的新一輪“角斗”。
這些都在成為7月6~8日的本屆世界人工智能大會的最新背景板。
2023上半年,人工智能的發(fā)展似乎到達(dá)了一個臨界點,世界人工智能大會上呈現(xiàn)出的所有AI產(chǎn)物也僅是冰山一角。
根據(jù)不完全統(tǒng)計,目前國內(nèi)發(fā)布的大模型數(shù)量已過百,但更多集中在C端,針對B端的行業(yè)大模型仍在少數(shù)。大語言模型的產(chǎn)業(yè)商業(yè)化之路還很遙遠(yuǎn)。
不免思考的一個問題是:我們距離AGI的路到底還有多遠(yuǎn)?
在本屆WAIC大會上亮相了30多款大模型產(chǎn)品,在這其中,不僅有百度、阿里、騰訊為首的互聯(lián)網(wǎng)廠商陣營,還有以云知聲、瀾舟科技、商湯科技為首的AI企業(yè)陣營,更有以中國電信、中國聯(lián)通為首的運營商陣營,以及以清華大學(xué)、復(fù)旦大學(xué)為首的學(xué)術(shù)陣營。
透過它們的動作,我們試圖丈量我們和AI終點的距離。
【以下為產(chǎn)業(yè)家于WAIC現(xiàn)場紀(jì)實】
清華
大模型在算力、準(zhǔn)確性、時效性和隱私保護(hù)方面還存在瓶頸。
在算力方面,如何降低耗能、提高效率是大模型面臨的關(guān)鍵問題,它直接決定著大模型未來是否能達(dá)到商用水平。如果用在垂直行業(yè),會需要更精準(zhǔn)的模型,這要求大模型要有低延時、高安全,并且提供精準(zhǔn)信息的能力。然而,目前大模型不僅十分消耗算力,用于專業(yè)領(lǐng)域還存在幻覺問題。
針對該問題,清華大學(xué)智能產(chǎn)業(yè)研究院張亞勤院長在2023世界人工智能大會(WAIC)上發(fā)表演講,“AI發(fā)展需要人才、數(shù)據(jù)、算法、算力四個方面的支撐,其中算力會是最大的挑戰(zhàn)。目前GPU市場由英偉達(dá)主導(dǎo),很多其他公司雖然也在做,但仍然不能滿足大模型發(fā)展的需求。在這一點上,需求是創(chuàng)新的源泉,如果未來算力成為了關(guān)鍵“卡脖子”因素,那我們就需要尋找新的模型和算法,或者新的計算平臺,以降低計算成本并提高效率。”
百度
百度CTO及應(yīng)用國家工程研究中心主任王海峰在會上對文心大模型3.5版核心技術(shù)進(jìn)行了全面解讀,并結(jié)合百度發(fā)布的飛槳生態(tài),闡述了人工智能產(chǎn)業(yè)模式。
在王海峰的介紹中,文心大模型3.5有三大技術(shù)創(chuàng)新。
一是對先進(jìn)生產(chǎn)力的期待,文心大模型3.5在模型效果、安全性和邏輯推理均有提升;二是對行業(yè)專家的期待,通過“精調(diào)”+“知識點增強(qiáng)”兩大技術(shù)創(chuàng)新,新版本讓大模型具備行業(yè)專家一樣的專精能力;三是對豐富應(yīng)用的期待,比如通過插件機(jī)制擴(kuò)展大模型的能力邊界。未來,文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件,幫助開發(fā)者基于文心大模型打造自己的應(yīng)用。
王海峰在致辭中提出,大模型的產(chǎn)業(yè)模式將是“類臺積電”模式。“以臺積電、三星等企業(yè)為例,芯片制造工藝有很高的技術(shù)壁壘、價格高昂的產(chǎn)線,能夠根據(jù)客戶需求,標(biāo)準(zhǔn)化、自動化地大批量生產(chǎn)芯片,形成規(guī)模經(jīng)濟(jì)。同理,大模型生產(chǎn)企業(yè)在大模型能力、海量數(shù)據(jù)、大規(guī)模算力等方面具有優(yōu)勢,能夠根據(jù)AI應(yīng)用方的需求,自動化、標(biāo)準(zhǔn)化地進(jìn)行多場景多領(lǐng)域的模型生產(chǎn),當(dāng)達(dá)到一定規(guī)模時,即可形成健康、可持續(xù)發(fā)展的大模型產(chǎn)業(yè)模式。”
大模型的“類臺積電”產(chǎn)業(yè)模式,已經(jīng)在百度的大模型實踐中得到驗證。百度研制了文心產(chǎn)業(yè)級知識增強(qiáng)大模型系列,其背后又有飛槳的有力支撐。飛槳將集核心框架、產(chǎn)業(yè)級模型庫、開發(fā)套件和工具組件,以及學(xué)習(xí)和實訓(xùn)社區(qū)于一體,標(biāo)準(zhǔn)化、自動化地支撐大模型生產(chǎn)和應(yīng)用。
阿里
其次,阿里云作為業(yè)內(nèi)最早布局大模型的科技公司之一,在本次的WAIC大會上邁出了多模態(tài)能力的關(guān)鍵一步。繼通義千問之后,阿里云宣布AI繪畫創(chuàng)作大模型通義萬相開啟定向邀測,該模型可輔助人類進(jìn)行圖片創(chuàng)作,未來可應(yīng)用于藝術(shù)設(shè)計、電商、游戲和文創(chuàng)等應(yīng)用場景。目前,該能力將逐步向行業(yè)客戶開放。
阿里云智能集團(tuán)CTO周靖人對于多模態(tài)的理解是,“多模態(tài)是大模型演進(jìn)的必然路徑,我們希望用不同模態(tài)的能力服務(wù)千行百業(yè),幫助企業(yè)全面擁抱智能化時代。”
此外,阿里云在本次WAIC大會上的另一個靶點是,通過「魔搭社區(qū)」,為大模型創(chuàng)業(yè)公司提供全方位的服務(wù),從而搭建一個“大模型自由市場”。
周靖人表示,“在魔搭這個自由市場,所有模型生產(chǎn)者都可上傳模型,驗證模型的技術(shù)能力,探索模型的應(yīng)用場景和商業(yè)化模式。而阿里云將提供智能算力和開發(fā)工具,并在資金和商業(yè)化探索方面提供充分支持。”
在本屆世界人工智能大會上,一個值得關(guān)注的重點是行業(yè)大模型的發(fā)布。此前,大模型都是主要集中在C端的通用大模型,因此在本屆WAIC大會上幾家行業(yè)大模型的亮相備受矚目。
騰訊
會上,騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生對于行業(yè)大模型發(fā)表了看法,“通用大模型有很強(qiáng)的能力,但并不能解決很多企業(yè)的具體問題。企業(yè)的大模型應(yīng)用需要綜合考慮行業(yè)專業(yè)性、數(shù)據(jù)安全、持續(xù)迭代和綜合成本等因素;谛袠I(yè)大模型,構(gòu)建自己的專屬模型,也許是企業(yè)更優(yōu)的選項。”
在數(shù)據(jù)精準(zhǔn)性和隱私安全問題上,企業(yè)可以基于行業(yè)大模型,再加上自身數(shù)據(jù)進(jìn)行精調(diào),從而構(gòu)建專屬模型。這樣打造出的模型參數(shù)比通用大模型少,訓(xùn)練和推理的成本更低,模型優(yōu)化也更容易;另外,行業(yè)大模型和模型開發(fā)工具,也可以通過私有化部署、權(quán)限管控和數(shù)據(jù)加密等方式,防止模型訓(xùn)練和使用帶來企業(yè)敏感數(shù)據(jù)的外泄。
另外,騰訊云智能和騰訊優(yōu)圖實驗室在現(xiàn)場重點展示了小樣本數(shù)智人、刷掌支付、騰訊同傳等互動體驗項目。比如小樣本數(shù)智人依托于騰訊自研AI能力,只需要3分鐘真人口播視頻、100句語音素材,平臺便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實時建模并生成高清人像,在24小時內(nèi)制作出與真人近似的“數(shù)智人”。
在作曲方面,騰訊實驗室拿出了自研的XMusic通用作曲框架,被稱之為本屆世界人工智能大會的“鎮(zhèn)館之寶”。該XMusic生成式通用作曲框架使基于AIGC技術(shù),支持視頻、圖片、文字、標(biāo)簽、哼唱等多模態(tài)內(nèi)容,作為輸入提示詞,生成情緒、曲風(fēng)、節(jié)奏可控的高質(zhì)量音樂。
華為
關(guān)于行業(yè)大模型產(chǎn)品,在本屆大會的另一個重磅發(fā)布則是華為的盤古大模型3.0。
華為以“不作詩,只做事”為口號,推出了以B端市場作為目標(biāo)的大模型產(chǎn)品。
此前,在國內(nèi)互聯(lián)網(wǎng)企業(yè)熱衷于“百模大戰(zhàn)”之時,華為并沒有戀戰(zhàn),而是相繼發(fā)布科學(xué)計算大模型、藥物分子大模型、盤古礦山大模型和氣象大模型。其中,盤古氣象大模型的研究成果還在《Nature》正刊上正式發(fā)表。
在《Nature》期刊上,華為云盤古大模型團(tuán)隊基于三維神經(jīng)網(wǎng)絡(luò)的氣象預(yù)報系統(tǒng)精度,研發(fā)出高分辨率全球AI氣象預(yù)報系統(tǒng),這種方法超過傳統(tǒng)數(shù)值預(yù)報方法,且速度提高了1萬倍以上。而就在2022年末,國際氣象領(lǐng)域的專家教授們還普遍認(rèn)為,AI要達(dá)到傳統(tǒng)數(shù)值方法的精度,是一件非常遙遠(yuǎn)的事。
華為常務(wù)董事、華為云CEO張平安在發(fā)布大模型時透露,目前,“盤古大模型已在金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等諸多行業(yè)發(fā)揮巨大價值。”
中國電信
此外,中國電信也針對政務(wù)、司法、教育、醫(yī)療和通信等垂直行業(yè)推出領(lǐng)域大模型TeleChat。在發(fā)布會現(xiàn)場,中國電信展示了大模型賦能數(shù)據(jù)中臺、智能客服和智慧政務(wù)三個方向的產(chǎn)品。
中國電信數(shù)字智能科技分公司何忠江副總經(jīng)理針對大模型與行業(yè)融合,并解決幻覺問題做了闡釋。
首先,大模型為什么會出現(xiàn)幻覺?實際上,大模型生成的詞句是依據(jù)概率逐字推理的方式得出,而這種概率矩陣的方式必定會出現(xiàn)幻覺問題。對此,中國電信在設(shè)計大模型的過程中,用一定技術(shù)改善了概率矩陣出現(xiàn)的幻覺問題。另外,將行業(yè)知識與大模型融合,從而增強(qiáng)大模型的預(yù)訓(xùn)練和推理能力。
可以說,在消除幻覺問題方面,電信TeleChat大模型做出了先人一步的創(chuàng)新。
京東
在AGI時代浪潮席卷而來的當(dāng)下,多家廠商都表示,大模型的下一步是走向多模態(tài)。7月13日,京東重磅發(fā)布了言犀大模型。自此,百模大戰(zhàn)又添一員。從發(fā)布會現(xiàn)場來看,京東的言犀大模型更注重產(chǎn)業(yè)側(cè),“從產(chǎn)業(yè)中來,到產(chǎn)業(yè)中去”也是京東對外宣傳的一句標(biāo)語。
京東憑借多年來在供應(yīng)鏈側(cè)沉淀的數(shù)據(jù)信息,將言犀大模型的定位置于供應(yīng)鏈端。“只有將供應(yīng)鏈做透,才能將大模型做實。”京東集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬表示,數(shù)智供應(yīng)鏈,是大模型走向產(chǎn)業(yè)應(yīng)用的著力點,大模型要以數(shù)智供應(yīng)鏈為抓手,走向產(chǎn)業(yè),深入實體。
京東為了給大模型注入產(chǎn)業(yè)能力,輸入了大量的專業(yè)數(shù)據(jù),其中包含70%的通用數(shù)據(jù)和30%的數(shù)智供應(yīng)鏈原生數(shù)據(jù)。這些數(shù)據(jù)的背后,是京東為大模型提供的巨型訓(xùn)練場。發(fā)布會現(xiàn)場,京東CEO許冉表示,“大模型真正實現(xiàn)自己的價值,一定是在產(chǎn)業(yè)應(yīng)用中。”
網(wǎng)易
在本屆WAIC大會上,網(wǎng)易也攜多款A(yù)I大模型落地產(chǎn)品進(jìn)行展出。在工業(yè)、教育、游戲、音樂和元宇宙領(lǐng)域,網(wǎng)易都推出了不同行業(yè)的大模型,應(yīng)用到各大場景。
比如在工業(yè)領(lǐng)域,網(wǎng)易伏羲基于AOP理論思想及自研工業(yè)大模型,推出國內(nèi)首臺無人裝載機(jī)器人和挖掘機(jī)器人,參與到礦山、鐵路等一線場景的建設(shè);在教育領(lǐng)域,網(wǎng)易自研的國內(nèi)首個教育大模型“子曰”最新應(yīng)用成果——虛擬人口語教練首次亮相。
在此前網(wǎng)易發(fā)布一季度財報的電話會上,網(wǎng)易CEO丁磊對于大模型也發(fā)表了自己的看法,“在AI大模型競賽中,真正的勝者是能選擇好應(yīng)用場景的企業(yè)。”
從網(wǎng)易一季度財報來看,在AI大模型等自研關(guān)鍵技術(shù)投入上,研發(fā)投入37億元,占總營收比重達(dá)15%。而且目前,網(wǎng)易自研AI技術(shù)已應(yīng)用于游戲工業(yè)化全流程,AI技術(shù)對關(guān)鍵環(huán)節(jié)的工作效率提升達(dá)90%。
在國內(nèi)大模型的隊伍中,科大訊飛的星火大模型從效率和精度的角度看都數(shù)一數(shù)二。在世界人工智能大會上,科大訊飛展示了星火大模型在教育、辦公、汽車、醫(yī)療、工業(yè)等領(lǐng)域的應(yīng)用。
另外,科大訊飛高級副總裁、認(rèn)知智能全國重點實驗室主任胡國平還公布了訊飛與華為的合作。訊飛星火與昇騰AI聯(lián)合,全力打造通用智能新底座。“國產(chǎn)大模型只有基于中國自主創(chuàng)新的算力底座才有大未來”,胡國平表示。
在大模型加速迭代趕超的背后,是不容忽視的算力挑戰(zhàn)。而訊飛與華為的合作意圖,正是讓國產(chǎn)大模型可以架構(gòu)在自主創(chuàng)新的軟硬件基礎(chǔ)上,打破算力瓶頸。
中國移動
在央企大模型的隊伍中,除了中國電信的TeleChat大模型,中國移動針對政務(wù)和客服,也正式發(fā)布大模型:九天·海算政務(wù)大模型和九天·客服大模型。
中國移動的九天大模型首創(chuàng)了“政務(wù)大模型-信息場-應(yīng)用”端到端政務(wù)服務(wù)體系,一網(wǎng)通辦的服務(wù)理念將被更加安全、高效地體現(xiàn)在群眾的辦事體驗中。比如對于政府工作人員,通過大模型和信息場的聯(lián)動,直接用自然語言與數(shù)據(jù)庫中的海量政務(wù)數(shù)據(jù)表和運營分析指令交互,串聯(lián)多來源、復(fù)雜異構(gòu)的數(shù)據(jù)表,快速獲取數(shù)據(jù)分析結(jié)果。
商湯
在AI企業(yè)的大模型陣營中,商湯科技也在會上推出 “商湯日日新SenseNova”大模型體系的多方位全面升級,以及在該體系下的一系列大模型產(chǎn)品更新和落地成果。
此外,商湯也著重介紹并展示了其大模型技術(shù)自正式發(fā)布以來與產(chǎn)業(yè)各方的應(yīng)用實踐,包括商湯絕影最新打造的智能座艙產(chǎn)品和車路云協(xié)同交通體系等,以及在金融、醫(yī)療、電商、移動終端、產(chǎn)業(yè)園區(qū)等行業(yè)生產(chǎn)實踐中的落地應(yīng)用。
作為千億級參數(shù)的自然語言處理模型,商湯商量SenseChat 2.0版本突破了大語言模型輸入長度的限制,并推出不同參數(shù)量級的模型版本。
商湯科技董事長兼CEO徐立在產(chǎn)品發(fā)布環(huán)節(jié)中講到:“商湯希望通過‘大模型+大裝置’持續(xù)推動AI基礎(chǔ)設(shè)施能力的躍進(jìn)提升,不僅打造通用能力更加強(qiáng)大的基礎(chǔ)模型,也進(jìn)一步高效融合不同垂直領(lǐng)域的專業(yè)知識,構(gòu)建專業(yè)大模型,從根本上降低大模型的下游應(yīng)用成本和門檻。”
容聯(lián)云
在大會上,智能通訊SaaS企業(yè)容聯(lián)云也發(fā)布了大語言模型“赤兔大模型”,面向企業(yè)應(yīng)用的多個垂直行業(yè)。另外,為推動企業(yè)營銷和服務(wù)數(shù)智化轉(zhuǎn)型,容聯(lián)云還發(fā)布“生成式智能營銷服一體化工作空間——機(jī)器貓”和“生成式一體化智能客服平臺”。
據(jù)了解,赤兔大模型是容聯(lián)云面向企業(yè)應(yīng)用的垂直行業(yè)多層次大語言模型,通過重構(gòu)智能客服和數(shù)智化營銷價值,賦能溝通智能2.0時代。基于“赤兔大模型”,企業(yè)可以搭建自己的智能客服和數(shù)智化營銷,完成從“降本增效”到“價值創(chuàng)造”的進(jìn)化。
在7月12日的“東風(fēng)生萬物”發(fā)布會上,思必馳也帶來了DFM-2大模型以及最新創(chuàng)新技術(shù)應(yīng)用成果。據(jù)了解,思必馳本次推出的DFM-2大模型,一大特點在于將對話式人工智能與大模型相結(jié)合。思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱曾公開表示,“對話式語言計算大模型為核心的大模型體系是未來。”
“短期來看,關(guān)于需要基于一定背景知識的創(chuàng)作型產(chǎn)業(yè),以及一切剛需AIGC的場景、重視SOP(標(biāo)準(zhǔn)作業(yè)程序)的行業(yè),能夠快速突破。比如智能寫作、文檔管理、代碼生成、流程管理、甚至游戲NPC等。長遠(yuǎn)來看,搜索引擎和基于搜索的相關(guān)產(chǎn)業(yè),有可能被顛覆。”——財聯(lián)社安安訪談錄《思必馳聯(lián)合創(chuàng)始人俞凱:ChatGPT是繼Alpha Go之后最大的里程碑》
美團(tuán)
在2023WAIC大會上,除了各大企業(yè)的大模型產(chǎn)品,還有其他領(lǐng)域的AI技術(shù)展示,如美團(tuán)“無人機(jī)”、騰訊云智能的刷掌支付和騰訊同傳。
在大會上,美團(tuán)展示外賣如何“從天而降”:美團(tuán)無人機(jī)對外發(fā)布第四代新機(jī)型,該機(jī)型研發(fā)歷時兩年多,是專注于城市低空物流配送場景的全新多旋翼機(jī)型。
新機(jī)型升級了環(huán)境適應(yīng)能力,可在“零下20度至50度”的中雨、中雪、6級風(fēng)、夜晚等環(huán)境中穩(wěn)定飛行,能夠適應(yīng)97%以上國內(nèi)城市的自然環(huán)境要求。
美團(tuán)高級副總裁、到家事業(yè)群總裁王莆中表示,近兩年,越來越多的用戶傾向于“線上買一切”,且對配送時效的要求愈發(fā)嚴(yán)格,通過搭建空地一體的立體化城市配送網(wǎng)絡(luò),美團(tuán)可以為消費者提供更好的服務(wù)體驗。
本屆的世界人工智能大會尤其熱鬧,從大模型到現(xiàn)場“逗狗”,從無人機(jī)發(fā)布到馬斯克腦機(jī)接口,都在說明,人工智能的發(fā)展正在邁向一個新的階段。
然而在這個新階段,無論國內(nèi)外,都正在受到不同層面的約束。比如國內(nèi)外大模型的“團(tuán)戰(zhàn)”受算力影響尤為嚴(yán)重。具體來講,研發(fā)和使用大模型都需要耗費GPU卡。而目前,GPU卡的費用不斷上升。找到能夠降低算力損耗的算法是當(dāng)務(wù)之急,只有解決了算力問題,才能離大模型的商業(yè)化之路更進(jìn)一步,等等問題,都在成為當(dāng)下限制我們想象力的關(guān)鍵因素。
不難看出,盡管如今各家都發(fā)布了大模型產(chǎn)品,但真正聚焦到產(chǎn)業(yè)、聚焦到工程落地的產(chǎn)品并不多,在接下來的一年里這也將成為新的大模型衡量標(biāo)準(zhǔn)。
我們常說的一句話是,“我們總是高估的當(dāng)下1年的變化,總是低估了未來10年的變化。”在AGI注定要奔涌而來的如今,期待大模型能盡快成為中國產(chǎn)業(yè)數(shù)字化浪潮的新密碼。
原文標(biāo)題 : 2023WAIC大會后記:我們距離AGI還有多遠(yuǎn)?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設(shè)計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容