訂閱
糾錯(cuò)
加入自媒體

縱覽2023世界人工智能大會(huì)

文|劉雨琦,編|王一粟

身處大模型的浪潮之中,AI的熱度一波接著一波。

7月6日,2023年世界人工智能大會(huì)在上海召開,一度沖上了微博熱搜榜。在5萬平方米的會(huì)場(chǎng)中,400多家企業(yè)的展臺(tái)員工都在不遺余力地講解著自家新產(chǎn)品,參會(huì)的人們不斷穿梭其中,“腳都走麻了,但心情還是很澎湃。”有觀眾說道。

在現(xiàn)場(chǎng),光錐智能發(fā)現(xiàn)大會(huì)的展臺(tái)均是按行業(yè)部署,軟件、硬件、芯片“一家人整整齊齊”的排列著。阿里、百度、騰訊三連座,無異于同臺(tái)競(jìng)技,而觀眾們能在5分鐘之內(nèi)縱覽全國最新大模型,邊看邊對(duì)比。 

作為國內(nèi)最大的AI盛會(huì),此次與往屆不同的是,通用人工智能的曙光似乎就在咫尺之間,群雄逐鹿的戰(zhàn)意感染了每一個(gè)見證者。

特斯拉創(chuàng)始人、CEO埃隆·馬斯克連線開場(chǎng),圖靈獎(jiǎng)得主、中國科學(xué)院院士、上海期智研究院院長(zhǎng)姚期智主持討論此次大會(huì),不僅集齊了百度文心、阿里通義、華為盤古、訊飛星火、商湯日日新等30余個(gè)海內(nèi)外大模型,還有80余位國內(nèi)外院士,特斯拉、微軟、華為、阿里等50余位海內(nèi)外大咖,學(xué)術(shù)界與科技界正在合力推開時(shí)代厚重的大門。

最為基礎(chǔ)的大模型層,技術(shù)平臺(tái)迎來新的迭代升級(jí),如何賦能千行百業(yè),推進(jìn)產(chǎn)業(yè)落地成為新階段的探討主題。 

AI infra結(jié)構(gòu)雖然尚不成熟,但大模型的配套設(shè)施跟了上來,適應(yīng)大模型計(jì)算存儲(chǔ)的向量數(shù)據(jù)庫成為熱門賽道,保證大模型安全運(yùn)行的AI安全監(jiān)測(cè)平臺(tái)順勢(shì)而生。

應(yīng)用落地?fù)屧诹舜竽P统墒斓那懊,軟件?yīng)用滲透至各行各業(yè)場(chǎng)景,硬件端又催生了一批機(jī)器人新產(chǎn)品。

中國大模型跑出了中國速度,技術(shù)層、配套設(shè)施層、應(yīng)用層,同時(shí)在各個(gè)環(huán)節(jié)同步崛起,而不是等著底層大模型技術(shù)成熟后才慢慢跟上。一面繼續(xù)夯實(shí)地基,一面遍地開花,整艦加速前進(jìn),衍生出更多的中國大模型模式。

?大模型,兩條腿走路

從3月如雨后春筍般冒頭至今,短短4個(gè)月的時(shí)間,大模型正在從“通用型”走向“產(chǎn)業(yè)落地”。

通用大模型是一場(chǎng)“贏家通吃”的大逃殺,把大模型用起來,比做出來更重要。在此次世界人工智能大會(huì)上,所有大模型升級(jí)的關(guān)鍵詞都是“產(chǎn)業(yè)”。

作為大模型的提供方,螞蟻、騰訊、百度、阿里、華為、網(wǎng)易等大廠結(jié)合此前已有領(lǐng)域的經(jīng)驗(yàn)優(yōu)勢(shì),快速探索垂類場(chǎng)景應(yīng)用。

阿里的通義千問大模型,就率先用在了智慧金融。通過將自然語言理解和生成能力與金融場(chǎng)景結(jié)合,通義千問與中金財(cái)富、杭州銀行、恒生電子等合作,通過智能問答、智能外呼、智能助手,來幫助企業(yè)識(shí)別市場(chǎng)風(fēng)險(xiǎn)、理解客戶需求。

以游戲和教育為主的網(wǎng)易,則將大模型率先與這兩個(gè)領(lǐng)域結(jié)合。在教育領(lǐng)域,網(wǎng)易有道自研了國內(nèi)首個(gè)教育大模型“子曰”,在此次大會(huì)還發(fā)布了最新應(yīng)用成果——虛擬人口語教練,可以1V1體驗(yàn)類似真人的口語私教。

而在自動(dòng)駕駛領(lǐng)域積累多年的百度,把大模型投入了汽車交通領(lǐng)域。在汽車制造領(lǐng)域,百度智能云為長(zhǎng)安汽車提供了人工智能基礎(chǔ)設(shè)施平臺(tái)和數(shù)字人平臺(tái),與吉利汽車一起打造了汽車行業(yè)大模型,構(gòu)建了工廠數(shù)字化大腦,幫助降低管理運(yùn)維成本。

正如華為輪值董事長(zhǎng)胡厚崑提到,“人工智能的發(fā)展關(guān)鍵是走深向?qū),著力點(diǎn)放在讓人工智能為千行百業(yè)的生產(chǎn)活動(dòng)服務(wù),為科研創(chuàng)新服務(wù)。” 

不過,這波中國大模型們產(chǎn)業(yè)落地的姿勢(shì)雖各不相同,但在優(yōu)勢(shì)領(lǐng)域站穩(wěn)后,都開始一致向外擴(kuò)展,比拼起了行業(yè)覆蓋能力。

以騰訊為例,目前,騰訊云已經(jīng)為傳媒、文旅等10余個(gè)行業(yè)提供了超過50個(gè)大模型行業(yè)解決方案;華為的盤古大模型則主要與金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等行業(yè)相結(jié)合落地......總體而言,智慧政務(wù)、智慧金融、智慧交通成為搶手垂類賽道。

騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,“通用大模型可以在100個(gè)場(chǎng)景中,解決70%-80%的問題,但未必能100%滿足企業(yè)某個(gè)場(chǎng)景的需求。”

為了提升行業(yè)大模型的競(jìng)爭(zhēng)力,企業(yè)們需要深入垂類行業(yè)的具體場(chǎng)景,貼身肉搏真正考驗(yàn)技術(shù)的細(xì)節(jié)與效果。 

作為持續(xù)進(jìn)化的技術(shù),大模型光能用起來還不夠。正如每一個(gè)技術(shù)的發(fā)展,都需要兩條腿走路,一條是實(shí)用性,一條是先進(jìn)性,大模型的實(shí)用性,是借由產(chǎn)業(yè)側(cè)落地逐步探索的,而先進(jìn)性則體現(xiàn)在對(duì)跨模態(tài)難題的突破。

參考ChatGPT從3.5到4.0的路徑,生成式大模型的技術(shù)前進(jìn)之路,是單模態(tài)到多模態(tài)的,從一開始同質(zhì)化嚴(yán)重的文生文,正在一路向文生圖、文生聲、文生視頻演進(jìn)。

在通義千問之后,阿里云此次宣布推出“通義大模型”新成員AI繪畫“通義萬相”,與文心一格、商湯秒畫類似,文生圖賽道已經(jīng)擁擠起來。 

而在文生圖之后,文生聲、文生視頻是接下來的賽點(diǎn)。

以視頻為例,作為文、聲、圖的結(jié)合體,文生視頻也是生成式大模型的終極形態(tài)。目前,文生視頻技術(shù)的難點(diǎn)在于連貫畫面素材的生產(chǎn);跀(shù)字人的已有技術(shù),文生視頻最快在數(shù)字人場(chǎng)景實(shí)現(xiàn)。

例如,商湯的如影大模型,能將文本文案,一鍵生成知識(shí)分享、品牌宣傳、短視頻帶貨、培訓(xùn)宣講、熱點(diǎn)資訊等各類數(shù)字人視頻,以及3D內(nèi)容生成平臺(tái)“瓊宇”(場(chǎng)景生成)、“格物”(物體生成),基于3D內(nèi)容生成技術(shù)對(duì)空間和物體復(fù)刻與交互。

以往,技術(shù)往往都是先發(fā)展,后應(yīng)用。而在這一波大模型浪潮下,技術(shù)的先進(jìn)性、實(shí)用性同步發(fā)展,兩條腿走路的大模型正在加速前進(jìn)。

產(chǎn)業(yè)拼圖,逐個(gè)補(bǔ)齊

大模型狂奔了4個(gè)月,產(chǎn)業(yè)的拼圖,也在一塊一塊逐漸補(bǔ)齊。

以大模型為核心的MaaS服務(wù)平臺(tái),是大模型飛機(jī)著陸的機(jī)場(chǎng)。大模型如何落地、落地速度,都與這個(gè)機(jī)場(chǎng)平臺(tái)的建設(shè)成熟程度緊密相關(guān)。

目前,百度文心千帆、阿里靈駿PAI平臺(tái)、騰訊模型商店、火山引擎的火山方舟,雖然有細(xì)分的差別,但都是MaaS服務(wù)平臺(tái),幫助企業(yè)更好的精調(diào)、部署行業(yè)大模型,將大模型應(yīng)用在產(chǎn)業(yè)中。

WAIC中,MaaS平臺(tái)的升級(jí)也是一大主要看點(diǎn)。會(huì)上,騰訊云公開了幾大重點(diǎn)行業(yè)方向,包括金融風(fēng)控、交互翻譯、數(shù)智人等創(chuàng)新場(chǎng)景,下一步將布局AI for Science,持續(xù)通過AI 大模型應(yīng)用在天文探索、文化考古等領(lǐng)域。 

在不久前,火山引擎也發(fā)布了MaaS服務(wù)平臺(tái)火山方舟,包括模型廣場(chǎng)和模型工具兩個(gè)重要模塊,核心目的也是通過平臺(tái)力量幫助企業(yè)更好的做應(yīng)用落地。

而在發(fā)展的過程中,安全問題也逐漸暴露出來。

無論是AI詐騙還是三星的員工數(shù)據(jù)泄露,模型安全一度成為了社會(huì)焦點(diǎn),F(xiàn)階段,解決問題的前提是發(fā)現(xiàn)問題,亮起安全紅燈,才能有的放矢的解決。

為此,螞蟻推出了可信程度安全評(píng)測(cè)系統(tǒng)“蟻鑒2.0”,作為業(yè)內(nèi)首個(gè)產(chǎn)業(yè)級(jí)支持文本、圖像等全數(shù)據(jù)類型的AI安全檢測(cè)平臺(tái),“蟻鑒2.0”新增AIGC安全性、AI可解釋評(píng)測(cè)能力,可服務(wù)于金融、教育、文化、醫(yī)療、電商等領(lǐng)域10多個(gè)大規(guī)模復(fù)雜業(yè)務(wù)場(chǎng)景。

另外,螞蟻還將發(fā)布以隱私計(jì)算技術(shù)為核心的隱語開源框架1.0版本、“隱私計(jì)算安全對(duì)戰(zhàn)”科普互動(dòng)游戲,數(shù)字版權(quán)保護(hù)平臺(tái)“鵲鑿”等。

螞蟻的技術(shù)人員告訴光錐智能:“當(dāng)面對(duì)多模型決策時(shí),企業(yè)可以將大模型開放給蟻鑒平臺(tái)進(jìn)行評(píng)分,將有4個(gè)不同的評(píng)分標(biāo)準(zhǔn),就像論文的查重系統(tǒng),檢測(cè)模型的安全指數(shù)并打分,為企業(yè)提供指導(dǎo)。”

不過,據(jù)光錐智能了解到,目前,蟻鑒僅能檢測(cè)問題,并不提供針對(duì)性解決數(shù)據(jù)安全問題的方案。還需要其他廠商共同完善產(chǎn)業(yè)鏈條。

另一方面,數(shù)據(jù)技術(shù)的發(fā)展也在突破大模型本身的限制。

正如前文所講,大模型正在經(jīng)歷從通用到行業(yè)的變遷,這個(gè)過程受到兩個(gè)方面的限制:一是通用大模型只有“短期記憶”,無論是國內(nèi)還是國外,OpenAI最新發(fā)布了GPT4的開源版本中也強(qiáng)調(diào),有8k的Token限制;二是訓(xùn)練行業(yè)專有大模型,企業(yè)需要將私有數(shù)據(jù)與通用大模型進(jìn)行結(jié)合,私有數(shù)據(jù)如何安全的接入大模型?如何更高效率、低成本的處理動(dòng)態(tài)變化的數(shù)據(jù)?

這也就是為什么,大模型火了之后,向量數(shù)據(jù)庫隨之火爆的原因。

星環(huán)科技創(chuàng)始人孫元浩向光錐智能解釋道:“向量數(shù)據(jù)庫就像是大模型的外腦,能夠幫助大模型擁有長(zhǎng)期記憶,且私有數(shù)據(jù)可以通過向量化存儲(chǔ)在向量數(shù)據(jù)庫中,既能滿足瞬時(shí)接入和輸出,也保障企業(yè)私有數(shù)據(jù)不被泄露。”

為此,騰訊云發(fā)布了云原生向量數(shù)據(jù)庫Tencent Cloud VectorDB,支持10億級(jí)向量檢索規(guī)模,并將延遲控制在毫秒級(jí)。相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫檢索規(guī)模提升10倍,同時(shí)具備百萬級(jí)每秒查詢(QPS)的峰值能力。 

星環(huán)科技發(fā)布了分布式向量數(shù)據(jù)庫Transwarp Hippo。支持存儲(chǔ)、索引以及管理海量的向量式數(shù)據(jù)集,提供向量相似度檢索、高密度向量聚類等能力,有效地解決了大模型在知識(shí)時(shí)效性低、輸入能力有限、準(zhǔn)確度低等問題。

向量數(shù)據(jù)庫火爆的背后,是大模型帶動(dòng)著整個(gè)數(shù)據(jù)產(chǎn)業(yè)鏈向前發(fā)展。

在訓(xùn)練大模型之前的數(shù)據(jù)準(zhǔn)備(清洗、過濾、提純)、數(shù)據(jù)處理(選型、質(zhì)量、標(biāo)注)在經(jīng)歷了數(shù)道工序后才能“喂”給大模型,而中國目前數(shù)據(jù)產(chǎn)業(yè)相對(duì)分散,導(dǎo)致數(shù)據(jù)在流通的過程中容易遇到安全問題,且效率不高。

比如,需要先把復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)通過向量化(embedding),處理統(tǒng)一成多維空間里的坐標(biāo)值,才能夠?yàn)榇竽P退,但如Zilliz一類的向量數(shù)據(jù)庫,并不幫企業(yè)完成向量化的過程。

這就需要一個(gè)一站式的數(shù)據(jù)處理平臺(tái)。和數(shù)據(jù)打了十幾年交道的孫元浩,將經(jīng)驗(yàn)?zāi)Y(jié)在了星環(huán)的Sophon LLMOps中,通過該平臺(tái),用戶可以完成數(shù)據(jù)采集、知識(shí)沉淀、大模型迭代提升的完整閉環(huán)。同時(shí)將向量數(shù)據(jù)庫與圖數(shù)據(jù)庫進(jìn)行結(jié)合,能夠更好的幫助大模型跨領(lǐng)域知識(shí)學(xué)習(xí)和調(diào)優(yōu),讓大語言模型能更好地理解不同領(lǐng)域的專業(yè)術(shù)語、縮寫、常見詞匯和語法,承擔(dān)統(tǒng)一的語義理解功能,解決業(yè)務(wù)領(lǐng)域性問題。 

產(chǎn)業(yè)鏈的陸續(xù)補(bǔ)齊,是大模型發(fā)展的基石,同時(shí)也將帶起諸多的產(chǎn)業(yè)鏈機(jī)會(huì),共建一個(gè)完整的模型生態(tài)。

軟件、硬件,兩手抓

今年整個(gè)展覽館,素有“人氣王”之稱的機(jī)器人被數(shù)字人搶了風(fēng)頭。

數(shù)字人展館外人頭攢動(dòng),圍了一圈又一圈。商湯搭建如影數(shù)字人生成平臺(tái),現(xiàn)場(chǎng)演繹3D數(shù)字人生成過程;網(wǎng)易有道豎屏展示虛擬人口語教練,吸引了參展人上前互動(dòng);魔琺科技還原虛擬人試播間,虛擬人一上午連播三場(chǎng)。

雖然,近期AI主播、AI數(shù)字人大規(guī)模涌入了短視頻平臺(tái),掀起了一波討論熱度,但逛完一圈卻發(fā)現(xiàn)沒人展出2D數(shù)字人,顯然相比其實(shí)用性,酷炫、好玩、互動(dòng)性強(qiáng)的3D數(shù)字人更能搶奪人們的目光。

走進(jìn)AI繪畫平臺(tái)的場(chǎng)館,依然令人眼花繚亂。阿里打造巨屏展示其文生圖效果,商湯使用超大卷屏演示其秒畫功能。數(shù)字人、AI繪畫,AIGC儼然成為大眾最關(guān)心的事兒,也是大模型應(yīng)用中跑得最快的方向。

AIGC熱度居高不下,成為了人們茶余飯后的談資,不過更重要的是要推進(jìn)產(chǎn)業(yè)落地。

網(wǎng)易伏羲預(yù)訓(xùn)練及生成式人工智能平臺(tái)負(fù)責(zé)人趙增告訴光錐智能,目前游戲是圖像生成的核心應(yīng)用場(chǎng)景之一。“游戲場(chǎng)景需要?jiǎng)?chuàng)作大量的內(nèi)容,例如各種不同朝代的角色,世界各地的風(fēng)景,通過文圖功能可快速生成手稿,激發(fā)創(chuàng)意,提升游戲制作效率。”

光錐智能逛展過程中發(fā)現(xiàn),相比于年初,市面上內(nèi)容生成的類型變得豐富了起來。文生圖幾乎是各家的標(biāo)配,除此之外,更多維度的多模態(tài)能力越來越完善。比如,騰訊利用文生音頻技術(shù),在音樂創(chuàng)作領(lǐng)域推出了XMusic生成式通用作曲框架。 

從最初的文生圖,到現(xiàn)在的文生音頻、圖生圖,生成內(nèi)容的類型越來越多樣化,呈現(xiàn)出從單模態(tài)走向多模態(tài)的趨勢(shì)。但這還遠(yuǎn)遠(yuǎn)不夠,參照國外Midjourney一類軟件的發(fā)展,文生視頻將是下一階段的方向,而國內(nèi)公司在這方面探索還處于特別早期。 

“左手軟件,右手硬件”,AIGC應(yīng)用落地正在表現(xiàn)出“兩手抓”的趨勢(shì)。

大會(huì)剛開幕,馬斯克在發(fā)言中就提出:“未來人類將會(huì)有更多機(jī)器人產(chǎn)品,預(yù)計(jì)地球上的機(jī)器人數(shù)量將會(huì)超過人類數(shù)量。

據(jù)了解,今年現(xiàn)場(chǎng)共20余款機(jī)器人共同亮相,多款為首發(fā),包括達(dá)闥搭載大模型對(duì)話能力的雙足機(jī)器人、特斯拉人形機(jī)器人擎天柱、網(wǎng)易伏羲具身智能工程機(jī)器人、微創(chuàng)手術(shù)機(jī)器人、美團(tuán)無人機(jī)V4、宇樹四足機(jī)器人、科大訊飛機(jī)器狗、云深處絕影Lite3四足機(jī)器人等。

大模型讓軟件重做了一遍,但離實(shí)際應(yīng)用到機(jī)器人行業(yè)還有很長(zhǎng)的距離。

長(zhǎng)期以來,機(jī)器人一直面臨前端需求不足、單體成本太高、無法規(guī);a(chǎn)等難題。某機(jī)器人廠商市場(chǎng)負(fù)責(zé)人向光錐智能透露,幾年間,我們的機(jī)器人成本降低到此前的三分之一,但于行業(yè)而言,在實(shí)際應(yīng)用中還有很多未知問題需要磨合。 

上述負(fù)責(zé)人表示,理想狀態(tài)下,大模型能夠使機(jī)器人長(zhǎng)出靈魂,讓它自主做決策,跟實(shí)際環(huán)境去互動(dòng)。 

但遺憾的是,目前還很難做到,機(jī)器人的邊緣端資源有限,已有的算力帶不動(dòng)大模型部署,而部署了高昂的GPU又會(huì)繼續(xù)拉高機(jī)器人的單價(jià)。

對(duì)此,有創(chuàng)業(yè)者稱,AI技術(shù)路線尚未走通,可能五年之內(nèi)也難出現(xiàn)大規(guī)模人形機(jī)器人的產(chǎn)品形態(tài)應(yīng)用。

不過,包括馬斯克在內(nèi)的多位企業(yè)家都認(rèn)為,機(jī)器人是人工智能的“具身智能”落地。在更長(zhǎng)期的未來中,機(jī)器人的成熟會(huì)將人工智能的應(yīng)用從信息產(chǎn)業(yè),帶向更深更大的實(shí)體世界中。

結(jié)語

中國大模型正處于一片欣欣向榮的態(tài)勢(shì)。

不過,行業(yè)熱鬧之中,我們也看到了大模型技術(shù)路徑、產(chǎn)業(yè)落地、配套設(shè)施搭建、應(yīng)用生態(tài)仍處于早期階段。

正如阿里云周靖人所說,“大模型領(lǐng)域你追我趕的過程剛剛開始,大家還是要有一些耐心。”

       原文標(biāo)題 : 縱覽2023世界人工智能大會(huì):百模大戰(zhàn)4個(gè)月,中國AI產(chǎn)業(yè)怎么樣了?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)