Web 3.0后下一個(gè)風(fēng)口,AIGC將成未來內(nèi)容趨勢?
文/VR陀螺 林德
AI,人工智能,從今年年初到現(xiàn)在已然成為互聯(lián)網(wǎng)最熱門、引起網(wǎng)友討論度最高的科技概念之一。
今年4月,一款名為DALL-E 2的AI繪畫模型誕生,在短短幾個(gè)月時(shí)間內(nèi)便風(fēng)靡全球,成為今年最火熱的AI繪畫模型,被譽(yù)為最強(qiáng)AI畫手。
無論是文藝復(fù)興風(fēng)格、寶麗來風(fēng)格,或是愛德華·霍普畫風(fēng)、莫奈畫風(fēng)、數(shù)字藝術(shù),亦或是復(fù)古風(fēng)、二戰(zhàn)歷史攝影風(fēng)格等等,DALL-E 2都能輕松實(shí)現(xiàn),只要給出關(guān)鍵詞,大約60秒便可以產(chǎn)生10張圖像供用戶選擇。
DALL-E 2部分作品(圖源:DALL-E 2)
腦洞無限大、寫實(shí)、易操作、更準(zhǔn)確的指令理解...各種元素的集合誕生了不少令人眼前一亮的創(chuàng)意作品,DALL-E 2的作品在社交媒體得到許多用戶的喜愛。
在DALL-E 2全網(wǎng)爆紅之前,輸入文字生成圖像,這種存在于想象中的事情成為現(xiàn)實(shí)的潮流就已經(jīng)開始流行。在今年年初,AI繪畫工具Disco Diffusion、Midjourney早已受到不少藝術(shù)家、時(shí)尚先鋒的青睞,不僅用于娛樂自嗨,商業(yè)用途中也能看見AI的身影。
在獲得羅拉多州博覽會(huì)藝術(shù)創(chuàng)作比賽活動(dòng)一等獎(jiǎng)之前,今年六月《經(jīng)濟(jì)學(xué)人》的期刊封面便是出自Midjourney之手。(圖源:《經(jīng)濟(jì)學(xué)人》)
AI繪畫平臺(tái)Midjourney在Discord上的訂閱人數(shù)也已超過百萬。
截止至9月7日,Midjourney在Discord的訂閱情況(圖源:VR陀螺)
從Disco Diffusion到MidJourney,再到DALL-E 2的全網(wǎng)流行,Text-to-Image(文字生成圖像)從小眾開發(fā)社群火到社交媒體進(jìn)入大眾眼簾,AI生成圖像的創(chuàng)作方式讓海內(nèi)外的用戶驚呼AI的發(fā)展竟然到了這種程度!
輸入“骨頭山”、“宗教化”、“火焰”、“無動(dòng)于衷的人們”四組關(guān)鍵詞組獲得的四張AIGC圖像(圖源:VR陀螺)
最近,AI畫畫熱度退散之后,AI寫論文又再度幫助AI破圈。事情源于一篇Reddit上的帖子,發(fā)帖人Urdadgirl69表示他的論文就是由AI代筆完成,而他的老師并沒有發(fā)現(xiàn)作業(yè)的異常情況。
圖源:游戲研究社
更具有沖擊力的是,Meta在十月初發(fā)布的文本轉(zhuǎn)視頻Make-A-Video功能,意味著AI圖像制作領(lǐng)域又有了新的突破,在圖像逼真內(nèi)容豐富的情況下,邁向了動(dòng)態(tài)的視頻領(lǐng)域。
輸入“一只穿著超人紅色披風(fēng)在天上飛的狗”獲得的視頻(圖源:Meta)
從“人均AI畫師”到“我讓AI幫我寫論文,不僅拿A,還能賺錢”,AI這個(gè)關(guān)鍵詞頻頻出圈。無論是AI生成圖像,還是AI生成文本,或是AI生成視頻,這些都被統(tǒng)稱為AIGC內(nèi)容生成模式。
AIGC,人工智能生成內(nèi)容,顧名思義是由人工智能驅(qū)動(dòng)的工具創(chuàng)造的內(nèi)容,這種內(nèi)容生產(chǎn)模式在不僅在繪畫、寫作領(lǐng)域成為熱門趨勢,在游戲場景建模、數(shù)字人、AI聊天、科研AI for Science、AI換臉、音樂等領(lǐng)域也有所建樹,可以看到,這種模式正在成為新的主流。
AIGC當(dāng)?shù),資本的“新頭好”
獲益于頻頻在大眾視野中“刷臉”,AIGC的熱度以及前景讓越來越多的資本將目光放至于此。
今年9月,紅杉資本官方發(fā)表的一篇文章《Generative AI: A Creative New World》》中認(rèn)為AIGC將會(huì)代表新一輪范式轉(zhuǎn)移(認(rèn)知轉(zhuǎn)移)的開始。
圖源:網(wǎng)絡(luò)
近日,依靠文字生成Instagram標(biāo)題、Tiktok視頻腳本、廣告營銷文本、電子郵件等內(nèi)容,成立不到兩年時(shí)間的AIGC 初創(chuàng)公司 Jasper 宣布自身以15億美元的估值獲得 1.25億美元 A輪融資,搖身一變成為AIGC圈的新興強(qiáng)者。
圖源:Jasper
10月17日,英國開源人工智能公司 Stability AI 宣布獲得 1.01 億美元融資,估值高達(dá) 10 億美元,躋身獨(dú)角獸企業(yè)行列。
10月21日,根據(jù)澎湃新聞,《華爾街日?qǐng)?bào)》表示谷歌公司正在展開談判,擬向人工智能初創(chuàng)企業(yè)Cohere投資至少2億美元。Cohere的業(yè)務(wù)包括開發(fā)自然語言處理軟件,包括聊天機(jī)器人等可以理解人類語音和文本的程序。
此外,微軟正對(duì)OpenAI的新一輪投資進(jìn)行后期談判。OpenAI推出了DALL·E 2項(xiàng)目,允許用戶通過文本生成圖像,即AI作畫。
不僅在海外AIGC企業(yè)有多起融資事件,甚至出現(xiàn)獨(dú)角獸企業(yè),在國內(nèi)AIGC類企業(yè)同樣備受資本青睞。
今年1月,超參數(shù)科技宣布完成1億美元B輪融資。
10月,虛擬內(nèi)容 AIGC 技術(shù)服務(wù)商慧夜科技完成千萬元人民幣Pre-A+ 輪融資,由高瓴資本和順為資本領(lǐng)投。
同樣發(fā)生在10月,成立于2021年的生成式AI平臺(tái)TIAMAT宣布完成數(shù)百萬美元天使輪融資。據(jù)了解,TIAMAT近4個(gè)月內(nèi)的全網(wǎng)曝光量已經(jīng)達(dá)到了5000萬,并且這個(gè)數(shù)據(jù)還在不斷攀升。
......
AIGC在投資圈已然成為資本重點(diǎn)關(guān)注對(duì)象,在科技界,科技大廠們也同樣將其視作重點(diǎn)戰(zhàn)略布局環(huán)節(jié)。
大廠重要戰(zhàn)略布局 AIGC是未來內(nèi)容趨勢
隨著互聯(lián)網(wǎng)的不斷升級(jí),從Web 1.0到現(xiàn)在的Web 2.0,再到未來Web 3.0時(shí)代,以門戶網(wǎng)站為主的媒體時(shí)代到自媒體時(shí)代、社交平臺(tái)的興起,用戶對(duì)互聯(lián)網(wǎng)的依賴度逐漸上升,內(nèi)容生產(chǎn)方式也在進(jìn)行著變遷。
在Web 3.0時(shí)代中,數(shù)字世界將變得更為清晰,AI也一直被視為元宇宙關(guān)鍵技術(shù)之一、助力數(shù)字孿生的重要利器。從“只讀模式”的PGC(專業(yè)生產(chǎn)內(nèi)容)到用戶自發(fā)參與的UGC(用戶生產(chǎn)內(nèi)容)再到AIGC(AI生產(chǎn)內(nèi)容),內(nèi)容創(chuàng)作門檻正在逐步降低,內(nèi)容生產(chǎn)力無疑將獲得更高的釋放。
不妨想象一下,在虛擬世界里,無論是打造比擬真實(shí)場景的外在,還是塑造數(shù)字生物的“思想”內(nèi)在,都需要更高效、更實(shí)時(shí)的內(nèi)容創(chuàng)作,這也就凸顯了能夠突破人力限制的AI技術(shù)的重要性。
以游戲中的智能NPC為例,若每個(gè)NPC以智能體的形式存在,那么它不僅能夠識(shí)別所處環(huán)境狀態(tài)的變化,而且能夠根據(jù)環(huán)境狀態(tài)的調(diào)整行為策略,做出符合自身個(gè)性特征的行為。在任何場景下,玩家與智能體的每一次互動(dòng),智能體都能夠根據(jù)玩家狀態(tài)、環(huán)境狀態(tài)和自身狀態(tài)的參數(shù)做出相應(yīng)的行為,進(jìn)而在與玩家的互動(dòng)過程中產(chǎn)生突發(fā)的動(dòng)態(tài)內(nèi)容,這將對(duì)于數(shù)字世界的意義不言而喻。
電影《失控玩家》中自我意識(shí)覺醒的智能NPC男主(圖源:網(wǎng)絡(luò))
邁向下一代互聯(lián)網(wǎng)是各大科技巨頭、互聯(lián)網(wǎng)大廠,如今在元宇宙的加持下,數(shù)字化時(shí)代開啟新一輪加速,AIGC的背后生產(chǎn)力--人工智能技術(shù)早已被納入巨頭們的重要戰(zhàn)略布局之中。
去年12月,Meta已將其AI團(tuán)隊(duì)并入Reality Labs部門,以開發(fā)元宇宙。
今年1月24日,Meta在一篇博客文章中表示其公司研究團(tuán)隊(duì)正在打造一款新的人工智能超級(jí)計(jì)算機(jī),并有望在今年下半年沖擊“全球最快AI超算”寶座。
實(shí)際上,早在2017年,臉書就發(fā)布了第一代AI超級(jí)計(jì)算機(jī)。據(jù)Meta而言,相較于第一代超算,新的人工智能超級(jí)集群(RSC)在運(yùn)行計(jì)算機(jī)視覺工作流程的速度上提高了20倍,運(yùn)行英偉達(dá)集體通信庫(nccl)的速度提高了9倍多,自然語言處理能力則提高了三倍多,并且可以從數(shù)萬億例子中學(xué)習(xí),在數(shù)百種語言中運(yùn)作,分析文本、圖像和視頻的內(nèi)容是否有問題。
Meta AI團(tuán)隊(duì)的研究人員Kevin Lee和Shubho Sengupta在博文中表示,RSC將在下一個(gè)計(jì)算平臺(tái)元宇宙中發(fā)揮重要作用。
圖源:網(wǎng)絡(luò)
今年2月,在Meta AI: Inside the Lab活動(dòng)上,Meta展示了其AIGC向的“探索性工具”原型Builder Bot。在Meta官方發(fā)布的視頻中,隨著扎克伯格“聲聲令下”,公園、海、沙灘、島嶼、云朵等,甚至BGM逐漸形成一個(gè)完整的場景。
圖源:Meta
這一切都是由AI驅(qū)動(dòng)生成的內(nèi)容,通過語音搭建VR場景,Meta稱該工具將“促進(jìn)元宇宙的創(chuàng)造力”。
可以預(yù)見的是,這項(xiàng)技術(shù)如果取得成功,有很大可能會(huì)對(duì)其他VR世界和平臺(tái)產(chǎn)生影響,打造VR場景將會(huì)變得更加容易。如果將Meta的Builder bot技術(shù)整合,元宇宙的內(nèi)容生態(tài)也將獲得新的增長,例如,與已經(jīng)開始測試語音功能的游戲元宇宙平臺(tái)Roblox合作打造場景,以豐富生態(tài)內(nèi)容等等。
去年4月,英偉達(dá)打造的“工業(yè)元宇宙”創(chuàng)作平臺(tái)Omniverse以難辨真假的虛擬黃仁勛出圈,11月份,英偉達(dá)推出AI虛擬化身創(chuàng)建平臺(tái)Omniverse Avatar說,今年CES 2022上,英偉達(dá)宣布Omniverse三項(xiàng)AI新功能,助力AIGC。
從Omniverse到Omniverse Avatar,英偉達(dá)皆在幫助用戶更快速地合成所需的數(shù)字內(nèi)容,包括數(shù)字化場景、Avatar化身、甚至僅需一條音軌即可輕松制作3D人臉動(dòng)動(dòng)畫等等。
英偉達(dá)中國區(qū)Omniverse業(yè)務(wù)發(fā)展經(jīng)理何展曾表示,“從UGC過渡到AIGC,無論是設(shè)計(jì)師、創(chuàng)業(yè)公司和很多大的平臺(tái)公司都有明顯的趨勢。因?yàn)閁GC已經(jīng)發(fā)展了很長時(shí)間,現(xiàn)在我們更想要快速工業(yè)化生產(chǎn)的平臺(tái),讓大家能夠從AI紅利獲得更好的益處。”
Q版AI黃仁勛(圖源:英偉達(dá))
不止海外大廠對(duì)AI,尤其是對(duì)AIGC這種新的內(nèi)容模式“給予厚望”,今年7月,國內(nèi)互聯(lián)網(wǎng)大廠百度在百度世界大會(huì)活動(dòng)現(xiàn)場利用AI技術(shù)復(fù)原了《富春山居圖》殘卷,背后的核心技術(shù)便是AIGC。
在大會(huì)現(xiàn)場,百度掌門人李彥宏還表示:“AIGC是PGC、UGC之后,全新的內(nèi)容生產(chǎn)方式。它不僅會(huì)提升內(nèi)容生產(chǎn)的效率,也會(huì)創(chuàng)造出有獨(dú)特價(jià)值和獨(dú)立視角的內(nèi)容!
紅框部分為AIGC內(nèi)容(圖源:網(wǎng)絡(luò))
“未來十年,AIGC將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式?梢詫(shí)現(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,去生成AI原創(chuàng)內(nèi)容!
從二維向三維過渡 理想中的AIGC究竟有多難?
根據(jù)中國信通院發(fā)表的《人工智能生成內(nèi)容(AIGC)白皮書》,AIGC的發(fā)展階段分為三個(gè),首先是受限于技術(shù)發(fā)展的早期概念階段,到1990年之后的沉淀積累階段,再到2010年至今的快速發(fā)展階段,特別是從2014年起,生成式對(duì)抗網(wǎng)絡(luò)(GAN)的提出與迭代更新,以及AI算法的升級(jí)讓AIGC迎來了百花齊放的內(nèi)容時(shí)代。
但目前AIGC的涉及范圍更多在圖像、視頻、語音等相對(duì)二維化的場景應(yīng)用中,而回到元宇宙這個(gè)愿景,三維化應(yīng)用場景才是關(guān)鍵,AIGC技術(shù)的應(yīng)用無疑將推動(dòng)二維互聯(lián)網(wǎng)向三維互聯(lián)網(wǎng)的過渡,但理想的AIGC的難度可想而知。
二維與三維的區(qū)別(圖源:網(wǎng)絡(luò))
理想很豐滿,現(xiàn)實(shí)很骨感,這句話形容元宇宙,在某些程度上可以說是非常貼近。而要實(shí)現(xiàn)元宇宙內(nèi)容生產(chǎn)上的AIGC化究竟有多難?需要什么?
AIGC技術(shù)的提升背靠GAN和AI算法的支持,根據(jù)中國信通院的研究發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的升級(jí)是推動(dòng)AIGC快速發(fā)展的另一個(gè)主要原因,實(shí)驗(yàn)證明,深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和模型大小呈正相關(guān),伴隨著模型參數(shù)量的增加,相對(duì)應(yīng)深度神經(jīng)網(wǎng)絡(luò)的能力一般會(huì)取得大幅提升。
即使是模型架構(gòu)各有不同,但可以肯定的是,這些深度學(xué)習(xí)網(wǎng)絡(luò)的生成邏輯往往都需要大量的數(shù)據(jù)支撐。光是自然語言模型的突破,國內(nèi)外的企業(yè)和高校都投入了巨大的人力、算力,據(jù)悉,模型的參數(shù)量從千萬級(jí)已經(jīng)發(fā)展到了千億級(jí)別。
但三維世界的數(shù)據(jù)支撐相對(duì)而言就十分有限,要想在元宇宙中實(shí)現(xiàn)AIGC生產(chǎn)方式,首先需要龐大的三維素材庫。而三維素材的掃描,數(shù)據(jù)的收集顯然比二維更加麻煩,在如今激光雷達(dá)LiDAR這類深度攝像還未普及的情況下,三維素材的素材量顯然是不足以支撐一個(gè)理想的AIGC模型訓(xùn)練。
其次是,算力的升級(jí)。
相對(duì)于二維平面,三維空間相對(duì)增加了許多維度,除了語音語義識(shí)別、計(jì)算及圖像識(shí)別之外,還有空間識(shí)別例如距離、大小、空間位置等,因此在算力和模型架構(gòu)的升級(jí)是必不可少的。
以英偉達(dá)自動(dòng)駕駛的演示案例為例,為了保證安全性,自動(dòng)駕駛的車輛上采集器的數(shù)據(jù)來源需要非常多,激光雷達(dá)、雷達(dá)、攝像頭等。
這些采樣得到的數(shù)據(jù)不是單一的,而是多樣性的,包括地圖、環(huán)境位置、車內(nèi)狀況、突發(fā)情況等,因此自動(dòng)駕駛車規(guī)級(jí)的計(jì)算機(jī)每秒鐘運(yùn)算的數(shù)據(jù)量是非常巨大的。而要達(dá)到高精度的三維場景自主搭建,計(jì)算力的升級(jí)也是極其重要的一環(huán)。
圖源:CNMO
理想化的元宇宙場景是根據(jù)個(gè)人喜好生成符合用戶自身的三維場景、人物形象等,目前,3D建模AIGC化已經(jīng)能在許多案例中看到,無論是Deepfake換臉技術(shù),還是自動(dòng)生成3D模型的軟件等。但都還局限于XR技術(shù)的發(fā)展,目前3D化的場景與模型都只能在2D平面中看到。
3D建模手辦(圖源:機(jī)器之心)
并且,用戶的個(gè)性化數(shù)據(jù)需要龐大的用戶基數(shù),但用戶數(shù)據(jù)泄露、非法收集等安全問題也一直被詬病,在虛擬空間中引發(fā)的安全爭議也有不少案例。
此外,理想化AIGC最后一個(gè)關(guān)鍵是AI需要具備“意識(shí)”形成。
這里的意識(shí)不是指自我意識(shí),而是能基于不用的語義信息、環(huán)境、概念等進(jìn)行創(chuàng)作的創(chuàng)作意識(shí),例如一些智能NPC、虛擬人偶像等的應(yīng)用。
根據(jù)中國信通院的說法,按照技術(shù)的發(fā)展進(jìn)程和實(shí)際應(yīng)用的形態(tài),數(shù)字內(nèi)容的創(chuàng)作能力可劃分為基于模仿的創(chuàng)作和基于概念的創(chuàng)作兩類。
在未來,深度神經(jīng)網(wǎng)絡(luò)的高速發(fā)展下,人工智能將會(huì)被不斷刷新,伴隨著的將是人工智能更強(qiáng)的理解能力以及生成能力,數(shù)字內(nèi)容也將到達(dá)新的高度。
結(jié)語
科技巨頭們的舉動(dòng)無疑是標(biāo)志著人工智能已經(jīng)被置于發(fā)展核心布局的一環(huán),在未來,人工智能將扮演關(guān)鍵角色。在AI的加持下,互聯(lián)網(wǎng)世界的內(nèi)容,無論是多樣性還是數(shù)量都將再次達(dá)到新的高峰,毫無疑問,AIGC將在互聯(lián)網(wǎng)內(nèi)容創(chuàng)作迭代上起到多么關(guān)鍵的推進(jìn)作用。
但作為最飽受爭議的科技之一,人工智能在不斷的發(fā)展、融合之中又在不斷地帶來新的創(chuàng)意,新的爭議,同時(shí)AI侵入學(xué)術(shù)界、教育界、藝術(shù)界等的事件讓大眾也產(chǎn)生了一定程度的危機(jī)感。
水能載舟,亦能覆舟。如同MidJourney的創(chuàng)始人大衛(wèi)·霍爾茨(David Holz)說的一般,“人們把人工智能看作一只老虎,一只危險(xiǎn)的、會(huì)吃掉人的老虎。不過就像水一樣,水中也有危險(xiǎn),但人們可以游泳、造船、利用水發(fā)電,它既是危險(xiǎn)的,又是文明的驅(qū)動(dòng)力。這是一個(gè)機(jī)會(huì),它沒有意志,我們可能會(huì)淹死在水中,但不意味著水應(yīng)該被禁止。人工智能就是一個(gè)新的水源,只要利用得當(dāng)就會(huì)讓人類變更好!
雖然AIGC對(duì)于信息生產(chǎn)的擴(kuò)展性的意義重大,但同時(shí)這需要計(jì)算機(jī)、數(shù)學(xué)、心理學(xué)、社會(huì)學(xué)、哲學(xué)等許多學(xué)科的交集,共同進(jìn)步人類才能跨越工業(yè)生產(chǎn)的下一步,這也是眾多科技巨頭仍在探索和努力的方向。
原文標(biāo)題 : Web 3.0后下一個(gè)風(fēng)口,AIGC將成未來內(nèi)容趨勢?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-12.26立即報(bào)名>>> 【在線會(huì)議】村田用于AR/VR設(shè)計(jì)開發(fā)解決方案
-
1月8日火熱報(bào)名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會(huì)
-
即日-1.14火熱報(bào)名中>> OFweek2025中國智造CIO在線峰會(huì)
-
即日-1.24立即參與>>> 【限時(shí)免費(fèi)】安森美:Treo 平臺(tái)帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容