亚洲欧美国产高清va在线播放,小草莓网站

看見未來！Meta這項(xiàng)最新的AI技術(shù)，讓我們離AI電影又近了一步

2023-11-20 16:46

來源： OFweek人工智能網(wǎng)

《復(fù)仇者聯(lián)盟》導(dǎo)演喬·羅素曾表示，他相信終有一天AI可以自己生成一部電影。

放在以前你可能覺得這是天方夜譚，因?yàn)橐徊坑捌闹谱魇且粋€上百人的團(tuán)隊(duì)共同合作的結(jié)果。一個小小的AI怎么可能代替上百人，真要那樣的話大導(dǎo)演們都直接原地退休了！

但是經(jīng)過這段時間AI技術(shù)的沖擊，不少人已經(jīng)被刷新了認(rèn)知。AI能做的事，遠(yuǎn)遠(yuǎn)超過人們能想象的，包括制作一部電影。

社交巨頭Meta最新發(fā)布的AI技術(shù)，讓我們離AI電影又近了一步。

看見未來！Meta這項(xiàng)最新的AI技術(shù)，讓我們離AI電影又近了一步

Emu Video和Emu Edit

OpenAI之前發(fā)布的全新DALL－E 3文生圖引擎，已經(jīng)讓我們驚嘆。更別說后來的文本轉(zhuǎn)語音模型，以及能夠?qū)崟r語音對話的ChatGPT。

但是Meta最新發(fā)布的AI技術(shù)，顛覆了我們對AI生成內(nèi)容的固有認(rèn)知。

Meta發(fā)布的新AI技術(shù)涉及內(nèi)容編輯和生成，并推出了兩款全新的AI模型——Emu Video和Emu Edit。Emu Video 采用的是Meta之前發(fā)布的Emu模型，能夠基于文本和圖像輸入生成視頻剪輯。而Emu Edit則主要用于圖像處理，用Meta自己的話來說，Emu Edit比之前的圖像編輯更精確，更好用。

雖然目前兩款模型仍在研究開發(fā)階段，但是Meta對其有著充足的信心，他們認(rèn)為這將對影視創(chuàng)作者、藝術(shù)家甚至是插畫師都有巨大的應(yīng)用潛力。

根據(jù)Meta官方描述，Emu Video 采用了“分解式”訓(xùn)練方法，將訓(xùn)練過程分為兩步，使模型能夠?qū)Σ煌斎胱龀鲰憫?yīng)。

AI模型將生成過程分成兩步：首先根據(jù)文本提示生成圖像，然后根據(jù)文本和生成的圖像生成視頻。這種“分解式”或分步的視頻生成方法讓模型能夠高效地訓(xùn)練視頻生成模型。

舉例來說，給定一個標(biāo)題（例如“一只狗跑過草地小丘”）、圖像或照片以及描述，Emu Video 可以生成一個四秒的動畫剪輯視頻。別看只有四秒，但是它是一段擁有512×512像素，每秒16幀的高質(zhì)量視頻。

來源：Meta

Emu Edit專注于圖像處理，用戶可以用它來去除或添加圖像背景、執(zhí)行色彩和幾何變換，以及對圖像進(jìn)行局部和全局編輯。Meta認(rèn)為，模型的主要目標(biāo)不應(yīng)僅僅是產(chǎn)生一個“可信”的圖像。相反，模型應(yīng)專注于精確地改變與編輯請求相關(guān)的像素。

據(jù)了解，Meta使用了計(jì)算機(jī)視覺任務(wù)來訓(xùn)練Emu Edit。訓(xùn)練用的數(shù)據(jù)集包括 1000 萬張合成圖像，每張圖像都有輸入圖像、任務(wù)描述以及目標(biāo)輸出圖像。用他們的話說，這是迄今為止同類中最大的數(shù)據(jù)集。

而在此之前，Meta的CEO馬克扎克伯格發(fā)布Emu模型時就談到，用來訓(xùn)練該模型的數(shù)據(jù)高達(dá)11億條，其中包括Facebook 和 Instagram 用戶分享的照片和標(biāo)題。

先進(jìn)，但并不完美

不能否認(rèn)，Emu Video和Emu Edit的出現(xiàn)，確實(shí)是行業(yè)的一大進(jìn)步。但別看Meta把這兩個模型吹得神乎其神，他們也不是完美的，一些匪夷所思的現(xiàn)象仍然存在。

在生成的一些視頻里面，就有明顯奇怪的物理現(xiàn)象（例如平行于地面移動的滑板）和怪異的附肢（腳趾卷曲在腳后和腿相互融合）。物體的出現(xiàn)和消失也常常沒有太多邏輯，就像埃菲爾鐵塔片段中頭頂上的鳥兒一樣。

來源：Meta

其次，剪輯中的主題并沒有起多大的作用。據(jù)了解，這可能是模型基礎(chǔ)架構(gòu)的限制原因，導(dǎo)致了Emu Video 似乎對動作動詞沒有很強(qiáng)的把握。

例如，一只可愛的擬人化浣熊會拿著一把吉他，但它不會彈奏吉他－即使剪輯的標(biāo)題包含“彈奏”一詞�；蛘邇芍华�(dú)角獸會“下”國際象棋，但它們只是好奇地坐在棋盤前但卻不移動棋子。

來源：Meta

結(jié)語

說回漫威。AI生成視頻引發(fā)最大爭議的，是之前一部漫威的劇集——《秘密入侵》。這部劇集的片頭一出來，給人一種很怪異的感覺。當(dāng)時就有人稱，這個片頭使用AI生成的。隨著傳聞發(fā)酵，幕后工作室承認(rèn)他們在制作時用到了文生圖模型Midjourney。消息一經(jīng)發(fā)布，立刻引起了業(yè)內(nèi)人士和部分民眾的強(qiáng)烈抗議。

看見未來！Meta這項(xiàng)最新的AI技術(shù)，讓我們離AI電影又近了一步