訂閱
糾錯(cuò)
加入自媒體

Openai發(fā)布的Sora,送給A股800億開(kāi)年紅包

貝克街探案官

作者

魯鎮(zhèn)西

普通人如何把握技術(shù)迭代帶來(lái)的行業(yè)變革紅利

沒(méi)想到今年第一個(gè)引爆科技圈的消息,還沒(méi)等復(fù)工就刷了屏,復(fù)工后又直接推動(dòng)相關(guān)企業(yè)市值爆拉,A股25家相關(guān)企業(yè)市值共計(jì)增長(zhǎng)888.42億元,兩個(gè)交易日平均漲幅26.94%。

   

2 月 16 日凌晨,OpenAI 發(fā)布首個(gè)文生視頻模型 Sora,是OpenAI繼ChatGPT之后,推出的另一款具備顛覆行業(yè)能力的AI應(yīng)用,Sora能夠僅僅根據(jù)提示詞,生成60s的連貫視頻,遠(yuǎn)超行業(yè)目前大概只有平均“4s”的視頻生成長(zhǎng)度。

“平均4s”的長(zhǎng)度指代非常明顯,就是Runway和PIKA。也曾短暫引爆過(guò)A股文生視頻的炒作,但無(wú)論是強(qiáng)度還是持續(xù)性,都遠(yuǎn)不如Sora。

在Sora問(wèn)世之前,Runway和PIKA被視為文生視頻領(lǐng)域的龍頭,但在sora生產(chǎn)的視頻出現(xiàn)后,業(yè)界普遍認(rèn)為Sora可以吊打Runway和PIKA。

Pika創(chuàng)始人郭文景曾在接受采訪(fǎng)時(shí)表示,“視頻現(xiàn)在沒(méi)有很好的算法,它不是一個(gè)規(guī)模化的問(wèn)題,不是說(shuō)現(xiàn)在大家的GPU不夠多,很多時(shí)候其實(shí)是算法上還沒(méi)有很好的一個(gè)思路。”并認(rèn)為Sora的發(fā)布“是一個(gè)很振奮人心的消息,我們已經(jīng)在籌備直接沖,將直接對(duì)標(biāo)Sora。”

和Runway和PIKA相比,Sora產(chǎn)出的視頻時(shí)間更長(zhǎng),連貫性更好,其他模型產(chǎn)出的視頻甚至還有卡頓、場(chǎng)景突變等問(wèn)題;在此基礎(chǔ)上,Sora的視覺(jué)細(xì)節(jié)更豐富,且清晰度更高。對(duì)比Sora和runway的視頻不難發(fā)現(xiàn),Sora的視頻內(nèi)容更符合常人對(duì)“視頻”的理解,而runway的視頻內(nèi)容更像是“GIF”動(dòng)圖。  

業(yè)內(nèi)普遍認(rèn)為,Sora的出現(xiàn),預(yù)示著一個(gè)全新的視覺(jué)敘事時(shí)代的到來(lái),它能夠依據(jù)客戶(hù)的文本提示,將人們的想象力轉(zhuǎn)化為生動(dòng)的動(dòng)態(tài)畫(huà)面。Sora作為一款通用的視覺(jué)數(shù)據(jù)模型,其卓越之處在于能夠生成跨越不同持續(xù)時(shí)間、縱橫比和分辨率的視頻和圖像,甚至包括生成長(zhǎng)達(dá)一分鐘的高清視頻。

從成片來(lái)看,假以時(shí)日,伴隨熟練運(yùn)用Sora的工程師、自媒體人越來(lái)越多,電影業(yè)恐將在此次技術(shù)變革中迎來(lái)一次大洗牌,畢竟每一部影視作品成片之前都要先有個(gè)好劇本,好劇本問(wèn)世后,用Sora就可以實(shí)現(xiàn)視頻輸出了。   

但就目前而言,實(shí)現(xiàn)這個(gè)目標(biāo)為時(shí)尚早,因?yàn)檎麄(gè)Sora產(chǎn)業(yè)鏈正處于萌芽期,國(guó)內(nèi)目前尚未有一家公司可以與之抗衡,就連字節(jié)都直言“Boximator”目前還無(wú)法作為完善的產(chǎn)品落地,令人略有欣慰的是,已經(jīng)涌現(xiàn)出大批企業(yè)試圖搭上Sora的快車(chē)。

這也不禁讓人想起ChatGPT發(fā)布后,大量企業(yè)跟進(jìn)推出“自研大模型”,并不斷呼嚎趕超OpenAI,結(jié)果人家這次直接來(lái)個(gè)降維,借著推出Sora繼續(xù)AI應(yīng)用市場(chǎng)遙遙領(lǐng)先。

01

Sora是否難以復(fù)制

Sora采用了Transformer架構(gòu),和ChatGPT不同的是,大語(yǔ)言模型通過(guò)token將各種形式的文本代碼、數(shù)學(xué)和自然語(yǔ)言統(tǒng)一起來(lái),Sora則通過(guò)視覺(jué)包(patchs)實(shí)現(xiàn)了類(lèi)似的效果。

Sora和ChatGPT最大的區(qū)別,就是Sora為擴(kuò)散模型,它接受輸入的噪聲包(以及如文本提示等條件性輸入信息),然后被訓(xùn)練去預(yù)測(cè)原始的“干凈”包。

重要的是,Sora是一個(gè)基于擴(kuò)散的轉(zhuǎn)換器模型,這種模型已經(jīng)在多個(gè)領(lǐng)域展現(xiàn)了顯著的擴(kuò)展性,包括語(yǔ)言建模、計(jì)算機(jī)視覺(jué)以及圖像生成等領(lǐng)域。擴(kuò)散轉(zhuǎn)換器在視頻生成領(lǐng)域同樣具有巨大的潛力,不同訓(xùn)練階段下,使用相同種子和輸入的視頻樣本對(duì)比,結(jié)果證明了隨著訓(xùn)練量的增加,樣本質(zhì)量有著明顯的提高。

Sora研究員專(zhuān)門(mén)訓(xùn)練了一個(gè)網(wǎng)絡(luò),專(zhuān)門(mén)負(fù)責(zé)降低視覺(jué)數(shù)據(jù)的維度。這個(gè)網(wǎng)絡(luò)接收原始視頻作為輸入,并輸出經(jīng)過(guò)壓縮的潛在表示。Sora模型就是在這個(gè)壓縮后的潛在空間中接受訓(xùn)練,并最終生成視頻。此外,研究員還設(shè)計(jì)了一個(gè)解碼器模型,它可以將生成的潛在表示重新映射回像素空間,從而生成可視的視頻或圖像。   

當(dāng)給定一個(gè)壓縮后的輸入視頻時(shí),從中提取出一系列的時(shí)空包,這些包被用作轉(zhuǎn)換token。這一方案不僅適用于視頻,因?yàn)橐曨l本質(zhì)上就是由連續(xù)幀構(gòu)成的,所以圖像也可以看作是單幀的視頻。

通過(guò)這種基于包的表示方式,Sora能夠跨越不同分辨率、持續(xù)時(shí)間和縱橫比的視頻和圖像進(jìn)行訓(xùn)練。在推理階段,研究員只需在適當(dāng)大小的網(wǎng)格中安排隨機(jī)初始化的包,就可以控制生成視頻的大小和分辨率。

僅從原理層面來(lái)看,推出Sora這種文生視頻大模型并不難,但國(guó)產(chǎn)廠商在推出進(jìn)度上紛紛落后于OpenAI,此前曾有消息稱(chēng)字節(jié)推出了Boximator,它可以通過(guò)文本精準(zhǔn)控制生成視頻中人物或物體的動(dòng)作。

對(duì)此,字節(jié)跳動(dòng)相關(guān)人士回應(yīng)稱(chēng),Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無(wú)法作為完善的產(chǎn)品落地,距離國(guó)外領(lǐng)先的視頻生成模型在畫(huà)面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還有很大差距。

其他發(fā)布公告的企業(yè),要么是想要介入這個(gè)賽道,要么就是可以為該行業(yè)提供硬件設(shè)備支持,因?yàn)锳股市場(chǎng)中沒(méi)有文生視頻的企業(yè),所以退而求其次,找到了一家文生圖產(chǎn)品獲得市場(chǎng)認(rèn)可的企業(yè)炒作,即因賽集團(tuán),該公司的InsightGPT的文生圖功能已在時(shí)尚珠寶和快消兩個(gè)賽道的營(yíng)銷(xiāo)領(lǐng)域商用,并且具有一定市場(chǎng)認(rèn)可度。

其他的則是一些算力租賃公司獲得市場(chǎng)爆炒,至于想要切入這個(gè)行業(yè)的公司就更多了,不勝枚舉。   

02

Sora商用,會(huì)切走誰(shuí)的蛋糕

Sora之所以會(huì)引起市場(chǎng)轟動(dòng),主要是因?yàn)槠?ldquo;文生視頻”的功能直接讓影視從業(yè)人員集體焦慮。

北京天工異彩影視科技有限公司的副總裁兼CTO周輝公開(kāi)表示,Sora生成的視頻質(zhì)量足夠震撼,可以縮短電影拍攝周期。

其實(shí)周輝的表達(dá)還是保守了,只要Sora工程師足夠多,硬件設(shè)備不受限,整個(gè)影視業(yè)的演員都可以省了,動(dòng)輒過(guò)億的演員費(fèi)用也可以省下,那現(xiàn)在已經(jīng)成名的影視劇明星,想要上鏡就要另謀出路,當(dāng)然制作方也可以獲得已成名演員的授權(quán)后上鏡。

同時(shí)場(chǎng)地租賃、置景等費(fèi)用也會(huì)隨之下降,這也給了很多非專(zhuān)業(yè)團(tuán)體在影視業(yè)一展身手的機(jī)會(huì),換言之,今天是影視業(yè)最容易的一天,以后每一天都比今天難上加難,值得注意的是,這一邏輯對(duì)視頻依賴(lài)較大的廣告業(yè)也通用。

除此之外,國(guó)內(nèi)剛起步的科幻電影可發(fā)揮空間也將瞬間提升。之前一直說(shuō)《三體》影視化不成功,是因?yàn)楹芏鄨?chǎng)景制作困難,而Sora的出現(xiàn),可以有效解決這個(gè)問(wèn)題,C 內(nèi)容的專(zhuān)家化也將創(chuàng)造新的風(fēng)格與形式,增強(qiáng)影視內(nèi)容的吸引力與豐富度。用人方面,特效師因?yàn)榫邆浠A(chǔ)的工作邏輯,培訓(xùn)周期也比其他沒(méi)有經(jīng)驗(yàn)的人群更短。

但在Sora工程師大規(guī)模入局之前,短期Sora還是一個(gè)工具性產(chǎn)品,某種程度上幫助影視制作方降本增效。    

除影視行業(yè)外,游戲行業(yè)也將借助Sora產(chǎn)生巨大變革,Sora對(duì)于物理世界的理解和模擬可以與游戲場(chǎng)景開(kāi)發(fā)高度適配,Sora可以幫助游戲開(kāi)發(fā)者創(chuàng)立角色或背景故事。OpenAI也在Sora技術(shù)報(bào)告中提出,Sora能夠模擬如視頻游戲的數(shù)字化過(guò)程,根據(jù)官方視頻演示,Sora能在控制《Minecraft》游戲角色進(jìn)行基本操作的同時(shí),高質(zhì)量動(dòng)態(tài)渲染游戲世界。

可以預(yù)見(jiàn),Sora未來(lái)將可能被應(yīng)用生成游戲動(dòng)畫(huà)和場(chǎng)景等,增加游戲情感故事背景提高可玩性,游戲開(kāi)發(fā)者的成本也將隨之降低。簡(jiǎn)言之,又會(huì)有部分人因此面臨崗位變動(dòng)。

03

學(xué)會(huì)使用AI工具

這種背景下,不會(huì)使用AI工具的從業(yè)者將會(huì)伴隨科技進(jìn)步,被時(shí)代無(wú)情淘汰,而掌握AI工具的外行業(yè),跨行也不會(huì)再體會(huì)“翻山越嶺”般的困苦,當(dāng)今大量自媒體從業(yè)者,也有機(jī)會(huì)進(jìn)一步落地自己的創(chuàng)意。

至于賣(mài)課教別人怎么使用AI工具的機(jī)構(gòu),誰(shuí)讓人家先掌握知識(shí)呢,“知識(shí)就是力量”已經(jīng)成為亙古不變的真理,每當(dāng)科技迭代出現(xiàn)新的生產(chǎn)力工具,都會(huì)有相應(yīng)的課程出現(xiàn),當(dāng)年Word的使用也是一門(mén)技術(shù),路邊的打印店甚至招了很多年“打字員”,而如今打字員早已經(jīng)不是一個(gè)職業(yè),而是每個(gè)打工人都必須掌握的技能。

假以時(shí)日,使用AI工具或許也會(huì)成為每個(gè)打工人必須掌握的技能,但就目前而言,這仍是一個(gè)新興就業(yè)崗位,各位也沒(méi)必要因?yàn)榭萍歼M(jìn)步而焦慮,畢竟機(jī)遇總是伴隨危機(jī)出現(xiàn),機(jī)會(huì)也是給有準(zhǔn)備的人。   

© THE END

本文僅作為分享學(xué)習(xí)使用,不構(gòu)成任何投資建議。

本文由貝克街探案官原創(chuàng),未經(jīng)許可,請(qǐng)勿轉(zhuǎn)載。

       原文標(biāo)題 : Openai發(fā)布的Sora,送給A股800億開(kāi)年紅包

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)