爆火的Sora,摩拳擦掌的出海人
作者 | 麻吉編輯 | 劉景豐
一年前AI智能涌現(xiàn)的場景又重現(xiàn)。2024開年,Sora就引發(fā)了全球科技圈的集體躁動。當?shù)貢r間2月15日,OpenAI發(fā)布最新視頻生成模型Sora。根據(jù)OpenAI描述,Sora可根據(jù)用戶輸入的簡短文本指令,生成長達1分鐘的高清視頻,并創(chuàng)建具有多個角色、特定類型的運動以及準確的主題和背景細節(jié)的復雜場景。讓全球受眾感到驚嘆的,是Sora生成視頻中極具真實感的畫面呈現(xiàn),甚至還帶著些許電影質感。
圖源:OpenAI網(wǎng)站截圖
在OpenAI發(fā)布的一系列不同主題視頻中,不論是戴墨鏡女子走在東京街頭的場景,或是動畫人物的細節(jié)塑造,雖然這些內(nèi)容完全由AI生成,但其中細節(jié)呈現(xiàn)出的畫面真實感已經(jīng)進入一個全新維度。這讓不少網(wǎng)友感嘆,現(xiàn)實的邊界正在數(shù)字世界中變得愈發(fā)模糊。正如OpenAI 在Sora技術報告的標題中赫然寫道的,“ Sora 這類視頻生成模型是「世界的模擬器」”。
對中國出海企業(yè)來說,AI技術推動下內(nèi)容生產(chǎn)力的大幅提升,也將進一步助力產(chǎn)業(yè)升級,并加速企業(yè)的全球化步伐。而TikTok平臺上,已經(jīng)開始充斥各種由AI生成的視頻瘋狂吸粉。
去年初,OpenAI發(fā)布的大語言模型ChatGPT掀起了一輪人工智能的熱潮。ChatGPT上線后,幾乎所有全球科技大廠都全速投入AI領域,發(fā)布了自己的大語言模型,影響著人們?nèi)粘K阉餍畔、查找資料的方式發(fā)生改變。而文生視頻模型Sora的發(fā)布,更直觀地呈現(xiàn)了AI技術正在以何種速度飛速發(fā)展。在社交媒體X上一條Sora演示視頻下方,特斯拉創(chuàng)始人馬斯克發(fā)表評價說“gg 人類”(gg為Good Games縮寫,代指“打得好,我認輸”)。他還表示,由人工智能增強的人類,將會在未來幾年之內(nèi)創(chuàng)作出最杰出的作品。360集團創(chuàng)始人、董事長周鴻祎則表示,Sora的誕生意味著AGI的實現(xiàn)將從10年縮短至1年。“Sora把AI視頻能力推到了一個新的階段,是走向實用化的開始。
視頻生產(chǎn)成本將大幅降低,所需要的技能也將和以前完全不同。以前的技能是如何找到優(yōu)質的拍攝團隊,場地,以及合適的價格進行產(chǎn)品視頻拍攝,如何協(xié)調和溝通。之后的技能是如何寫prompt,如何讓AI把自己的產(chǎn)品不失真的融入到視頻里,如何讓視頻看起來真實清晰有質感。”Passioncy創(chuàng)始人郭林告訴霞光社。就在近日,OpenAI的TikTok賬號上,各種由AI生成的視頻瘋狂吸粉,在短短數(shù)天時間內(nèi)吸粉超10萬,獲得超50萬次點贊。網(wǎng)友們紛紛留言感慨,短視頻創(chuàng)作者是否即將會被AI搶了飯碗,甚至連TikTok平臺都會受到影響。雖然Sora還未正式開放給用戶使用,但已經(jīng)在資本市場掀起波瀾。市場預計,在最新一輪由風投公司ThriveCapital牽頭的融資中,OpenAI的估值有望超過800億美元。作為對比,去年年初OpenAI發(fā)布ChatGPT不久后的估值約為290億美元。
圖源:Unsplash
而在Sora發(fā)布次日,幾家美國科技公司的股價便應聲跌落。據(jù)媒體報道,美國電腦軟件公司Adobe股價暴跌超7%;美國圖片庫、圖片素材、圖片音樂和編輯工具供應商Shutterstock跌超5%;幾周前發(fā)布了“文生視頻”工具Lumiere的谷歌母公司股價下挫1.58%。一天以內(nèi),這三家公司的市值就合計蒸發(fā)了近480億美元(折合人民幣近3500億元)。
對不少行業(yè)來說,Sora就像是一顆“重磅炸彈”,讓從業(yè)者在展望未來時既興奮又感到惶恐不安。其中,影視業(yè)首當其沖。在傳統(tǒng)的影視制作過程中,后期及特效制作往往需要投入大量人力、物力和時間,而Sora等AI工具將大大降低這些成本,幫助影視制作公司快速創(chuàng)建出高質量的視頻片段,縮短制作周期。在正舉行的柏林電影節(jié)上,Sora就成為電影人熱議的話題之一。據(jù)外媒報道,洛杉磯導演戴夫·克拉克(Dave Clark)認為,創(chuàng)作者需要接受人工智能技術來制作尚未想象或實現(xiàn)的內(nèi)容,而不是感到威脅。德國視覺特效工作室Trixter的董事總經(jīng)理克里斯蒂娜·卡斯珀斯-羅默(Christina Caspers-Roemer)則表示,像Sora這樣的人工智能工具被證明在工作流程中更高效、更快,但即便如此,電影和電視制作將仍然以人類創(chuàng)作為基礎。“最終我們的客戶總會回到現(xiàn)實世界。”她說。
從ChatGPT、DALL-E3,再到Sora,AI內(nèi)容創(chuàng)作已經(jīng)從圖文席卷至視頻創(chuàng)作領域。而實際上,Sora并不是第一個受到關注的文生視頻大模型。近年,全球科技大廠幾乎無一例外地重金投入人工智能領域,并計劃在未來持續(xù)甚至加大投入。在Sora正式亮相以前,大部分全球頭部科技企業(yè)就已擁有自己的文生視頻大模型。去年11月,文生視頻模型迎來了一波爆發(fā)。11月3日,Runway發(fā)布Gen-2更新,支持4K清晰度作品;11月16日,Meta發(fā)布文生視頻大模型Emu Video;11月18日,字節(jié)跳動發(fā)布PixelDance;11月21日,Stability AI發(fā)布生成式視頻模型Stable Video Diffusion……今年1月,谷歌也發(fā)布了視頻生成模型Lumiere,專門用于將文本轉換為視頻。目前,Sora仍處于開發(fā)早期階段,OpenAI表示,當前的模式仍然存在不少弱點。
Sora可能難以準確模擬復雜場景的物理原理,也可能無法理解因果關系的具體實例。例如,一個人可能咬了一口餅干,但之后,餅干上可能沒有咬痕。此外,該模型還可能混淆提示的空間細節(jié),例如混淆左和右,并且可能難以精確描述隨時間發(fā)生的事件。而細心的網(wǎng)友也在Sora的演示視頻中發(fā)現(xiàn)了不少Bug。“比如在Sora生成的一個視頻中,呈現(xiàn)的是中國農(nóng)歷新年舞龍的場景,雖然視頻里龍身上和建筑上的文字很像是中國書法撰寫的字體,但實際上并不是中國字,誰也不認識寫的是什么,感覺只是AI臆想出來的中文。另一個視頻里的貓,動起來的時候有三只前腳。”關注AI行業(yè)的一名讀者向霞光社表示。
圖源:OpenAI網(wǎng)站截圖
但即使如此,不論在生成視頻時長、實現(xiàn)單視頻多機位、擁有精準物理規(guī)則的真實世界等技術層面,Sora均已實現(xiàn)“碾壓式”領先其他文生視頻模型,推動AI視頻生成進入了一個新的時代。
Sora這樣的生成式AI工具,在降低成本和提高效率方面的顯著優(yōu)勢,為內(nèi)容創(chuàng)作、廣告娛樂等行業(yè)帶來了前所未有的發(fā)展契機,也讓不同類型的中國出海企業(yè)看到了機會。此前,一些企業(yè)將ChatGPT應用于多個場景之中,實現(xiàn)降本增效。AMZ123的一項調查數(shù)據(jù)顯示,2023年,有33%的跨境公司使用ChatGPT,另有將近15%的公司預計將投入使用。如今Sora尚未完全開放使用,但可以想見,通過更精準的生成式人工智能,不論是制作TikTok等平臺短視頻,或是為自己的產(chǎn)品制作介紹視頻和推廣營銷視頻,都將能大大降低成本、提升效率。
“如何通過AI來生產(chǎn)真正能落地的視頻,是大家開始摸索的東西。Sora給行業(yè)帶來了顛覆性的影響,誰先用上包括Sora在內(nèi)的新AI技術,誰就能吃到第一波行業(yè)紅利。”Passioncy創(chuàng)始人郭林說,“中國公司出?隙ㄒ浞掷煤矛F(xiàn)有的AI能力。對于中小企業(yè),尤其很多工貿(mào)一體企業(yè)來說,難度其實是非常高的。這也是我們目前希望提供幫助的一個方向。”一名廣告行業(yè)資深從業(yè)者也告訴霞光社,她認為Sora將顛覆旅游、生活方式和服務行業(yè)的內(nèi)容。隨著視頻制作過程變得更簡單,大品牌廣告和小品牌廣告之間的界限將逐步縮小,而“講故事”等內(nèi)容創(chuàng)意環(huán)節(jié),將再次成為廣告中最重要的因素。
圖源:Unsplash
而在游戲出海領域,Share Creators創(chuàng)始人兼CEO Ada Liu認為,視頻生成帶來的改變將是“跨時代”的。
“在游戲行業(yè), AI可以幫助生成前期的概念圖,UI icon等。計算機圖形制作的流程非常長,從3D制作,到渲染、合成,每個環(huán)節(jié)都需要投入大量專業(yè)的人員。尤其在風格探索階段,如果直接生產(chǎn)出視頻,相當于直接跳到最后一步,節(jié)省了大量的制作時間和成本。”但 Ada Liu同時認為,AI生成內(nèi)容想要完全取代人工還存在不少距離。“可能再發(fā)展一兩年,能取代2D部分的一些低端批量制作工種。但主美之類定方向的美術人員,是不會被取代的。畢竟一個產(chǎn)品的美術風格需要人來選擇。”Ada表示,Sora的演示視頻效果令人印象深刻,但還是要關注實際上的效果,因為目前無法試用,只能等等看。
而郭林也認為,目前AI工具距離產(chǎn)出“真正能落地”的視頻,主要差距仍在于內(nèi)容真實性,以及工具易用性兩個方面。根據(jù)IDC的預測,未來五年內(nèi),AIGC對于營銷、軟件測試等行業(yè)將帶來巨大影響。到2025年,35%的企業(yè)將掌握使用生成式人工智能來開發(fā)數(shù)字產(chǎn)品和服務。到2026年,生成式AI將承擔42%的傳統(tǒng)營銷瑣碎任務,如搜索引擎優(yōu)化、內(nèi)容和網(wǎng)站優(yōu)化、客戶數(shù)據(jù)分析、細分、潛在客戶評分以及超級個性化。到2028年,基于生成式AI的工具將能夠編寫80%的軟件測試工作,從而減少對人工測試的需求,提高測試覆蓋率、軟件可用性和代碼質量?梢灶A見的是,即便AI生成內(nèi)容仍然面臨道德和濫用方面的潛在風險,但其在創(chuàng)造力和效率方面的無限潛力,將持續(xù)吸引全球科技巨頭的加碼投入和爭奪。
原文標題 : 爆火的Sora,摩拳擦掌的出海人
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市