OpenAI首個AI視頻模型Sora的顛覆與爭議
【編輯推薦】有人說,這是影響影視行業(yè)和未來技術發(fā)展的又一顛覆性事件?,也難怪大家驚呼“現(xiàn)實,不存在了!”不過,Sora和文生圖一樣,普遍存在生成內容不夠精確,所以離真正顛覆影視行業(yè)還有很大一段距離。可以肯定的是,這些新的工具和產品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來,未來誰能快速掌握這些AI工具和技術的使用,誰才是真正的掌控者。
太炸裂了!2月16日凌晨,OpenAI在社交平臺X上宣布,正在開發(fā)一款名為Sora的新模型。
Sora可以做什么?它的主要功能是把文本描述轉化為視頻,它能夠理解并執(zhí)行詳細的文本指令,從而生成具有視覺質量和連貫性的視頻。這些視頻可以包含多個角色、動作和場景,還可以根據(jù)提示的主題和背景,精準生成影片內容,呈現(xiàn)復雜的攝影機運鏡,影片長度最多為60秒。除了根據(jù)文字產生影片外,它還能夠從靜態(tài)圖像生成動畫,或擴展現(xiàn)有視頻。
雖然,目前它尚未對大眾開放使用,不過消息一出,它已經在網絡上引發(fā)討論,很多人表示大為震撼。
來看一組展示,一位時尚女性走在霓虹閃爍的東京街頭;一位20多歲的年輕人正在一片云上讀書,中國龍慶祝中國新年……其實它的獨特之處在于,它不再是一種創(chuàng)造性工具,更像是一個“數(shù)據(jù)驅動的物理引擎”。它不僅了解用戶在提示中提出的要求,然后根據(jù)你的需求生成圖像,還能確定環(huán)境中對象的物理特性,并根據(jù)這些計算渲染視頻。
有人說,這是影響影視行業(yè)和未來技術發(fā)展的又一顛覆性事件?。也難怪大家驚呼,現(xiàn)實,不存在了!
而這些能夠實現(xiàn)背后依靠的是擴散模型,這意味著Sora會從模糊充滿靜態(tài)的視頻開始生成,然后再慢慢將其平滑處理成你看到的精美版本。
我們知道之前發(fā)布的Midjourney和Stable Diffusio也是擴散模型,但不得不說,Sora制作的視頻比它們更長、更有活力、也更流暢。
Sora感覺像是創(chuàng)建了一個真實的視頻,而Midjourney和Stable Diffusio模型感覺像是人工智能圖像的定格動畫。不過Sora目前還是一個未完成的產品,它可能難以消化復雜的物理或空間細節(jié),進而導致它生成不合邏輯的影片,比如人類在跑步機上跑錯方向、比如可能會生成一個人咬餅干的視頻,但之后餅干可能沒有咬痕。并且可能會難以遵循特定的運鏡軌跡。
OpenAI表示該模型缺乏空間意識可能會混淆左右,并且不理解人或物體如何與場景交互。可以看出,Sora和文生圖一樣,普遍存在生成內容不夠精確的問題,所以,從這個角度而言,它離真正顛覆影視行業(yè)還有很大一段距離。隨著這兩年人工智能熱潮的持續(xù)推進,相關產品也備受爭議。但不得不承認,這些新的工具和產品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來。未來誰能快速掌握這些AI工具和技術,誰才是真正的掌控者。
原文標題 : OpenAI首個AI視頻模型Sora的顛覆與爭議
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市