日产亚洲一区二区三区,亚洲人成电影在线看片

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-10 10:08:41 瀏覽：172次

導讀：界面新聞記者 | 李如嘉界面新聞編輯 | 文姝琪在OpenAI的“12 Days of Christmas”12天連更計劃的第3天，視頻生成大模型Sora終于正式登場。今年2月16日，OpenAI首次向外界展示了Sora的存在。據(jù)其介紹，Sora可以直接輸出長達60秒的視頻，并且包含高度細致的背景、復雜的多角度鏡頭，以及富有情感的多個角色。OpenAI在官網(wǎng)上公布了數(shù)十個視頻demo，并不斷在社交平臺X上放出由Sora ......

界面新聞記者 | 李如嘉

界面新聞編輯 | 文姝琪

在OpenAI的“12 Days of Christmas”12天連更計劃的第3天，視頻生成大模型Sora終于正式登場。

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場

今年2月16日，OpenAI首次向外界展示了Sora的存在。據(jù)其介紹，Sora可以直接輸出長達60秒的視頻，并且包含高度細致的背景、復雜的多角度鏡頭，以及富有情感的多個角色。OpenAI在官網(wǎng)上公布了數(shù)十個視頻demo，并不斷在社交平臺X上放出由Sora生成的視頻。這些內容被集合推送至OpenAI的TikTok賬號上，短短5天內便獲得了51.3萬次贊，粉絲數(shù)也漲至10.6萬。

盡管“多模態(tài)模型”并不新鮮，文本到視頻的模型也此前已存在，但從OpenAI公布的視頻中可以看到，Sora可以生成的視頻長度和準確性完全顛覆了市場上現(xiàn)有產品的表現(xiàn)，堪稱史上最強文生視頻產品。

Sora不僅為OpenAI帶來了大量粉絲，也讓其估值進一步提升。不過，當時這家公司表示，Sora在短期內不會向大眾開放，因為其“技術仍存在一些缺陷，包括一些空間問題”。

在將近10個月之后，萬眾矚目下，Sora終于在此次系列發(fā)布中重磅登場。

OpenAI表示，2月發(fā)布Sora之后，團隊開發(fā)了其新版本Sora Turbo，其性能有了顯著進步，即日起該版本將作為獨立產品提供給ChatGPT Plus和Pro用戶。

在價格上，20美元一個月的ChatGPT Plus用戶，每月可以生成最多50個視頻，分辨率最高為720p，時長為 5 秒；每月200美元的ChatGPT Pro用戶，每月最多可以生成500個視頻，可以同時生成五個視頻，時長20秒，分辨率最高為1080p，并可下載無水印視頻。

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場

Sora Turbo可以生成最長達20秒的視頻，最高1080p清晰度，有寬屏、豎屏、方屏比例可選。在生成模式上，除了基礎的文本轉視頻 (Text-to-Video)模式，還有文本+圖像轉視頻 (Text+Image-to-Video)模式，利用圖像輔助Sora理解用戶的創(chuàng)作意圖，以及融入特定圖像元素；以及文本+視頻轉視頻 (Text+Video-to-Video)模式，用戶可以上傳已有的視頻，并結合文本描述來對其進行修改或擴展。

此外，Sora Turbo還有多種視頻編輯工具，包括替換、刪除或重新構想視頻中的元素；找到并隔離最佳幀，然后向任一方向延伸它們以完成場景；使用Loop剪輯并創(chuàng)建無縫重復的視頻以及一個名為Storyboard的選項，用戶可以通過它詳細描述希望視頻在不同時間點發(fā)生的內容，從而更好地指導一系列片段的生成。

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場

利用Sora生成的視頻案例

目前，http://sora.com網(wǎng)站已經(jīng)上線，美國及其他市場的ChatGPT付費用戶可以通過該網(wǎng)站開始使用Sora，但在歐洲大部分地區(qū)和英國還需要一段時間才能使用，中國用戶依然受限。

不過，由于實在是太火爆，Sora網(wǎng)站一度被擠到崩潰，OpenAI CEO山姆奧特曼（Sam Altman）表示：“由于需求超出預期，我們將不得不間歇性地關閉新用戶注冊，并且生成內容的速度會在一段時間內減慢�！�

在技術路線上，目前，業(yè)界普遍猜測Sora的成功延續(xù)了OpenAI的Scaling law法則，即通過海量的數(shù)據(jù)，大量的算力，再加上大參數(shù)模型，最終“大力出奇跡”。

OpenAI研究科學家Noam Brown在Sora Turbo發(fā)布后表示，Sora是scale力量最直觀的展示。山姆奧特曼則表示，“大家可以將 Sora看作視頻版的GPT-1�！�

市場預計，Sora的發(fā)布會對視頻制作領域帶來革命性的變化，無論是電影制作、廣告、游戲開發(fā)還是社交媒體，都可以借助視頻生成大模型降低視頻創(chuàng)作的門檻，產生新的機遇。

自今年2月首次預告Sora以來，OpenAI便開始與電影制片廠、媒體高管以及經(jīng)紀公司展開會談。OpenAI還允許一些藝術家、知名演員和導演試用該服務。

OpenAI還表示，Sora是一項理解和模擬現(xiàn)實的基礎性AI技術，是開發(fā)能夠與物理世界互動模型的重要一步。

OpenAI發(fā)布Sora之后，國內互聯(lián)網(wǎng)大廠和大模型公司紛紛跟進視頻大模型這一賽道，包括字節(jié)跳動、快手，今年發(fā)布視頻生成模型的公司還包括阿里云、Minimax、生數(shù)科技、智譜AI等公司。就在最近，騰訊混元大模型也宣布上線視頻生成能力，正式加入競爭激烈的視頻生成賽道。

不過，視頻生成模型領域雖然看起來火熱，也面臨著非常嚴峻的挑戰(zhàn)。近日，百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光，李彥宏在內部講話中稱，Sora這種視頻生成模型的投入周期太長，10年、20年都可能拿不到業(yè)務收益，無論多火爆，百度都不去做。

界面新聞從一位負責視頻生成模型的技術人士處了解到，生成式AI技術正大幅降低視頻生成的門檻，導致視頻數(shù)據(jù)以20倍左右的速度增長，對計算成本和效率提出了嚴峻的挑戰(zhàn)。以Sora模型為例，其訓練和推理所需的算力需求分別達到了GPT-4的4.5倍和近400倍。

中國銀河證券研究院的報告也顯示，Sora對算力需求呈指數(shù)級增長。其根據(jù)Sora參數(shù)規(guī)模推演出的訓練單次算力需求或可達到2.6×10^24Flops，相當于GPT-3175B的8.2倍。目前Sora還在初級階段，伴隨不斷迭代調優(yōu)，其訓練數(shù)據(jù)集規(guī)模將進一步增大，未來算力需求也會大幅增加。

上述技術人士還表示，在編解碼層和框架層，視頻生成模型也面臨著諸多挑戰(zhàn)。一方面是效率的問題，另一方面是在計算需求日益增長的情況下，能否靈活處理越來越復雜的需求。

這些都對視頻生成模型形成巨大考驗，但其在商業(yè)化上的形勢仍然不夠明朗，一定程度上使訓練和推理成本上的挑戰(zhàn)更為嚴峻。

視頻生成模型同時還面臨著安全方面的挑戰(zhàn)。OpenAI表示，為了防止被濫用，用Sora生成的視頻會帶有C2PA元數(shù)據(jù)，表明這些視頻是AI生成的。在上傳圖像和視頻之前，OpenAI還會要求用戶同意使用協(xié)議，包括不得上傳18歲以下未成年的照片、色情或暴力內容、受版權保護的內容。一旦被發(fā)現(xiàn)上傳違禁內容，賬號會被關停。

相關熱詞： openai sora tiktok 網(wǎng)頁

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-10 10:08:41 瀏覽：172次

相關內容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內容

在線客服

熱門欄目HotCates

關于我們

版權聲明

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-10 10:08:41 瀏覽：172次

相關內容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內容

在線客服

熱門欄目HotCates

關于我們

版權聲明

網(wǎng)頁擠崩潰，OpenAI視頻生成大模型Sora終于正式登場
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-10 10:08:41 瀏覽：172次