2024年,AI視頻生成技術(shù)迎來(lái)了爆炸性的發(fā)展,成為了科技圈和投資界的熱門話題。這項(xiàng)技術(shù)以其巨大的潛力和廣泛的應(yīng)用前景,吸引了無(wú)數(shù)企業(yè)和研究者的目光。然而,隨著技術(shù)的飛速發(fā)展,行業(yè)內(nèi)部的挑戰(zhàn)和危機(jī)也逐漸顯露。
在一個(gè)充滿不確定性的AI時(shí)代,我們似乎又站在了一個(gè)分叉路口前,選擇哪條路,成了擺在每個(gè)AI從業(yè)者和企業(yè)面前的難題。
AI視頻生成,這個(gè)曾經(jīng)被認(rèn)為遙不可及的技術(shù),現(xiàn)在卻成了眾多廠商競(jìng)相追逐的香餑餑。
而我,作為一個(gè)見證了AI技術(shù)從起步到蓬勃發(fā)展的觀察者,對(duì)這一現(xiàn)象有著自己的一些看法。
首先,讓我們回顧一下這個(gè)現(xiàn)象的背景。
自從OpenAI Sora的問(wèn)世,再到快手的可靈全量上線,視頻生成技術(shù)無(wú)疑成了2024年最火熱的AI話題。
大廠們紛紛開始你追我趕,從4月至今,視頻生產(chǎn)模型如雨后春筍般涌現(xiàn)。
而國(guó)內(nèi)的“大模型六小虎”(智譜、月之暗面、MiniMax、百川智能、階躍星辰、零一萬(wàn)物)也在這個(gè)關(guān)鍵的決策點(diǎn)上搖擺不定。
我的觀點(diǎn)是,視頻生成技術(shù)之所以能引起如此大的關(guān)注,一方面是因?yàn)槠浼夹g(shù)潛力巨大,另一方面則是因?yàn)槭袌?chǎng)對(duì)于新故事的渴望。
在語(yǔ)言模型迭代放緩的當(dāng)下,視頻生成模型似乎成了那個(gè)更有希望的AI應(yīng)用新方向。
但這個(gè)方向并不是沒(méi)有風(fēng)險(xiǎn),高昂的成本和尚未成熟的技術(shù)路線,都讓這個(gè)領(lǐng)域的前景充滿了不確定性。
就拿我自己的經(jīng)歷來(lái)說(shuō),我曾經(jīng)參與過(guò)一個(gè)基于AI的視頻生成項(xiàng)目。
我們團(tuán)隊(duì)投入了大量的時(shí)間和資源,試圖打造一個(gè)能夠根據(jù)文本描述生成視頻內(nèi)容的模型。
雖然最終我們?nèi)〉昧艘恍┏晒@個(gè)過(guò)程中的挑戰(zhàn)和困難也讓我們深刻認(rèn)識(shí)到,視頻生成技術(shù)的復(fù)雜性和成本。
技術(shù)層面的挑戰(zhàn)。
視頻生成模型需要處理大量的數(shù)據(jù),包括圖像、音頻和視頻等多種形式。
這不僅要求模型具備強(qiáng)大的數(shù)據(jù)處理能力,還需要能夠理解和生成復(fù)雜的場(chǎng)景和動(dòng)作。
而這些,都需要大量的算力和數(shù)據(jù)支持。
據(jù)Meta的數(shù)據(jù),Movie Gen用了6144張H100進(jìn)行訓(xùn)練,視頻模型參數(shù)達(dá)到30B(300億)。
這樣的資源投入,對(duì)于大多數(shù)初創(chuàng)公司來(lái)說(shuō),無(wú)疑是一個(gè)巨大的門檻。
市場(chǎng)接受度的問(wèn)題。
雖然視頻生成技術(shù)看起來(lái)很酷,但用戶是否真的愿意為之買單,還是一個(gè)未知數(shù)。
目前,視頻生成領(lǐng)域的頂級(jí)模型幾乎都選擇了閉源,這意味著玩家們需要投入真金白銀去試錯(cuò)。
而一旦開始商業(yè)化,付費(fèi)已是必選項(xiàng)。
但用戶是否愿意為這種新型的內(nèi)容生成方式買單,還需要市場(chǎng)的檢驗(yàn)。
內(nèi)容生態(tài)的構(gòu)建。
視頻生成技術(shù)的發(fā)展,離不開一個(gè)健康的內(nèi)容生態(tài)。
這意味著,除了技術(shù)本身,還需要構(gòu)建一個(gè)能夠持續(xù)產(chǎn)生優(yōu)質(zhì)內(nèi)容的生態(tài)系統(tǒng)。
這不僅需要技術(shù)的支持,更需要內(nèi)容創(chuàng)作者、平臺(tái)和用戶的共同參與。
快手的可靈就是一個(gè)典型的例子,它通過(guò)懷舊照片等一系列策劃,成功吸引了大量用戶的關(guān)注。
監(jiān)管和倫理的問(wèn)題。
視頻生成技術(shù)的發(fā)展,也帶來(lái)了一些監(jiān)管和倫理上的挑戰(zhàn)。
比如,如何確保生成的內(nèi)容不侵犯他人的版權(quán),如何防止技術(shù)被用于制造虛假信息等。
這些問(wèn)題的解決,需要政策制定者、技術(shù)開發(fā)者和社會(huì)各界的共同努力。
總的來(lái)說(shuō),視頻生成技術(shù)的發(fā)展,既充滿了機(jī)遇,也充滿了挑戰(zhàn)。
對(duì)于企業(yè)和創(chuàng)業(yè)者來(lái)說(shuō),選擇是否進(jìn)入這個(gè)領(lǐng)域,需要慎重考慮。
而對(duì)于我們這些觀察者來(lái)說(shuō),更應(yīng)該保持理性和客觀的態(tài)度,既要看到技術(shù)發(fā)展帶來(lái)的積極影響,也要關(guān)注其可能帶來(lái)的風(fēng)險(xiǎn)和挑戰(zhàn)。
在這個(gè)充滿變數(shù)的AI時(shí)代,只有不斷學(xué)習(xí)和適應(yīng),才能把握住時(shí)代的脈搏。
作者:產(chǎn)品視界,公眾號(hào):產(chǎn)品視界
本文由 @產(chǎn)品視界 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Sora視頻截圖
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)