本報(bào)記者 李昆昆 李正豪 北京報(bào)道
“目前看好的大模型多是國(guó)外的。”談及對(duì)AI公司的看法時(shí),國(guó)內(nèi)某投資機(jī)構(gòu)的投資人接受《中國(guó)經(jīng)營(yíng)報(bào)》記者采訪時(shí)說,“算力只是一方面,數(shù)據(jù)也是一方面。”
不過,在AI大模型上,國(guó)內(nèi)也在加速發(fā)展。據(jù)媒體報(bào)道,字節(jié)跳動(dòng)正在AI大模型領(lǐng)域秘密研發(fā)產(chǎn)品。百度方面也稱將繼續(xù)堅(jiān)定對(duì)生成式AI和基礎(chǔ)模型的投入,為創(chuàng)造新增長(zhǎng)引擎奠定基矗阿里巴巴集團(tuán)智能計(jì)算研究院最近上線了一款新的AI圖片-音頻-視頻模型技術(shù)EMO,官方稱其為“一種富有表現(xiàn)力的音頻驅(qū)動(dòng)的肖像視頻生成框架”。
OpenAI一騎絕塵
2月16日,OpenAI突然推出了文生視頻大模型Sora,引發(fā)熱議。它不僅能夠根據(jù)用戶提供的文本描述生成長(zhǎng)達(dá)60S的視頻,還保證了不錯(cuò)的視頻質(zhì)量。
技術(shù)報(bào)告稱,OpenAI探索了在視頻數(shù)據(jù)上大規(guī)模訓(xùn)練生成模型。具體來說,其在可變持續(xù)時(shí)間、分辨率和縱橫比的視頻和圖像上聯(lián)合訓(xùn)練文本條件擴(kuò)散模型。他們利用一種transformer架構(gòu),該架構(gòu)在視頻和圖像潛在代碼的時(shí)空補(bǔ)丁上運(yùn)行。Sora能夠生成1分鐘的高保真視頻。業(yè)內(nèi)認(rèn)為,擴(kuò)展視頻生成模型是構(gòu)建物理世界通用模擬器的一條有前途的途徑。
2023年,OpenAI收入突破16億美元,成為歷史上營(yíng)收增長(zhǎng)最快的產(chǎn)品公司之一。它目前主要的變現(xiàn)模式有三種:一是軟件開發(fā)者調(diào)用API(應(yīng)用程序編程接口),向其支付流量費(fèi)用;二是ChatGPT Plus會(huì)員每月的訂閱費(fèi)用;三是從微軟銷售OpenAI模型的收入中分成,但低于自己直銷所得的分成。
曾指出Sora生成視頻不合理,質(zhì)疑它擔(dān)不起“世界模型”稱號(hào)的Google,近日推出了人工智能模型“Genie”,一個(gè)能夠生成交互式視頻游戲的AI。它可以根據(jù)用戶提示,將合成圖像、真實(shí)照片、手繪草圖或想法轉(zhuǎn)換成無盡多樣、可互動(dòng)、可控制動(dòng)作的虛擬世界。
Google方面認(rèn)為,現(xiàn)在市面上許多優(yōu)秀模型都能帶來新穎豐富的內(nèi)容。但如果給定一個(gè)來自互聯(lián)網(wǎng)的大量視頻語(yǔ)料庫(kù),不僅能訓(xùn)練模型生成圖像或視頻,還可以創(chuàng)造完整的互動(dòng)體驗(yàn)?zāi)兀繄F(tuán)隊(duì)將其概括為一種全新GenAI(生成式人工智能)范式,并稱由于Genie實(shí)現(xiàn)了人們與想象世界的自由互動(dòng),本質(zhì)上它才是真正的“基礎(chǔ)世界模型”。
為何Sora誕生在美國(guó),不是誕生在中國(guó)呢?上述投資人認(rèn)為,首先,作為大模型的“燃料”,GPU肯定是原因之一,畢竟在美國(guó),H100、A100這樣的芯片還是有的。而在中國(guó),H800、A800這樣的閹割芯片,都不能買了,由此導(dǎo)致的性能差距是一個(gè)重要原因。
其次,和人才也有關(guān),目前美國(guó)在人才上還是有優(yōu)勢(shì)的,畢竟全球頂尖的AI人才,很多都在美國(guó)。
再次,一些積累上的差距,美國(guó)在過去的上百年間,一直是各項(xiàng)科技的領(lǐng)跑者,而我們是追趕者,目前在AI大模型上的表現(xiàn),也并不是很意外。
國(guó)內(nèi)巨頭發(fā)力AI
雖然有差距,但國(guó)內(nèi)企業(yè)也在大力推進(jìn)AI大模型的布局和發(fā)展步伐。
快手方面接受本報(bào)記者采訪時(shí)表示,其在AIGC這塊主要是幾個(gè)重點(diǎn),文生圖大模型可圖、盤古和女媧等。像盤古側(cè)重商業(yè)化這塊,女媧就是公司著力打造的虛擬人。
據(jù)界面報(bào)道,字節(jié)跳動(dòng)旗下剪映已在數(shù)月前組建封閉團(tuán)隊(duì),秘密研發(fā)AI產(chǎn)品。目前,該團(tuán)隊(duì)仍處于嚴(yán)格保密階段,研發(fā)的產(chǎn)品還未上線。
在基礎(chǔ)大模型領(lǐng)域,2023年8月,該公司上線首個(gè)大語(yǔ)言模型“豆包”及多模態(tài)大模型BuboGPT。其抖音云雀大模型通過首批《生成式人工智能服務(wù)管理暫行辦法》備案,面向公眾開放。最近,字節(jié)跳動(dòng)還發(fā)布了文生圖開放模型SDXL-Lightning,該模型能夠在2步或4步內(nèi)生成極高質(zhì)量和分辨率的圖像,將生成速度加快10倍。
2023年在國(guó)內(nèi)市場(chǎng)上,百度在大模型上出拳的體系和章法,領(lǐng)先于國(guó)內(nèi)其他互聯(lián)網(wǎng)公司,可以看出它在人工智能上過往的積累。
為了追趕美國(guó)AI產(chǎn)業(yè),我國(guó)政策層面也在發(fā)力。
2024年春節(jié)后第一個(gè)工作日,國(guó)資委就召開了中央企業(yè)人工智能專題推進(jìn)會(huì)。與會(huì)中國(guó)科學(xué)院院士鄂維南,人工智能頭部企業(yè)百度、華為,以及國(guó)家電網(wǎng)、中國(guó)移動(dòng)等中央企業(yè),都做了交流發(fā)言,席間也提及OpenAI最新發(fā)布的大模型Sora。會(huì)議強(qiáng)調(diào),加快建設(shè)一批智能算力中心,開展AI+專項(xiàng)行動(dòng),構(gòu)建一批產(chǎn)業(yè)多模態(tài)優(yōu)質(zhì)數(shù)據(jù)集等具體舉措。
2023年,阿里巴巴集團(tuán)旗下淘天集團(tuán)啟動(dòng)一項(xiàng)名為“T-Star”的頂尖人才招聘計(jì)劃,延攬全球前沿技術(shù)領(lǐng)域的競(jìng)賽、學(xué)術(shù)和實(shí)戰(zhàn)高手,還配備“大牛”主管和頂級(jí)研發(fā)平臺(tái)資源,年薪百萬(wàn)元起且上不封頂,引發(fā)網(wǎng)友熱議。
一位工AI領(lǐng)域的工程師對(duì)記者說:“我一個(gè)朋友被國(guó)內(nèi)某互聯(lián)網(wǎng)公司挖去做AI,一個(gè)月工資就4萬(wàn)元。”業(yè)內(nèi)稱,現(xiàn)在凡是和AI相關(guān)專業(yè)的,剛畢業(yè)的本科生月薪也能達(dá)到2萬(wàn)元左右,如果是有一定經(jīng)驗(yàn)的高學(xué)歷人才,像碩士或博士,年薪百萬(wàn)元也正常。
2月26日,獵聘大數(shù)據(jù)顯示,獵聘平臺(tái)開工首周新發(fā)職位較2023年開工首周增長(zhǎng)23.63%,處于近五年來最好的增長(zhǎng)水平;而隨著Sora橫空出世,進(jìn)一步強(qiáng)化了AI人才的需求,AIGC相關(guān)崗位需求同比激增超6倍,招聘平均年薪達(dá)到44.37萬(wàn)元。其中AIGC算法工程師、產(chǎn)品經(jīng)理占比分別為18.95%、12.63%,占據(jù)人才需求前兩位,視覺設(shè)計(jì)、自然語(yǔ)言處理、圖像算法位居第三至第五。
相關(guān)招聘渠道顯示,包括百度、字節(jié)跳動(dòng)、萬(wàn)興科技、拓維信息等知名AI軟硬件科技企業(yè)均發(fā)布大量AI人才需求,推出的職位覆蓋圖像算法工程師、AI算法研究員、產(chǎn)品經(jīng)理等,這些崗位在高薪納才方面不遺余力,部分崗位年薪高達(dá)上百萬(wàn)元。
與之對(duì)應(yīng)的,求職者對(duì)AIGC領(lǐng)域投遞簡(jiǎn)歷的熱情也如火如荼。獵聘大數(shù)據(jù)顯示,投遞AIGC領(lǐng)域的人次同比實(shí)現(xiàn)增長(zhǎng)191.55%。在收到投遞人次最多的TOP5職能中,除了算法工程師之外,非技術(shù)崗位如產(chǎn)品經(jīng)理、市場(chǎng)經(jīng)理/主管被投遞的人次占比最多,其中產(chǎn)品經(jīng)理占比居首,為8.02%。在這TOP5職能中,產(chǎn)品經(jīng)理、算法工程師被投遞的人次同比增長(zhǎng)最多,前者增長(zhǎng)近10倍,后者增長(zhǎng)近9倍,側(cè)面印證AI走入應(yīng)用的步伐越來越近。隨著AI人才需求的不斷釋放,科技企業(yè)和AI人才之間也有望實(shí)現(xiàn)雙向奔赴,通用人工智能時(shí)代也有望加速到來。
(編輯:吳清 校對(duì):顏京寧)