編者按:DeepSeek的爆火不僅掀起技術(shù)狂歡,更將中國大模型創(chuàng)業(yè)圈推入價(jià)值重估的十字路口。當(dāng)行業(yè)開始追問“為什么大模型六小虎沒有成為DeepSeek”時(shí),更深層的行業(yè)洗牌暗流已然涌動(dòng)。
在這場價(jià)值重估多維度發(fā)酵之際,《科創(chuàng)板日報(bào)》將推出系列報(bào)道,追蹤國內(nèi)外基礎(chǔ)大模型、AI應(yīng)用創(chuàng)業(yè)及投資的發(fā)展和變化,力求還原一個(gè)真實(shí)、全面且充滿活力的大模型行業(yè)全景,為讀者帶來深度、專業(yè)且富有前瞻性的行業(yè)洞察。
《科創(chuàng)板日報(bào)》2月16日訊(記者 陳美)一石激起千層浪。當(dāng)DeepSeek 以迅猛之勢攪亂 AI 江湖的原有格局之后,之前獨(dú)領(lǐng)風(fēng)騷的AI “六小虎” 正面臨“破局”的關(guān)鍵時(shí)刻。
某央企技術(shù)負(fù)責(zé)人對《科創(chuàng)板日報(bào)》記者表示,“DeepSeek給業(yè)界指了“一條明路”:使用以GRPO為代表的強(qiáng)化學(xué)習(xí),加上高質(zhì)量Long CoT數(shù)據(jù),理論上可令任意通用大模型顯著提升其推理能力;在部分細(xì)分領(lǐng)域,哪怕1.5參數(shù)量的模型,經(jīng)訓(xùn)練后也可達(dá)到媲美o1的效果,這使得大模型訓(xùn)練與推理的算力資源成本大大降低!
最新消息顯示,字節(jié)CEO梁汝波已反思Deepseek,稱跟進(jìn)速度不夠,今年要追求智能上限。OpenAl首席執(zhí)行官SamAltman也宣布GPT 4o升智,智力要達(dá)到o3 pro水平,并表示更新后的GPT 4o還是最好的AI搜索產(chǎn)品。
這意味著2025年大模型領(lǐng)域,將迎來一場全方位的競爭。然而,面對單次預(yù)訓(xùn)練300萬美元的燒錢門檻、8位數(shù)年薪的人才爭奪戰(zhàn)、以及用戶留存與投流成本的剪刀差,以及DeepSeek的攪局、大廠的追擊,在資金儲(chǔ)備、人才密度與用戶增速的路上,AI“六小虎”亟需自行探明。
DeepSeek來了,Kimi首當(dāng)其沖?
在DeepSeek崛起之前,AI“六小虎”在大模型領(lǐng)域嶄露頭角,吸引了大量資本注入。
財(cái)聯(lián)社創(chuàng)投通數(shù)據(jù)顯示,2024年AI“六小虎”融資火爆。其中,月之暗面先后完成超13億美元融資,投后估值高達(dá)33億美元,約220億元;智譜同樣表現(xiàn)亮眼,2024年完成三輪融資,累計(jì)融資額保守估計(jì)超40億元,估值水平也躋身200億元水平。
但高昂的訓(xùn)練成本,對于資金相對薄弱的AI “六小虎”而言,仍是巨大挑戰(zhàn);另一方面,為搶占用戶心智的巨額投流,也讓C端營銷成本不斷攀升。
一位投資人告訴《科創(chuàng)板日報(bào)》記者,由于月之暗面的Kimi與DeepSeek均涉及國內(nèi)to C領(lǐng)域大語言模型,且在技術(shù)路徑上,Kimi與DeepSeek完全不同。因此,在這波沖擊中,Kimi尤為受到關(guān)注。
《科創(chuàng)板日報(bào)》記者了解到,在技術(shù)路線上,智譜、百川智能、零一萬物、MiniMax、階躍星辰,與DeepSeek一樣,都采用了MoE(混合專家)模型,進(jìn)行訓(xùn)練。
在C端產(chǎn)品對壘中,DeepSeek-R1模型發(fā)布的同一天,1月20日Kimi也發(fā)布了Kimi k1.5,并強(qiáng)調(diào)超長邏輯鏈能力,將強(qiáng)化學(xué)習(xí)的上下文窗口擴(kuò)展到128k。
一位不愿具名的投資人向《科創(chuàng)板日報(bào)》記者分析,“128k是指模型‘窗口’的大小,雖然含義是12.8萬個(gè)token,但考慮到輸出性能,比如背后調(diào)用多少算力,且每家模型的token計(jì)費(fèi)邏輯不同。在DeepSeek開源情況下,對應(yīng)Kimi的投流,Kimi k1.5的總體成本應(yīng)該高于DeepSeek。”
“此外,DeepSeek的‘思考’部分很長,在用戶提出同樣問題時(shí),DeepSeek的輸出長度可能是別人的好幾倍。這也可能使得Kimi即便投流,依然陷入獲客成本很高的境地!
用戶活躍度上,Kimi的C端領(lǐng)域標(biāo)桿產(chǎn)品,月活已受到?jīng)_擊。第三方榜單顯示,1月份,豆包以7861萬MAU位列大模型C端產(chǎn)品榜首;第二名則是DeepSeek,為3370萬MAU;Kimi則位列第三,MAU為1943萬。
或許正因如此,在原金沙江投資人、月之暗面聯(lián)合創(chuàng)始人張予彤也做出發(fā)聲。
近日,她在朋友中圈稱,很高興Kimi新版本上線后用戶量又創(chuàng)新高:一是長文本+推理,讓搜索問答更全面,及時(shí)、準(zhǔn)確;二是多模態(tài)能力,文字+圖像輸入,讓Kimi能看懂現(xiàn)實(shí)世界的復(fù)雜問題。
“創(chuàng)新基礎(chǔ)模型架構(gòu)”打響人才、資金之爭
在各公司紛紛接入DeepSeek之時(shí),對于大模型創(chuàng)業(yè)公司來說,逼迫“基礎(chǔ)模型架構(gòu)創(chuàng)新”的時(shí)刻已到來。
多位投資人告訴《科創(chuàng)板日報(bào)》記者,大模型的核心依然是技術(shù)創(chuàng)新!斑@需要加大研發(fā)投入,探索多模態(tài)融合、強(qiáng)化學(xué)習(xí)等新技術(shù)路徑,以提升模型性能和智能化水平。”
歸根結(jié)底,這是一場“人才”的競爭。某產(chǎn)業(yè)機(jī)構(gòu)投資人士表示,人才的價(jià)值,一是在于能及時(shí)調(diào)整和優(yōu)化模型,尋找新的架構(gòu)方向。此次字節(jié)這么快推出全新模型架構(gòu),依賴的也是人才的壁壘,讓企業(yè)“跑得更快”;二是,面向應(yīng)用端的有效落地,比如AI for Science、AI陪伴,AI視頻等,頂尖人才的匯聚,能夠在高價(jià)值領(lǐng)域快速構(gòu)建價(jià)值產(chǎn)品,實(shí)現(xiàn)商業(yè)模式快速驗(yàn)證與直接創(chuàng)收。
字節(jié)得以迅速推出的稀疏架構(gòu),很大程度上也得益于它在AI人才上的積累。2024年,張一鳴已親自下場挖人,包括原阿里通義千問大模型技術(shù)負(fù)責(zé)人周暢加入字節(jié),年薪高達(dá)8位數(shù)。此外,零一萬物原聯(lián)合創(chuàng)始人和預(yù)訓(xùn)練負(fù)責(zé)人黃文灝也選擇加入;智譜AI等公司中多名頂尖AI工程師和研究人員也被傳已跳槽至字節(jié)。
引領(lǐng)當(dāng)前行業(yè)風(fēng)潮的DeepSeek,更是以擅于挖掘人才著稱,并且仍在以百萬年薪“招兵買馬”**。而DeepSeek創(chuàng)始人梁文峰,本身也是浙大“學(xué)霸”,為“極致技術(shù)理想主義者”。
此外,傳統(tǒng)大廠龐大的研發(fā)團(tuán)隊(duì)、海量數(shù)據(jù)資源,也讓“六小虎”感到壓力!坝绕涫牵髲S們不斷推出AI新產(chǎn)品和服務(wù)的能力,以及在基礎(chǔ)設(shè)施建設(shè)、產(chǎn)學(xué)研合作等方面優(yōu)勢明顯,讓行業(yè)競爭加劇!鄙鲜霎a(chǎn)業(yè)機(jī)構(gòu)投資人士認(rèn)為。
與此同時(shí),資金實(shí)力也是不下“牌桌”的關(guān)鍵一環(huán)。
李開復(fù)曾公開透露,一次預(yù)訓(xùn)練成本約三四百萬美元,即便是成本更低的Yi-Lightning,在訓(xùn)練時(shí)也用了2000張GPU,耗時(shí)一個(gè)半月,花費(fèi)三百多萬美元。這意味著在大模型預(yù)訓(xùn)練上,燒錢是公認(rèn)的事實(shí)。
在這方面,相較于“六小虎”而言,大廠、DeepSeek均實(shí)力雄厚。多位投資人表示,“由于有了成本比較,大模型創(chuàng)業(yè)公司的后續(xù)融資,或許與預(yù)期算力消耗有關(guān)”。
雙重夾擊下的“破局”時(shí)刻
DeepSeek、大廠的雙重夾擊,讓AI “六小虎”不得不尋找“破局”之法。
零一萬物已做出選擇。在年初回應(yīng)部分團(tuán)隊(duì)并入阿里的消息的采訪中,李開復(fù)表示,去年5月發(fā)布Yi-Large模型時(shí),團(tuán)隊(duì)已經(jīng)意識(shí)到,模型在速度和性價(jià)比上存在不足,并在當(dāng)時(shí)就決定放棄了原計(jì)劃開發(fā)的超大杯模型Yi-X-Large。
隨著進(jìn)入B端市場,李開復(fù)認(rèn)為,零一萬物2025年的機(jī)會(huì)是挖掘 To B 大模型的PMF。
智譜CEO張鵬在回復(fù)《科創(chuàng)板日報(bào)》記者采訪時(shí)稱,“將All in AGI,其他的都是路徑。而在路徑上,智譜AI每天都在優(yōu)化!
MiniMax方面,1月15日,其已發(fā)布并開源新一代01系列模型,相比Kimi k1.5的12.8萬個(gè)token,01系列模型支持最多400萬個(gè)token的上下文輸入;百川智能則專注于大模型在醫(yī)療領(lǐng)域的應(yīng)用落地,近期其與國家兒童醫(yī)學(xué)中心北京兒童醫(yī)院簽署戰(zhàn)略合作協(xié)議,雙方計(jì)劃共同推出“一大四小”共5款A(yù)I醫(yī)療產(chǎn)品。
某央企技術(shù)負(fù)責(zé)人在接受《科創(chuàng)板日報(bào)》記者采訪時(shí)表示,“DeepSeek的模型架構(gòu)和訓(xùn)練模式,證明了大模型在推理過程中,可生成大量高質(zhì)量訓(xùn)練數(shù)據(jù),這再次印證了行業(yè)對‘合成數(shù)據(jù)’的價(jià)值共識(shí),即構(gòu)建的模型越被使用,高質(zhì)量數(shù)據(jù)越多!
“因此,誰擁有更多用戶,誰就將擁有更多高質(zhì)量的數(shù)據(jù),實(shí)現(xiàn)‘左腳踩右腳’式的模型迭代。”該央企技術(shù)負(fù)責(zé)人稱,也正是這種“自我強(qiáng)化”飛輪效應(yīng),使得DeepSeek實(shí)現(xiàn)了“正循環(huán)”,并以相對優(yōu)勢持續(xù)突破技術(shù)天花板。
在融資上,另有投資機(jī)構(gòu)人士對《科創(chuàng)板日報(bào)》記者表示,面對DeepSeek技術(shù)、開源的優(yōu)勢,AI‘六小虎’亟需證明自己的產(chǎn),特別是“用戶數(shù)”和“留存用戶數(shù)”兩個(gè)關(guān)鍵指標(biāo)。如果沒有規(guī)模增長用戶留存數(shù),其產(chǎn)品、技術(shù)、模型能力可能受到質(zhì)疑,為后續(xù)融資埋下隱患。
另一產(chǎn)業(yè)機(jī)構(gòu)投資人告訴《科創(chuàng)板日報(bào)》記者,大模型的“特色價(jià)值”是關(guān)鍵:“估值的下限是企業(yè)實(shí)力與影響力。對大模型企業(yè)而言,一定要從最基礎(chǔ)、最本質(zhì)的模型下手,提升模型效果,使得其在高價(jià)值場景的具有突出能力、牢固占據(jù)板塊,擁有穩(wěn)定的市場基本盤(即用戶數(shù)),而這通常要求企業(yè)有強(qiáng)大的資金儲(chǔ)備或融資能力,且與成本優(yōu)化、人才隊(duì)伍及企業(yè)愿景息息相關(guān)!
“大模型公司估值的上限,則是企業(yè)服務(wù)的應(yīng)用領(lǐng)域。大模型本身不是創(chuàng)收與壁壘的高地,只有聚焦高價(jià)值應(yīng)用場景,比如醫(yī)藥領(lǐng)域AI For Science等,并在市場形成穩(wěn)固的產(chǎn)品與業(yè)務(wù)壁壘,才是獲取資本信任與長期價(jià)值的關(guān)鍵!
在這方面,智譜、百川智能已在采取進(jìn)一步行動(dòng),除了在自身業(yè)務(wù)上聚焦外,這兩家公司還紛紛成立投資基金,以帶動(dòng)產(chǎn)業(yè)鏈上下游,以推進(jìn)應(yīng)用場景的落地。
(財(cái)聯(lián)社記者 陳美)