劃重點(diǎn)
01零一萬(wàn)物發(fā)布了全新SOTA旗艦?zāi)P蚘i-Lightning,超越GPT-4o,位居世界第一梯隊(duì)大模型公司之列。
02Yi-Lightning在中文子榜單上排名世界第二,與o1-mini等模型并列。
03為此,零一萬(wàn)物采用Mixture of Experts(MoE)混合專家模型架構(gòu),多階段訓(xùn)練模式和混合注意力機(jī)制,降低訓(xùn)推成本。
04同時(shí),零一萬(wàn)物與阿里云、360等頭部企業(yè)達(dá)成合作,推進(jìn)toB業(yè)務(wù)。
05除此之外,零一萬(wàn)物推出AI 2.0數(shù)字人,提供動(dòng)作訓(xùn)練、表情生成等能力,以及AI 2.0門店短視頻解決方案。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
預(yù)訓(xùn)練成本太高,一些公司快要扛不住了;內(nèi)卷得越來(lái)越厲害,各家廠商都是賠錢賺吆喝……在最近國(guó)內(nèi)大模型行業(yè)暗流涌動(dòng)的時(shí)候,零一萬(wàn)物發(fā)布了全新 SOTA 旗艦?zāi)P土料,中?guó)大模型中首度超越 GPT-4o,正面辟謠瘋傳的流言:絕不放棄預(yù)訓(xùn)練,而且做得又快又好。關(guān)注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察超越 GPT-4o,追平 Grok,國(guó)內(nèi)大模型的第一次在對(duì)大模型的測(cè)評(píng)中,LMSYS Org 發(fā)布的 Chatbot Arena,以「盲測(cè)」機(jī)制著稱,是最能反映用戶體驗(yàn)的測(cè)評(píng)標(biāo)準(zhǔn)之一。這一次,零一萬(wàn)物的 Yi-Lightning,排名世界第六,中國(guó)第一,穩(wěn)居世界第一梯隊(duì)大模型公司之列。其中,在中文子榜單上,Yi-Lightning 超越了 xAI 發(fā)布的 Grok-2-08-13、智譜發(fā)布的 GLM-4-Plus 等國(guó)內(nèi)外優(yōu)質(zhì)模型,與 o1-mini 等模型并列排名世界第二。
在零一萬(wàn)物召開(kāi)的線上發(fā)布會(huì)中,李開(kāi)復(fù)展示了一段不同模型對(duì)莎士比亞作品《李爾王》的翻譯。Yi-Lightning 在結(jié)合上下文、轉(zhuǎn)譯微妙的語(yǔ)義方面格外突出,展現(xiàn)了出色的中英互通能力。而這些,恰恰與之前的風(fēng)傳相反:預(yù)訓(xùn)練功不可沒(méi)。上周國(guó)內(nèi)的大模型行業(yè)傳出風(fēng)聲:國(guó)內(nèi)部分模型公司,打算放棄成本高昂的預(yù)訓(xùn)練,不再和國(guó)外大廠硬拼零一萬(wàn)物是被猜測(cè)是其中打算放棄的公司之一!高@個(gè)事情我們就正式辟謠,這個(gè)理解是錯(cuò)誤的。」李開(kāi)復(fù)在發(fā)布會(huì)上說(shuō)。他表示,GPT 新發(fā)布 o1 之后,的確帶來(lái)了新靈感,「一年半以前大家覺(jué)得大模型最厲害的地方就是預(yù)訓(xùn)練,一年以后發(fā)現(xiàn) Post train 也是同樣重要,這感謝 OpenAI 點(diǎn)醒我們這一點(diǎn)。」不過(guò),后訓(xùn)練的重要性變高,不代表要徹底放棄預(yù)訓(xùn)練。
在 Yi-Lightning 的訓(xùn)練過(guò)程中,采用 Mixture of Experts(MoE)混合專家模型架構(gòu),同時(shí)改進(jìn)了單階段訓(xùn)練,使用了多階段的訓(xùn)練模式,并且采用了混合注意力機(jī)制(Hybrid Attention)。在保持模型性能接近最優(yōu)的同時(shí),盡可能減少激活參數(shù)的數(shù)量以降低訓(xùn)推成本,提高推理速度。「中國(guó)的六家大模型公司,只要有夠好的人才,想做預(yù)訓(xùn)練的決心,融資額跟芯片都不會(huì)是問(wèn)題的!估铋_(kāi)復(fù)說(shuō)。「很多人問(wèn)中國(guó)的預(yù)訓(xùn)練是否落后美國(guó)?我們也坦誠(chéng)中國(guó)是落后美國(guó),但有人說(shuō)落后十年、二十年,今天我們可以用非常精確的數(shù)字來(lái)算:GPT4o 在 5 月做出來(lái)的模型,我們?cè)?10 月的今天已經(jīng)把它打敗了。如果真的算中國(guó)趕超美國(guó)有多遠(yuǎn)的距離,至少,零一萬(wàn)物離 OpenAI 的模型,只差五個(gè)月!
在低價(jià)面前,一定是對(duì)性能的保證看得出來(lái),在對(duì)于模型訓(xùn)練的規(guī)劃上,零一萬(wàn)物仍然在「;步ā沟膽(zhàn)略路徑上穩(wěn)定前進(jìn)。有所變化的,是對(duì)商業(yè)化的理解。自從五個(gè)月前發(fā)布千億參數(shù)模型 Yi-Large 之后,零一萬(wàn)物相繼和阿里云、360、順豐科技、飛書(shū)、釘釘、鈦動(dòng)科技等頭部企業(yè)達(dá)成合作,toB 的路子越走越寬!窼aaS 在國(guó)內(nèi),還是一直有很大的問(wèn)題。」李開(kāi)復(fù)解釋道,SaaS 自身有很多不同的模式,比如計(jì)量,比如訂閱,比如分成,都很可持續(xù),但在國(guó)內(nèi)并沒(méi)有一個(gè)普遍被接受的 SaaS 模式!甘滓蝿(wù)就是要尋找少數(shù)能夠按使用情況收費(fèi)的方法,而不是項(xiàng)目定制的方法,能得到比較高利潤(rùn)率的訂單再去做!估铋_(kāi)復(fù)說(shuō)。零一萬(wàn)物對(duì) toB 和 toC 的業(yè)務(wù),有了更明確的側(cè)重。針對(duì)國(guó)內(nèi)的環(huán)境,比如明顯遙遙領(lǐng)先的零售、電商行業(yè),這次推出了「AI 2.0」數(shù)字人,提供了動(dòng)作訓(xùn)練、表情生成等能力,并配備 AI 2.0 門店短視頻解決方案。
而 toC 的探索則主要放在國(guó)外,「我們嘗試了一些產(chǎn)品,有些表現(xiàn)很好,有些沒(méi)有那么好。在國(guó)內(nèi),也在觀察什么時(shí)候適合在國(guó)內(nèi)做什么樣的產(chǎn)品!惯@是考慮到國(guó)內(nèi)的用戶獲取的流量成本,已經(jīng)被一卷再卷得很高,且無(wú)法控制流失率。相比之下,獲客成本較低而且營(yíng)利方式更多元成熟!脯F(xiàn)在當(dāng)下最大的理由還是說(shuō)國(guó)外做 to C 的產(chǎn)品,我們變現(xiàn)能力和消耗用戶增長(zhǎng)的成本算賬可以算得過(guò)來(lái),以后再關(guān)注國(guó)內(nèi)有什么機(jī)會(huì)可以推出!巩(dāng)然,無(wú)論是 toB 還是 toC,對(duì)于模型的追求都是一以貫之的:性能越強(qiáng)越好,價(jià)格越低越好。目前 Yi-Lightning 已上線 Yi 大模型開(kāi)放平臺(tái),每百萬(wàn) token 僅需 0.99 元,直逼行業(yè)最低價(jià),讓人不禁要問(wèn),零一萬(wàn)物也來(lái)卷價(jià)格戰(zhàn)了?「我們還是有利潤(rùn)空間,所以歡迎大家使用,不用擔(dān)心我們被你用垮了!估铋_(kāi)復(fù)解釋道,0.99/百萬(wàn) token 的價(jià)格看似卷起來(lái)了,但實(shí)際應(yīng)用中,調(diào)用量累積下來(lái)還是很大,因此需要把價(jià)格平衡在一個(gè)適當(dāng)?shù)膮^(qū)間,「不會(huì)賠錢賣模型,但也不會(huì)賺很多錢,而是在成本線上加一點(diǎn)點(diǎn)小小的利潤(rùn)」,以保證開(kāi)發(fā)者能在用上優(yōu)秀模型的前提下,再去挑最便宜的。放眼望去,中國(guó)大模型產(chǎn)業(yè)進(jìn)入到了「耐力賽」階段,如何讓大模型賦能千行百業(yè),提升企業(yè)新質(zhì)生產(chǎn)力是一個(gè)重要的命題。這不僅將牽涉到大模型在各個(gè)具體行業(yè)里的未來(lái)發(fā)展方向,甚至?xí)绊懯澜绲膭?chuàng)新版圖。