www插插插无码视频网站,亚洲国产综合精品2020

國(guó)產(chǎn)大模型首超GPT-4o，李開(kāi)復(fù)：中美頂尖模型的時(shí)間差只有五個(gè)月

來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-16 19:45:40 瀏覽：1870次

導(dǎo)讀：劃重點(diǎn) 01零一萬(wàn)物發(fā)布了全新SOTA旗艦?zāi)Ｐ蚘i-Lightning，超越GPT-4o，位居世界第一梯隊(duì)大模型公司之列。 02Yi-Lightning在中文子榜單上排名世界第二，與o1-mini等模型并列。 03為此，零一萬(wàn)物采用Mixture of Experts(MoE)混合專家模型架構(gòu)，多階段訓(xùn)練模式和...

劃重點(diǎn)

01零一萬(wàn)物發(fā)布了全新SOTA旗艦?zāi)Ｐ蚘i-Lightning，超越GPT-4o，位居世界第一梯隊(duì)大模型公司之列。

02Yi-Lightning在中文子榜單上排名世界第二，與o1-mini等模型并列。

03為此，零一萬(wàn)物采用Mixture of Experts(MoE)混合專家模型架構(gòu)，多階段訓(xùn)練模式和混合注意力機(jī)制，降低訓(xùn)推成本。

04同時(shí)，零一萬(wàn)物與阿里云、360等頭部企業(yè)達(dá)成合作，推進(jìn)toB業(yè)務(wù)。

05除此之外，零一萬(wàn)物推出AI 2.0數(shù)字人，提供動(dòng)作訓(xùn)練、表情生成等能力，以及AI 2.0門店短視頻解決方案。

以上內(nèi)容由騰訊混元大模型生成，僅供參考

預(yù)訓(xùn)練成本太高，一些公司快要扛不住了；內(nèi)卷得越來(lái)越厲害，各家廠商都是賠錢賺吆喝……在最近國(guó)內(nèi)大模型行業(yè)暗流涌動(dòng)的時(shí)候，零一萬(wàn)物發(fā)布了全新 SOTA 旗艦?zāi)Ｐ土料�，中�?guó)大模型中首度超越 GPT-4o，正面辟謠瘋傳的流言：絕不放棄預(yù)訓(xùn)練，而且做得又快又好。關(guān)注 AI 第一新媒體，率先獲取 AI 前沿資訊和洞察超越 GPT-4o，追平 Grok，國(guó)內(nèi)大模型的第一次在對(duì)大模型的測(cè)評(píng)中，LMSYS Org 發(fā)布的 Chatbot Arena，以「盲測(cè)」機(jī)制著稱，是最能反映用戶體驗(yàn)的測(cè)評(píng)標(biāo)準(zhǔn)之一。這一次，零一萬(wàn)物的 Yi-Lightning，排名世界第六，中國(guó)第一，穩(wěn)居世界第一梯隊(duì)大模型公司之列。其中，在中文子榜單上，Yi-Lightning 超越了 xAI 發(fā)布的 Grok-2-08-13、智譜發(fā)布的 GLM-4-Plus 等國(guó)內(nèi)外優(yōu)質(zhì)模型，與 o1-mini 等模型并列排名世界第二。國(guó)產(chǎn)大模型首超GPT-4o，李開(kāi)復(fù)：中美頂尖模型的時(shí)間差只有五個(gè)月

在零一萬(wàn)物召開(kāi)的線上發(fā)布會(huì)中，李開(kāi)復(fù)展示了一段不同模型對(duì)莎士比亞作品《李爾王》的翻譯。Yi-Lightning 在結(jié)合上下文、轉(zhuǎn)譯微妙的語(yǔ)義方面格外突出，展現(xiàn)了出色的中英互通能力。而這些，恰恰與之前的風(fēng)傳相反：預(yù)訓(xùn)練功不可沒(méi)。上周國(guó)內(nèi)的大模型行業(yè)傳出風(fēng)聲：國(guó)內(nèi)部分模型公司，打算放棄成本高昂的預(yù)訓(xùn)練，不再和國(guó)外大廠硬拼零一萬(wàn)物是被猜測(cè)是其中打算放棄的公司之一�！高@個(gè)事情我們就正式辟謠，這個(gè)理解是錯(cuò)誤的。」李開(kāi)復(fù)在發(fā)布會(huì)上說(shuō)。他表示，GPT 新發(fā)布 o1 之后，的確帶來(lái)了新靈感，「一年半以前大家覺(jué)得大模型最厲害的地方就是預(yù)訓(xùn)練，一年以后發(fā)現(xiàn) Post train 也是同樣重要，這感謝 OpenAI 點(diǎn)醒我們這一點(diǎn)。」不過(guò)，后訓(xùn)練的重要性變高，不代表要徹底放棄預(yù)訓(xùn)練。國(guó)產(chǎn)大模型首超GPT-4o，李開(kāi)復(fù)：中美頂尖模型的時(shí)間差只有五個(gè)月

在 Yi-Lightning 的訓(xùn)練過(guò)程中，采用 Mixture of Experts（MoE）混合專家模型架構(gòu)，同時(shí)改進(jìn)了單階段訓(xùn)練，使用了多階段的訓(xùn)練模式，并且采用了混合注意力機(jī)制（Hybrid Attention）。在保持模型性能接近最優(yōu)的同時(shí)，盡可能減少激活參數(shù)的數(shù)量以降低訓(xùn)推成本，提高推理速度。「中國(guó)的六家大模型公司，只要有夠好的人才，想做預(yù)訓(xùn)練的決心，融資額跟芯片都不會(huì)是問(wèn)題的�！估铋_(kāi)復(fù)說(shuō)。「很多人問(wèn)中國(guó)的預(yù)訓(xùn)練是否落后美國(guó)？我們也坦誠(chéng)中國(guó)是落后美國(guó)，但有人說(shuō)落后十年、二十年，今天我們可以用非常精確的數(shù)字來(lái)算：GPT4o 在 5 月做出來(lái)的模型，我們?cè)?10 月的今天已經(jīng)把它打敗了。如果真的算中國(guó)趕超美國(guó)有多遠(yuǎn)的距離，至少，零一萬(wàn)物離 OpenAI 的模型，只差五個(gè)月�！�

在低價(jià)面前，一定是對(duì)性能的保證看得出來(lái)，在對(duì)于模型訓(xùn)練的規(guī)劃上，零一萬(wàn)物仍然在「�；步ā沟膽�(zhàn)略路徑上穩(wěn)定前進(jìn)。有所變化的，是對(duì)商業(yè)化的理解。自從五個(gè)月前發(fā)布千億參數(shù)模型 Yi-Large 之后，零一萬(wàn)物相繼和阿里云、360、順豐科技、飛書(shū)、釘釘、鈦動(dòng)科技等頭部企業(yè)達(dá)成合作，toB 的路子越走越寬�！窼aaS 在國(guó)內(nèi)，還是一直有很大的問(wèn)題。」李開(kāi)復(fù)解釋道，SaaS 自身有很多不同的模式，比如計(jì)量，比如訂閱，比如分成，都很可持續(xù)，但在國(guó)內(nèi)并沒(méi)有一個(gè)普遍被接受的 SaaS 模式�！甘滓蝿�(wù)就是要尋找少數(shù)能夠按使用情況收費(fèi)的方法，而不是項(xiàng)目定制的方法，能得到比較高利潤(rùn)率的訂單再去做�！估铋_(kāi)復(fù)說(shuō)。零一萬(wàn)物對(duì) toB 和 toC 的業(yè)務(wù)，有了更明確的側(cè)重。針對(duì)國(guó)內(nèi)的環(huán)境，比如明顯遙遙領(lǐng)先的零售、電商行業(yè)，這次推出了「AI 2.0」數(shù)字人，提供了動(dòng)作訓(xùn)練、表情生成等能力，并配備 AI 2.0 門店短視頻解決方案。國(guó)產(chǎn)大模型首超GPT-4o，李開(kāi)復(fù)：中美頂尖模型的時(shí)間差只有五個(gè)月

而 toC 的探索則主要放在國(guó)外，「我們嘗試了一些產(chǎn)品，有些表現(xiàn)很好，有些沒(méi)有那么好。在國(guó)內(nèi)，也在觀察什么時(shí)候適合在國(guó)內(nèi)做什么樣的產(chǎn)品�！惯@是考慮到國(guó)內(nèi)的用戶獲取的流量成本，已經(jīng)被一卷再卷得很高，且無(wú)法控制流失率。相比之下，獲客成本較低而且營(yíng)利方式更多元成熟�！脯F(xiàn)在當(dāng)下最大的理由還是說(shuō)國(guó)外做 to C 的產(chǎn)品，我們變現(xiàn)能力和消耗用戶增長(zhǎng)的成本算賬可以算得過(guò)來(lái)，以后再關(guān)注國(guó)內(nèi)有什么機(jī)會(huì)可以推出�！巩�(dāng)然，無(wú)論是 toB 還是 toC，對(duì)于模型的追求都是一以貫之的：性能越強(qiáng)越好，價(jià)格越低越好。目前 Yi-Lightning 已上線 Yi 大模型開(kāi)放平臺(tái)，每百萬(wàn) token 僅需 0.99 元，直逼行業(yè)最低價(jià)，讓人不禁要問(wèn)，零一萬(wàn)物也來(lái)卷價(jià)格戰(zhàn)了？「我們還是有利潤(rùn)空間，所以歡迎大家使用，不用擔(dān)心我們被你用垮了�！估铋_(kāi)復(fù)解釋道，0.99/百萬(wàn) token 的價(jià)格看似卷起來(lái)了，但實(shí)際應(yīng)用中，調(diào)用量累積下來(lái)還是很大，因此需要把價(jià)格平衡在一個(gè)適當(dāng)?shù)膮^(qū)間，「不會(huì)賠錢賣模型，但也不會(huì)賺很多錢，而是在成本線上加一點(diǎn)點(diǎn)小小的利潤(rùn)」，以保證開(kāi)發(fā)者能在用上優(yōu)秀模型的前提下，再去挑最便宜的。放眼望去，中國(guó)大模型產(chǎn)業(yè)進(jìn)入到了「耐力賽」階段，如何讓大模型賦能千行百業(yè)，提升企業(yè)新質(zhì)生產(chǎn)力是一個(gè)重要的命題。這不僅將牽涉到大模型在各個(gè)具體行業(yè)里的未來(lái)發(fā)展方向，甚至?xí)绊懯澜绲膭?chuàng)新版圖。

國(guó)產(chǎn)大模型首超GPT-4o，李開(kāi)復(fù)：中美頂尖模型的時(shí)間差只有五個(gè)月
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-16 19:45:40 瀏覽：1870次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

國(guó)產(chǎn)大模型首超GPT-4o，李開(kāi)復(fù)：中美頂尖模型的時(shí)間差只有五個(gè)月 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-16 19:45:40 瀏覽：1870次