劃重點(diǎn)
01零一萬(wàn)物發(fā)布新旗艦?zāi)P蚘i-Lightning,在國(guó)際權(quán)威盲測(cè)榜單LMSYS上超越OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國(guó)第一。
02創(chuàng)始人李開(kāi)復(fù)表示,Yi-Lightning是「頂級(jí)模型白菜價(jià)」,成本線上加一點(diǎn)點(diǎn)小小的利潤(rùn),每百萬(wàn)token僅需0.99元。
03除此之外,零一萬(wàn)物首度公布全新ToB戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人,聚焦零售和電商等場(chǎng)景。
04李開(kāi)復(fù)認(rèn)為,逐步放棄模型預(yù)訓(xùn)練可能會(huì)成為行業(yè)整體趨勢(shì),但中國(guó)的六家大模型公司只要有夠好的人才和融資額,做預(yù)訓(xùn)練的決心,應(yīng)該沒(méi)有問(wèn)題。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
大模型發(fā)展到現(xiàn)在,我們應(yīng)該關(guān)注什么?
像 OpenAI o1 這樣的技術(shù)新范式是其一;像 canvas、NotebookLM 這樣的產(chǎn)品新思路也是;還包括用戶、客戶營(yíng)收這樣的商業(yè)化指標(biāo)。
目標(biāo)多元,但資源有限。
進(jìn)入 10 月,國(guó)內(nèi)的大模型創(chuàng)業(yè)公司「六小虎」(月之暗面、Minimax、百川智能、智譜 AI、零一萬(wàn)物、階躍星辰)開(kāi)始在不同的道路上做出選擇。
Minimax 被傳年?duì)I收預(yù)計(jì) 7000 萬(wàn)美金,同一時(shí)間流出的信息,還包括海螺 AI 由于視頻大模型的推出訪問(wèn)量激增;
智譜清言 AI 搜索、月之暗面 Kimi 探索版,則相繼推出了主打具備深度推理能力的 AI 搜索;
百川智能和階躍星辰尚未釋放進(jìn)一步動(dòng)作;
零一萬(wàn)物選擇公布了最新模型進(jìn)展,力破停止預(yù)訓(xùn)練等傳言。
10 月 16 日,繼千億參數(shù)模型 Yi-Large 之后,零一萬(wàn)物正式對(duì)外發(fā)布新旗艦?zāi)P?Yi-Lightning,在國(guó)際權(quán)威盲測(cè)榜單 LMSYS 上,Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國(guó)第一。
在國(guó)際權(quán)威盲測(cè)榜單 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中國(guó)第一。|圖片來(lái)源:零一萬(wàn)物
對(duì)此,零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)稱 Yi-Lightning 是「頂級(jí)模型白菜價(jià)」,這是當(dāng)前 AI 領(lǐng)域最需要的。他表示,「Yi-Lightning 和馬斯克的 xAI Grok 打平,并列第六名;同時(shí)也是全球第三的中國(guó)大模型企業(yè),排在零一萬(wàn)物之前的模型基本只有 OpenAI 和 Google」,這是中國(guó)大模型首度實(shí)現(xiàn)的最佳成績(jī)。在推理速度和價(jià)格上,Yi-Lightning 的最高生成速度提速近四成,每百萬(wàn) token 僅需 0.99 元,且該定價(jià)仍有利潤(rùn)。
李開(kāi)復(fù)透露,這次預(yù)訓(xùn)練只用 2000 張 GPU 訓(xùn)練一個(gè)半月,只花了 300 多萬(wàn)美金,做出來(lái)的預(yù)訓(xùn)練模型跟 Grok 打平,只花它的 1% 或 2% 的成本。
進(jìn)入 2024 年,鮮少有發(fā)布會(huì)只展示模型能力本身,AI 落地的產(chǎn)品、場(chǎng)景、客戶案例等都成為外界關(guān)注的重點(diǎn)。會(huì)上,零一萬(wàn)物也首度公布了全新 ToB 戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品 AI 2.0 數(shù)字人,聚焦零售和電商等場(chǎng)景。
對(duì)于 ToC 產(chǎn)品及海外進(jìn)展,本次發(fā)布會(huì)上未作披露。今年 5 月 Yi-Large 的發(fā)布會(huì)上,零一萬(wàn)物預(yù)計(jì)今年?duì)I收預(yù)計(jì)可達(dá) 1 億人民幣。
李開(kāi)復(fù)在朋友圈辟謠|圖片來(lái)源:網(wǎng)絡(luò)
早在 5 天前,李開(kāi)復(fù)已在朋友圈回應(yīng)了停止預(yù)訓(xùn)練的傳言,并在知乎上談到了他對(duì)大模型接下來(lái)將如何洗牌的思考。今天 Yi-Lightning 的發(fā)布進(jìn)一步回?fù)袅藗餮,李開(kāi)復(fù)也進(jìn)一步聊到了當(dāng)前大模型競(jìng)賽中的幾大爭(zhēng)議。以下是他的思考,經(jīng)極客公園整理:
01 六小虎分野之 01 萬(wàn)物的牌面:「頂級(jí)模型白菜價(jià)」
問(wèn):模型做到「世界第六,中國(guó)第一」,同時(shí)以較低的價(jià)格推向市場(chǎng),如何實(shí)現(xiàn)的?
李開(kāi)復(fù):零一萬(wàn)物在 Yi-Lightning 的定價(jià)上并沒(méi)有虧本。
成立第一天起,零一萬(wàn)物同時(shí)啟動(dòng)了模型訓(xùn)練、AI Infra、AI 應(yīng)用三大團(tuán)隊(duì),三個(gè)團(tuán)隊(duì)成熟后,再對(duì)接到一起。零一萬(wàn)物將這一模式總結(jié)為模基共建、模應(yīng)一體兩大戰(zhàn)略。AI Infra 助力模型訓(xùn)練和推理,以更低的訓(xùn)練成本,訓(xùn)練出性能領(lǐng)先的模型,以更低的推理成本支撐應(yīng)用層的探索。
我們不會(huì)賠錢賣模型,但也不會(huì)賺很多錢,而是在成本線上加一點(diǎn)點(diǎn)小小的利潤(rùn),就得到了今天 0.99 元/百萬(wàn) token 的價(jià)格。
挑選模型 API 最重要的一點(diǎn),是模型性能一定要優(yōu)秀,在這個(gè)前提之下才去挑最便宜的,我相信,綜合 Yi-Lightning 的模型質(zhì)量和價(jià)格來(lái)看,Yi-Lightning 很可能是很多開(kāi)發(fā)者最認(rèn)可、最高性價(jià)比的模型。
問(wèn):零一萬(wàn)物首次公布 ToB 相關(guān)矩陣,未來(lái)會(huì)進(jìn)一步在 ToB 方向深耕嗎?
李開(kāi)復(fù):在國(guó)內(nèi),大模型 ToB 相對(duì)于 AI 1.0 時(shí)代有不同的打法,首要任務(wù)就是要尋找少數(shù)能夠按使用情況收費(fèi)的方法,而不是項(xiàng)目定制的方法。能得到比較高利潤(rùn)率的訂單再去做。
今天零一萬(wàn)物推出的 AI 2.0 數(shù)字人解決方案不是做一單賠一單的做法,它專注到用戶重大的痛點(diǎn)需求和盈利點(diǎn),也就是一個(gè)店長(zhǎng)或 KOL 平時(shí)做一次直播浪費(fèi)最重要的資源他的時(shí)間。這個(gè)時(shí)間就算做一小時(shí)直播能賺到一千塊錢,也就是這一千塊錢,但如果用數(shù)字人直播就不是一小時(shí)了,可能可以做一千個(gè)小時(shí)(直播),哪怕每一個(gè)小時(shí)只能賺一半的錢,一千個(gè)小時(shí)還是可以賺五百倍的錢,這樣賬就很好算了。
如果真的能把數(shù)字人做到端到端,只要輸入公司內(nèi)部的東西,選一個(gè)形象、聲音按一個(gè)鈕就開(kāi)始直播,等于賣給這個(gè)企業(yè)一個(gè)印鈔機(jī),印鈔機(jī)要收租賃費(fèi)就可行。除了直播以外,我們的 AI 2.0 數(shù)字人解決方案已經(jīng)跑通了更多業(yè)務(wù)場(chǎng)景,比如 AI 伴侶、IP 形象、辦公會(huì)議等等。
整體來(lái)看,零一萬(wàn)物 ToB 整體解決方案會(huì)采雀一橫一縱」的打法。先將單個(gè)行業(yè)做深做透,進(jìn)而以自身技術(shù)能力和行業(yè)積累為基礎(chǔ),凝練出標(biāo)準(zhǔn)化的 ToB 解決方案,為各行各業(yè)的企業(yè)客戶將本提效。
問(wèn):除了數(shù)字人解決方案,零一萬(wàn)物是否還有其他 ToB 解決方案?
李開(kāi)復(fù):除了我們已經(jīng)發(fā)布的 AI 2.0 數(shù)字人、API 之外,零一萬(wàn)物目前還有 AI Infra 解決方案、私有化定制模型等其他 ToB 業(yè)務(wù),我們會(huì)在近期正式對(duì)外發(fā)布,敬請(qǐng)期待。
問(wèn):零一萬(wàn)物在海外推出 ToC 產(chǎn)品,國(guó)內(nèi)陸續(xù)推出 ToB 產(chǎn)品,當(dāng)前在 B 端、C 端的產(chǎn)品現(xiàn)狀如何?
李開(kāi)復(fù):一個(gè)大模型公司同時(shí)做 ToB 和 ToC 很辛苦,銷售方法、利潤(rùn)的比例、需要多少投放才會(huì)有收入等評(píng)估體系完全不同。也需要多元化的管理方式,因?yàn)閮蓚(gè)團(tuán)隊(duì)的基因不一樣,做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個(gè)領(lǐng)域有經(jīng)驗(yàn),也在試著做,但也絕對(duì)不能什么都做。
ToB 上,零一選擇做國(guó)內(nèi)市場(chǎng),是因?yàn)檎业搅艘恍┢凭值目臻g,比如用數(shù)字人來(lái)做零售、餐飲等,能做一個(gè)完整的解決方案。另外還有兩三個(gè)領(lǐng)域開(kāi)始在做,現(xiàn)在還不方便披露。ToB 不做海外市場(chǎng),是因?yàn)槿澜绲姆懂犂,ToB 供應(yīng)商基本都是當(dāng)?shù)氐。選擇在國(guó)內(nèi)做 ToB,還要選擇有利潤(rùn)的解決方案做,而不只是賣模型、不只是做項(xiàng)目制,這是我們 ToB 的做法。
ToC 我們主要布局海外。當(dāng)我們開(kāi)始做零一萬(wàn)物時(shí),國(guó)內(nèi)還沒(méi)有合適的中文模型,只有在國(guó)外先嘗試,迭代了一個(gè)、兩個(gè)、三個(gè)產(chǎn)品,這些產(chǎn)品現(xiàn)在表現(xiàn)有些很好,有些沒(méi)有那么好,在不斷地調(diào)整中。
我們也在觀察什么時(shí)候適合在國(guó)內(nèi)市場(chǎng)做什么樣的產(chǎn)品,目前做 ToC 產(chǎn)品面臨一個(gè)很大的問(wèn)題流量成本越來(lái)越高。我們也看到有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來(lái)還有相當(dāng)?shù)牧魇В?/strong>在這樣一個(gè)環(huán)境里,我們會(huì)非常謹(jǐn)慎,先不推出中國(guó)本土新的 ToC 應(yīng)用,同時(shí)已有的產(chǎn)品還會(huì)繼續(xù)維護(hù),但更多的精力會(huì)在海外的土壤用更低的成本買到非常高質(zhì)量的用戶,或者能直接把 App 賣出去,讓用戶來(lái)訂閱收費(fèi),那邊訂閱習(xí)慣相對(duì)成熟。
換句話說(shuō),現(xiàn)在現(xiàn)狀選擇在海外做 ToC 產(chǎn)品,變現(xiàn)能力和消耗用戶增長(zhǎng)的成本算賬可以算得過(guò)來(lái),以后再關(guān)注國(guó)內(nèi)有什么機(jī)會(huì)可以推出。
02一輪預(yù)訓(xùn)練已降至 300 萬(wàn)美金,「六小虎」都可以 cover
問(wèn):此前有消息稱 AI 方面的六小虎,某幾家放棄了預(yù)訓(xùn)練。站在行業(yè)的角度,逐步放棄模型預(yù)訓(xùn)練會(huì)成為行業(yè)整體趨勢(shì)嗎?
李開(kāi)復(fù):做好預(yù)訓(xùn)練模型是一個(gè)技術(shù)活,而且要非常多有才華的人在一起工作,慢工出細(xì)活。需要有懂芯片的人、懂推理的人、懂基礎(chǔ)架構(gòu)的人、懂模型的人、很好的算法同學(xué),一起做出來(lái)。
如果一個(gè)公司能有幸擁有這么多優(yōu)秀的人才,能夠跨領(lǐng)域的合作,我相信中國(guó)絕對(duì)可以做出世界排名前十的預(yù)訓(xùn)練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以后有可能會(huì)越來(lái)越少的大模型公司做預(yù)訓(xùn)練。
不過(guò)據(jù)我所知,這六家公司融資額度都是夠的,我們做預(yù)訓(xùn)練的 production run,訓(xùn)練一次三四百萬(wàn)美金,這個(gè)錢頭部公司都付得起。我覺(jué)得中國(guó)的六家大模型公司只要有夠好的人才,想做預(yù)訓(xùn)練的決心,融資額跟芯片都不會(huì)是問(wèn)題的。
03 AGI 的上限:o1 開(kāi)啟推理層面的新范式,OpenAI 還藏著技術(shù)
問(wèn):今年 5 月份,Yi-Large 把中美頂尖模型的時(shí)間差縮短到六個(gè)月,這次 Yi-Lightning 發(fā)布直接擊敗了 GPT-4o,把時(shí)間差甚至縮短到了五個(gè)月,零一萬(wàn)物如何能繼續(xù)追趕縮短這個(gè)時(shí)間差?
李開(kāi)復(fù):縮短時(shí)間差非常困難,我不預(yù)測(cè)我們可以縮短這個(gè)時(shí)間差。因?yàn)楫吘谷思沂怯檬f(wàn)張 GPU 訓(xùn)練出來(lái),我們用的是兩千張 GPU 訓(xùn)練出來(lái)。
Yi-Lightning 的效果是因?yàn)閳F(tuán)隊(duì)和社區(qū)大家都熱心聰明去使用,去理解對(duì)方做出來(lái)的東西,再加上我們自己每家的研發(fā)有特色,比如數(shù)據(jù)處理、訓(xùn)推優(yōu)化等等,現(xiàn)在這一套方法論在零一萬(wàn)物已經(jīng)成熟了,我們有信心把自己的創(chuàng)新加上我們的一些特長(zhǎng),在關(guān)注 OpenAI 和其他公司發(fā)布的新技術(shù),盡快地去能夠了解這些技術(shù)的核心重要性,然后把它的能力在我們自己的產(chǎn)品里面發(fā)揮出來(lái)。
我覺(jué)得這套方法保持在六個(gè)月左右,就已經(jīng)是很好的結(jié)果了。如果期待破局,可能需要一個(gè)前所未有的算法才有機(jī)會(huì)。我們千萬(wàn)不要認(rèn)為落后六個(gè)月是一個(gè)很羞恥的事情,或者一定是要追趕的事情,因?yàn)槲液芏嗪M馀笥讯颊J(rèn)為中國(guó)會(huì)遠(yuǎn)遠(yuǎn)落后,人家十萬(wàn)張 GPU 等,我們要被甩掉三年、五年甚至十年都有可能,現(xiàn)在零一萬(wàn)物證明了不會(huì)落后這么多,而且這次 LMSYS 的榜單上也有其他兩家中國(guó)公司表現(xiàn)不錯(cuò)。
問(wèn):OpenAI 的 o1 發(fā)布后,從技術(shù)上帶來(lái)在推理側(cè)的 Scaling 新范式,你怎么看?對(duì)初創(chuàng)公司會(huì)有哪些影響?
李開(kāi)復(fù):OpenAI 真的是很厲害的公司,在他們的員工交流時(shí),他們說(shuō)OpenAI 內(nèi)部還有一些好東西,但是不急拿出來(lái),因?yàn)樗麄冾I(lǐng)先行業(yè)足夠多。這次他們把 o1 拿出來(lái)主要是因?yàn)?GPT-5 訓(xùn)練不順利,而他們需要融資,就先把 o1 公開(kāi),這是他們能做而別人不能做的。
OpenAI o1 雖然隱藏了所有中間的思考狀態(tài),但是很多人還是在網(wǎng)上開(kāi)始猜它怎么做,我們認(rèn)為有一些揣測(cè)還是比較靠譜,所以當(dāng)你發(fā)了一個(gè)新技術(shù),這個(gè)技術(shù)被很多聰明人使用、揣測(cè),我覺(jué)得五個(gè)月以后,應(yīng)該也有不少類似 o1 模型的能力出現(xiàn)在各個(gè)模型公司,包括零一萬(wàn)物。
o1 的思考模式是把之前只在預(yù)訓(xùn)練中 scaling 的趨勢(shì)擴(kuò)展到了推理,這件事情對(duì)行業(yè)是最大的認(rèn)知的改變。過(guò)去大家覺(jué)得誰(shuí)預(yù)訓(xùn)練做好就夠了,慢慢大家發(fā)現(xiàn)后訓(xùn)練 SFT 和強(qiáng)化訓(xùn)練都是非常重要。
所以零一萬(wàn)物的團(tuán)隊(duì)剛開(kāi)始做的主要是專注預(yù)訓(xùn)練,之后又有很多很厲害的人加入,幫我們把后訓(xùn)練也做出來(lái),現(xiàn)在看來(lái)推理也很重要,感謝 OpenAI 點(diǎn)醒我們這一點(diǎn),相信現(xiàn)在很多中美公司都在往 o1 方向狂奔。
*頭圖來(lái)源:視覺(jué)中國(guó)
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO