展會(huì)信息港展會(huì)大全

“降價(jià)”上癮!阿里云宣布通義千問主力模型降價(jià)97%
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-05-21 15:00:51   瀏覽:5307次  

導(dǎo)讀:IT時(shí)報(bào)記者 郝俊慧 沒有最低,只有更低!最近一周,大模型卷起價(jià)格戰(zhàn)。 5月21日,阿里云宣布降價(jià),通義千問GPT-4級(jí)主力模型Qwen-Long,API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,1塊錢可以買200萬tokens,相當(dāng)于5本《新華字典...

IT時(shí)報(bào)記者 郝俊慧

沒有最低,只有更低!最近一周,大模型“卷起”價(jià)格戰(zhàn)。

5月21日,阿里云宣布降價(jià),通義千問GPT-4級(jí)主力模型Qwen-Long,API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,1塊錢可以買200萬tokens,相當(dāng)于5本《新華字典》的文字量。

“降價(jià)”上癮!阿里云宣布通義千問主力模型降價(jià)97%

自5月14日OpenAI宣布正式推出新一代旗艦AI模型GPT-4o,并將API價(jià)格下降50%以來,短短一周內(nèi),國(guó)產(chǎn)大模型智譜大模型、字節(jié)跳動(dòng)豆包大模型先后官宣降價(jià),降幅都在80%~90%之間。其中,豆包將價(jià)格降到了“以厘計(jì)費(fèi)”,一塊錢能買125萬Tokens,相當(dāng)于三本《三國(guó)演義》。

如今,阿里云再進(jìn)一步將價(jià)格打到“骨折”。

“未來,大模型就是云”,宣布降價(jià)消息的武漢AI智領(lǐng)者峰會(huì)現(xiàn)場(chǎng),阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光的這句話,或許正是諸多廠商不得不跟進(jìn)的原因。

業(yè)界普遍認(rèn)為,隨著大模型性能逐漸提升,AI應(yīng)用創(chuàng)新正進(jìn)入密集探索期,但推理成本過高依然是制約大模型規(guī)模化應(yīng)用的關(guān)鍵因素。大幅降低大模型推理價(jià)格的意義在于,降低AI應(yīng)用開發(fā)的門檻,鼓勵(lì)開發(fā)者加速進(jìn)入賽道,加速應(yīng)用端對(duì)AI產(chǎn)品的適應(yīng)性和依賴性。

阿里云預(yù)計(jì),未來大模型API的調(diào)用量會(huì)有成千上萬倍的增長(zhǎng),公共云+API將成為企業(yè)使用大模型的主流方式。

通義千問本次降價(jià)共覆蓋9款商業(yè)化及開源系列模型。

“降價(jià)”上癮!阿里云宣布通義千問主力模型降價(jià)97%

不久前,OpenAI的Sam Altman轉(zhuǎn)發(fā)了Chatbot Arena榜單來印證GPT-4o的能力,其中全球排名前20的模型中,僅有的三款中國(guó)模型都是通義千問出品,包括Qwen-Max、Qwen1.5-110B、Qwen1.5-72B,此次全部降價(jià)。

“降價(jià)”上癮!阿里云宣布通義千問主力模型降價(jià)97%

其中,不久前發(fā)布的通義千問旗艦款大模型Qwen-Max,API輸入價(jià)格降至0.04元/千tokens,降幅達(dá)67%。Qwen-Max是目前中文大模型中的“佼佼者”,在權(quán)威基準(zhǔn)OpenCompass上性能追平GPT-4-Turbo,并在大模型競(jìng)技場(chǎng)Chatbot Arena中躋身全球前15。

Qwen-Long是通義千問的長(zhǎng)文本增強(qiáng)版模型,性能對(duì)標(biāo)GPT-4,上下文長(zhǎng)度最高達(dá)1千萬。除了輸入價(jià)格降至0.0005元/千tokens,Qwen-Long輸出價(jià)格也直降90%至0.002元/千tokens。相比之下,國(guó)內(nèi)外廠商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens輸入價(jià)格分別為0.22元、0.025元、0.022元及0.12元,均遠(yuǎn)高于Qwen-long。

“降價(jià)”上癮!阿里云宣布通義千問主力模型降價(jià)97%

在“價(jià)格戰(zhàn)”這條路上,阿里云一向是先行者。

今年2月29日,阿里云舉起“價(jià)格屠刀”,對(duì)旗下100多款云產(chǎn)品、500多個(gè)產(chǎn)品規(guī)格,平均降價(jià)幅度超過20%,最高降幅達(dá)55%,涉及覆蓋計(jì)算、存儲(chǔ)、數(shù)據(jù)庫等所有核心產(chǎn)品。此后,多家云商“被迫”跟進(jìn)。

此次,阿里云依然是大模型降價(jià)潮的第一梯隊(duì)。相較“后來者”國(guó)產(chǎn)大模型廠商,出身“云服務(wù)商”的阿里云具有先天優(yōu)勢(shì)。

劉偉光透露,公共云的技術(shù)紅利和規(guī)模效應(yīng),帶來巨大的成本和性能優(yōu)勢(shì)。阿里云基于自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò)HPN7.0、高性能存儲(chǔ)CPFS、人工智能平臺(tái)PAI等核心技術(shù)和產(chǎn)品,構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng),結(jié)合百煉分布式推理加速引擎,大幅壓縮了模型推理成本,并加快模型推理速度。

從實(shí)際測(cè)試來看,即便是同樣的開源模型,在公共云上的調(diào)用價(jià)格也遠(yuǎn)遠(yuǎn)低于私有化部署。以使用Qwen-72B開源模型、每月1億tokens用量為例,在阿里云百煉上直接調(diào)用API每月僅需600元,私有化部署的成本平均每月超1萬元。

此外,云廠商天然的開放性,能為開發(fā)者提供最豐富的模型和工具鏈。阿里云百煉平臺(tái)上匯聚通義、百川、ChatGLM、Llama系列等上百款國(guó)內(nèi)外優(yōu)質(zhì)模型,內(nèi)置大模型定制與應(yīng)用開發(fā)工具鏈,開發(fā)者可以便捷地測(cè)試比較不同模型,開發(fā)專屬大模型,并輕松搭建RAG等應(yīng)用。從選模型、調(diào)模型、搭應(yīng)用到對(duì)外服務(wù),一站式搞定。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港