當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-16 22:11:14 瀏覽：347次

導(dǎo)讀：智東西（公眾號(hào)：zhidxcom）作者 | 徐豫編輯 | 漠影DeepSeek后時(shí)代，“開(kāi)源”和“免費(fèi)”，力壓“參數(shù)量”和“模型架構(gòu)”之爭(zhēng)，成為大模型圈新的風(fēng)暴中心。智東西2月15日?qǐng)?bào)道，不到一個(gè)月內(nèi)，百度、DeepSeek、OpenAI、谷歌、xAI等主流大模型廠商們密集官宣，旗下閉源高端AI模型將轉(zhuǎn)向開(kāi)源，而主流AI產(chǎn)品計(jì)劃免費(fèi)向用戶開(kāi)放。這不僅是大模型競(jìng)賽進(jìn)入新一輪白熱化階段的信號(hào)，也是 ......

智東西（公眾號(hào)：zhidxcom）

作者 | 徐豫

編輯 | 漠影

DeepSeek后時(shí)代，“開(kāi)源”和“免費(fèi)”，力壓“參數(shù)量”和“模型架構(gòu)”之爭(zhēng)，成為大模型圈新的風(fēng)暴中心。

智東西2月15日?qǐng)?bào)道，不到一個(gè)月內(nèi)，百度、DeepSeek、OpenAI、谷歌、xAI等主流大模型廠商們密集官宣，旗下閉源高端AI模型將轉(zhuǎn)向開(kāi)源，而主流AI產(chǎn)品計(jì)劃免費(fèi)向用戶開(kāi)放。這不僅是大模型競(jìng)賽進(jìn)入新一輪白熱化階段的信號(hào)，也是AI技術(shù)走近尋常百姓家的關(guān)鍵節(jié)點(diǎn)。

百度和OpenAI兩家更是戰(zhàn)況焦灼，前后腳劇透下一代新模型、深度搜索功能、生成式AI工具免費(fèi)可用，以及開(kāi)源計(jì)劃。

2月14日，百度宣布將在接下來(lái)的幾個(gè)月內(nèi)，陸續(xù)推出文心大模型4.5系列，并且新一代文心大模型將自6月30日起開(kāi)源。這也是百度旗下大模型首次開(kāi)源。與此同時(shí)，有市場(chǎng)消息稱，百度今年還會(huì)發(fā)布文心大模型的5.0系列。

再往前一天，百度官宣，自4月1日起，文心一言將全面免費(fèi)，用戶可以通過(guò)PC端和APP端，免費(fèi)使用最新款的文心系列模型。同日，OpenAI CEO奧爾特曼在X上發(fā)布長(zhǎng)文，官宣計(jì)劃在幾周，或者幾個(gè)月內(nèi)，發(fā)布新一代模型GPT-4.5（內(nèi)部代號(hào)“Orion”）和GPT-5系統(tǒng)。

奧爾特曼還在文中寫(xiě)道，其ChatGPT的免費(fèi)套餐，也將包括對(duì)GPT-5的無(wú)限制聊天訪問(wèn)權(quán)限。換句話說(shuō)，用戶不僅可以免費(fèi)使用ChatGPT的搜索功能，后續(xù)還可以免費(fèi)用上OpenAI最先進(jìn)的模型。

本月早些時(shí)候，谷歌也宣布了將開(kāi)放其最新的Gemini 2.0系列模型。馬斯克則2月14日接受采訪時(shí)談道，計(jì)劃將在一到兩周內(nèi)推出新一代AI模型Grok 3，性能或?qū)⒊紾PT系列，并且很大概率延續(xù)開(kāi)源策略�？梢哉f(shuō)，上述幾家大模型廠商都卯足了勁，準(zhǔn)備在這個(gè)節(jié)骨眼大干一場(chǎng)，誰(shuí)也沒(méi)有打算讓著誰(shuí)。

另外，百度和OpenAI均計(jì)劃逐步開(kāi)放深度檢索相關(guān)功能。

OpenAI方面稱，深度研究功能起初會(huì)提供每月2次的免費(fèi)使用機(jī)會(huì)、每月10次的Plus用戶使用機(jī)會(huì)，而所有Pro用戶均可在移動(dòng)端和桌面端APP上使用該功能。百度文心一言的深度搜索功能現(xiàn)已上線PC端，從4月1日起即可免費(fèi)使用，APP端也即將上線。

時(shí)至今日，大模型能夠走向免費(fèi)、開(kāi)源、開(kāi)放，背后離不開(kāi)技術(shù)突破所帶來(lái)的訓(xùn)練和推理成本下降。

2月11日，百度創(chuàng)始人李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會(huì)”上時(shí)分享道，“在過(guò)去，當(dāng)我們談?wù)撃柖蓵r(shí)，每18個(gè)月，性能水平或價(jià)格都會(huì)減半。但今天，當(dāng)我們談?wù)摯笮驼Z(yǔ)言模型時(shí)，可以說(shuō)每12個(gè)月推理成本就降低90%以上�！�

OpenAI CEO奧爾特曼近日也在博客上表達(dá)了類似觀點(diǎn)。據(jù)他觀察，AI價(jià)格的下降顯著刺激了AI使用量的增長(zhǎng)。奧爾特曼稱，AI使用成本正大幅下降，每年比前一年便宜約9成，這也有助于AI普及更多用戶。

用大模型這件事兒越來(lái)越便宜，不僅讓各中小型企業(yè)本地化部署大模型的價(jià)格門(mén)檻更低，還能開(kāi)發(fā)出更適用的大模型衍生品；也有助于普羅大眾把用AI產(chǎn)品變得日�；�，動(dòng)手搭建個(gè)性化的AI工具、AI產(chǎn)品、AI智能體，最終共同為整個(gè)AI生態(tài)持續(xù)注入活力。

那么，大模型憑什么敢免費(fèi)開(kāi)放，究竟如何提供高性價(jià)比的AI算力，先進(jìn)模型能力到底強(qiáng)在哪？通過(guò)拆解百度多項(xiàng)大模型開(kāi)發(fā)經(jīng)驗(yàn)，我們找到了自研芯片、數(shù)據(jù)中心和AI計(jì)算平臺(tái)，以及推理技術(shù)架構(gòu)深度優(yōu)化這4大答案。

一、文心系列打頭陣，深度搜索功能即將全量上線

時(shí)隔大半年，百度文心大模型即將連續(xù)刷級(jí)。據(jù)百度方面最新消息，文心大模型4.5系列將在未來(lái)幾個(gè)月內(nèi)陸續(xù)推出。另?yè)?jù)近期市場(chǎng)消息，文心大模型5.0系列也將在年內(nèi)發(fā)布，時(shí)間可能是今年下半年。

2023年10月，百度發(fā)布了文心大模型4.0；去年4月，文心大模型4.0工具版上線；去年6月，4.0系列中性能較強(qiáng)的文心大模型4.0 Turbo正式推向市場(chǎng)。結(jié)合4.0系列的發(fā)布節(jié)奏來(lái)看，或許百度已用實(shí)際行動(dòng)印證了李彥宏所說(shuō)的“創(chuàng)新的本質(zhì)”。在他看來(lái)，創(chuàng)新的本質(zhì)基本遵循“如果你能將成本降低一定數(shù)量、一定百分比，那么這意味著你的生產(chǎn)率提高了相同的百分比”。

有知情人士劇透，文心大模型4.5和5.0，將在多模態(tài)能力上有明顯提升。OpenAI則選擇將o3推理模型等多種AI技術(shù)和能力，集成到即將發(fā)布的GPT-5 AI系統(tǒng)中。

同時(shí)，文心大模型的視覺(jué)智能能力也是其一大特色。基于此，百度或?qū)⒋鍻penAI和谷歌，接管?chē)?guó)行版iPhone中Apple Intelligence的視覺(jué)智能。據(jù)外媒2月14日?qǐng)?bào)道，百度將負(fù)責(zé)承擔(dān)“國(guó)行版”Apple Intelligence所提供的圖像識(shí)別、檢索等功能。

目前，百度自研的iRAG（image-based Retrieval-Augmented Generation，基于圖像的檢索增強(qiáng)生成技術(shù)）結(jié)合了檢索增強(qiáng)（RAG）技術(shù)和視覺(jué)智能，可以檢索、比對(duì)、參考百度搜索引擎的大量圖片資源，然后通過(guò)文本生成質(zhì)量更高、元素更逼真的AI圖像，減少傳統(tǒng)文生圖技術(shù)易出現(xiàn)的“幻覺(jué)”現(xiàn)象。

實(shí)測(cè)表明，具備iRAG能力的文心大模型4.0，所生成的人物形象及其動(dòng)作都更加貼合文字描述和物理邏輯。此外，文心大模型4.0支持一次生成多張AI圖像。

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

▲左圖由文心大模型4.0生成，右圖由文心大模型3.5生成（圖源：百度）

而單從檢索增強(qiáng)方面來(lái)看，百度的生成式AI工具文心一言，比OpenAI的AI聊天助手ChatGPT，在聯(lián)網(wǎng)檢索準(zhǔn)確性、內(nèi)容描述的細(xì)致程度上，都更勝一籌。

先拋給它們一個(gè)有唯一解的問(wèn)題：“2025年中國(guó)的法定假日有哪些？”

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

文心一言發(fā)現(xiàn)了今年是中秋節(jié)與國(guó)慶節(jié)連休，但ChatGPT弄錯(cuò)了中秋節(jié)的日期，并且沒(méi)有發(fā)現(xiàn)連休假期的特殊情況。

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

再拋給它們一個(gè)開(kāi)放式的問(wèn)題：“哪吒2中，在做藕粉的過(guò)程中，出現(xiàn)了哪些讓哪吒感覺(jué)不適的操作？”

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

ChatGPT聯(lián)網(wǎng)檢索后生成的答案有偏離影片事實(shí)的部分，文心一言則更加準(zhǔn)確地描述出了影片細(xì)節(jié)內(nèi)容。

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

今年內(nèi)，文心一言還有望勝任一些更專業(yè)化、行業(yè)門(mén)檻更高的內(nèi)容。2月13日，百度官宣文心一言網(wǎng)頁(yè)版上線了深度搜索功能，App端也即將同步升級(jí)。

基于該深度搜索功能，文心一言可以應(yīng)對(duì)民生、創(chuàng)業(yè)、經(jīng)濟(jì)分析類等專業(yè)咨詢類的問(wèn)題，內(nèi)容回復(fù)預(yù)期達(dá)到專家級(jí)水平，在一定程度上突破了過(guò)去查詢渠道較為小眾、專業(yè)領(lǐng)域解析難度大等AI搜索瓶頸。

除了增強(qiáng)搜索能力，百度方面透露文心一言的思考、規(guī)劃和反思能力都進(jìn)一步提升，從而能夠更“聰明”地使用多種工具解決復(fù)雜任務(wù)。

例如，遇到一些不能簡(jiǎn)單處理的問(wèn)題，文心一言可以先“閱讀”、“理解”用戶上傳的文檔，再搜索、分析相關(guān)內(nèi)容，最后綜合考慮私域資源和公域資源信息，得出結(jié)果。

二、“芯”動(dòng)力撐腰，大幅提升模型訓(xùn)練效率

當(dāng)前，大模型及其產(chǎn)品性能增強(qiáng)的同時(shí)，還要控制、降低開(kāi)發(fā)和使用成本，以實(shí)現(xiàn)向用戶開(kāi)源并免費(fèi)開(kāi)放。這背后離不開(kāi)整體算力架構(gòu)的提效優(yōu)化。

首先是算力“油門(mén)”，即芯片。

百度自研的AI芯片“昆侖芯”，專注于大模型訓(xùn)練和推理優(yōu)化，驅(qū)動(dòng)一系列文心大模型縮短訓(xùn)練周期，并降低開(kāi)發(fā)成本。

其現(xiàn)已升級(jí)至第三代昆侖芯P800。該芯片采用的是XPU架構(gòu)（eXtensible Processing Unit，可擴(kuò)展處理單元），這種處理器架構(gòu)比傳統(tǒng)的CPU（中央處理單元）和GPU（圖形處理單元）靈活度更高，可以根據(jù)具體需求和應(yīng)用場(chǎng)景來(lái)擴(kuò)展和定制，從而減少算力的浪費(fèi)，并提高計(jì)算任務(wù)的處理效率。

同時(shí)，昆侖芯P800的顯存規(guī)格比同類主流GPU高出20%到50%，可以更好地適配MoE（Mixture of Experts，混合專家模型）架構(gòu)，節(jié)省算力消耗，來(lái)整體降低開(kāi)發(fā)成本。

該芯片還支持8-bit量化技術(shù)，占用更少的顯存，也能保持較高的推理精度。這意味著千帆DeepSeek一體機(jī)單機(jī)8卡，也能帶動(dòng)滿血版DeepSeek等參數(shù)量為671B的大模型。

其次是算力“油箱”，即數(shù)據(jù)中心。

本月，百度智能云宣布完成昆侖芯三代萬(wàn)卡集群的搭建，并計(jì)劃進(jìn)一步將萬(wàn)卡規(guī)模拓展至三萬(wàn)卡。

這一自研萬(wàn)卡集群可形成規(guī)模效應(yīng)，通過(guò)多任務(wù)并行處理、彈性算力管理等方式減少算力閑置的情況，以提高計(jì)算資源利用率，進(jìn)而降低模型訓(xùn)練的整體算力成本。

未來(lái)，其規(guī)模如果按計(jì)劃從萬(wàn)卡擴(kuò)大至三萬(wàn)卡，規(guī)模效應(yīng)加劇，百度的云計(jì)算服務(wù)整體成本或?qū)⑦M(jìn)一步降低。

再者是算力“車(chē)底座”，即AI計(jì)算平臺(tái)。

百舸平臺(tái)是百度智能云推出的一個(gè)高性能AI計(jì)算平臺(tái)，主要用于支持大規(guī)模深度學(xué)習(xí)。其通過(guò)提升帶寬有效性、減少散熱能耗、優(yōu)化模型訓(xùn)練效率等方式，來(lái)降低模型訓(xùn)練整體成本。

據(jù)百度方面最新數(shù)據(jù)，百舸4.0的帶寬有效性已提升至90%以上；訓(xùn)練主流開(kāi)源模型的集群MFU（通常用MFU來(lái)表示GPU的有效利用率）提升至58%；模型訓(xùn)練故障恢復(fù)時(shí)間從小時(shí)級(jí)降低到分鐘級(jí)，集群有效訓(xùn)練率達(dá)到98%。

三、多平臺(tái)創(chuàng)新，拉動(dòng)模型推理成本打骨折

訓(xùn)練和推理都是模型開(kāi)發(fā)及其應(yīng)用的關(guān)鍵環(huán)節(jié)，因此單單降低模型訓(xùn)練的開(kāi)銷(xiāo)還不夠，模型推理的成本，也需要通過(guò)優(yōu)化推理技術(shù)來(lái)進(jìn)一步控制。

截至發(fā)稿，開(kāi)源社區(qū)Hugging Face上點(diǎn)贊數(shù)排行第一，是國(guó)產(chǎn)模型DeepSeek-R1。DeepSeek-R1是基于DeepSeek V3基礎(chǔ)模型訓(xùn)練的高性能推理模型，專注于提升推理能力。

隨著主流大模型廠商相繼接入、蒸餾DeepSeek-R1和DeepSeek V3模型，并且計(jì)劃開(kāi)源自家先進(jìn)模型，這一格局或?qū)⒈桓膶?xiě)。

不過(guò)，調(diào)用DeepSeek-R1和DeepSeek V3的價(jià)格卻有高有低。

目前來(lái)看，包括DeepSeek自家平臺(tái)在內(nèi)，調(diào)用DeepSeek-R1和DeepSeek V3每百萬(wàn)Tokens的單價(jià)，定價(jià)最便宜的是百度智能云千帆大模型平臺(tái)。其R1的調(diào)用價(jià)格為DeepSeek官方刊例價(jià)的半價(jià)，V3的調(diào)用價(jià)格是DeepSeek官方刊例價(jià)的3折。

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追

總的來(lái)說(shuō)，百度方面主要通過(guò)優(yōu)化以下3大板塊的推理技術(shù)，來(lái)降低推理成本。

1、百度智能云千帆大模型平臺(tái)針對(duì)DeepSeek模型MLA結(jié)構(gòu)（Multi-Level Attention，多級(jí)注意力）深度優(yōu)化，一方面同步調(diào)用計(jì)算、通信和內(nèi)存資源進(jìn)行推理，另一方面使用Prefill/Decode分離式推理架構(gòu)在推理前先預(yù)處理數(shù)據(jù)，從而使模型滿足低延遲標(biāo)準(zhǔn)的同時(shí)，大幅提升了吞吐量，并降低了推理成本。

2、百度智能云千帆大模型平臺(tái)還通過(guò)增強(qiáng)系統(tǒng)容錯(cuò)能力、減少多輪對(duì)話等場(chǎng)景中的重復(fù)計(jì)算、增強(qiáng)安全防護(hù)欄來(lái)整體降低推理成本。

3、有業(yè)內(nèi)人士分析稱，百度飛槳深度學(xué)習(xí)框架，以及百度飛槳自研的并行推理、量化推理等大模型推理相關(guān)技術(shù)，可以遷移應(yīng)用于文心一言等百度旗下的AI工具，從而降低這些AI工具的推理成本。

結(jié)語(yǔ)：國(guó)內(nèi)外大模型再掘AI增量，智能化加速平民化

作為首批免費(fèi)開(kāi)放AI模型的大模型廠商，百度與OpenAI等競(jìng)爭(zhēng)對(duì)手一起，拉開(kāi)大模型新一輪價(jià)格戰(zhàn)的序幕。但這一次，“省成本”不僅僅是為了大模型廠商自身的經(jīng)營(yíng)，更多是把重心放在了AI技術(shù)推廣上。

而百度在芯片、模型訓(xùn)練、模型應(yīng)用方面持續(xù)探索，通過(guò)技術(shù)創(chuàng)新，讓AI逐步走向人人可用、人人用得起、人人用得好的階段。

未來(lái)，無(wú)論企業(yè)或者個(gè)人是否從事AI行業(yè)，都有機(jī)會(huì)在日常生活中收獲AI技術(shù)、AI工具、AI模型的智能化體驗(yàn)，繼而作為一份子加入AI浪潮，形成AI硬件開(kāi)發(fā)商、大模型廠商、云服務(wù)商、個(gè)人等主體共促AI生態(tài)開(kāi)放發(fā)展的局面。

上一篇：如何學(xué)習(xí)才能不被AI替代

下一篇：“杭州六小龍”首個(gè)IPO 群核科技沖擊“全球空間智能第一股”

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-16 22:11:14 瀏覽：347次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門(mén)排行

推薦內(nèi)容

在線客服

熱門(mén)欄目HotCates

關(guān)于我們

版權(quán)聲明

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-16 22:11:14 瀏覽：347次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門(mén)排行

推薦內(nèi)容

在線客服

熱門(mén)欄目HotCates

關(guān)于我們

版權(quán)聲明

中外大模型加速開(kāi)源+免費(fèi)！文心一言降本大揭秘，GPT-5緊追
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-16 22:11:14 瀏覽：347次