撰文丨潘幾鶴
開源,免費(fèi)。
毫無預(yù)兆,百度扔下兩個王炸。
2月14日,其宣布,將在未來幾個月,陸續(xù)推出文心大模型4.5系列,并于6月30日起,正式開源。
就在前一天,百度剛掏出兩個“免費(fèi)”錦囊:文心一言將在4月1日0時起,全面免費(fèi);即日上線的深度搜索功能,屆時同樣全面免費(fèi)。
作為最早一批入局AI領(lǐng)域的企業(yè),百度的一舉一動,牽動大眾眼光,關(guān)乎行業(yè)走向。
多數(shù)人熱議的,是百度創(chuàng)始人李彥宏對待大模型開閉源的態(tài)度轉(zhuǎn)變。其實(shí),比這更重要的,是他對下半場風(fēng)向的洞察,以及路線相應(yīng)的快速調(diào)整。
一個更開放的百度,疾馳在AI“水電煤”普惠革命的路上。
開閉之爭
不約而同地,百度與Open AI兩家巨頭,同一時間決定開源。
Open AI首席執(zhí)行官山姆奧特曼稱,未來將重新制定開源戰(zhàn)略,還提到,正醞釀將非前沿的舊模型開源。
百度更為直接,其直接宣布開源的,是新系列的模型。
這種變化,不免引向老話題大模型到底是開源好,還是閉源更好?
其實(shí),開源閉源,不是簡單的二元對立、非此即彼。
從技術(shù)發(fā)展路線來看,開發(fā)主體對此的選擇,很大程度上源于對商業(yè)策略的考慮,底層是商業(yè)模式和理念的碰撞。
開源能令參與的多方,深入理解模型的技術(shù)特點(diǎn),增進(jìn)產(chǎn)學(xué)研交流,同時,考慮到一些應(yīng)用場景,涉及垂直領(lǐng)域特有應(yīng)用的效率調(diào)優(yōu)、行業(yè)數(shù)據(jù)隱私等問題,不便于開源。
二者各有各的使用場景。
早期的模型開源,更多得劃到“營銷”范疇。
比如Meta的LLaMA模型,僅部分開源了參數(shù)權(quán)重和結(jié)構(gòu),核心的“配方”,即訓(xùn)練所用數(shù)據(jù)集、訓(xùn)練過程、優(yōu)化細(xì)節(jié)等未公開,后者才是真正決定性能的關(guān)鍵。
開發(fā)者想要復(fù)現(xiàn)和改進(jìn)這些模型,會面臨諸多限制,嚴(yán)格意義上,它們只能算“半開源”。
李彥宏很早就指出這一點(diǎn),提到有外行混淆了模型開源和代碼開源的概念。
市場鼓勵的,本就是負(fù)責(zé)任的模型開源。進(jìn)入2025年,這一市場呼吁的實(shí)現(xiàn),可能性變大了,背后是技術(shù)迭代的速度,超乎所有人想象。
“今天,創(chuàng)新速度比以往都快得多。摩爾定律中,每18個月,性能就會翻倍,價格減半;如今,大模型推理成本每年能降低90%以上!睌(shù)天前的WGS 2025峰會上,李彥宏如此表示。
他提到,回顧過去幾百年歷史,創(chuàng)新的本質(zhì)是成本下降與生產(chǎn)力提升,在AI、IT乃至更多領(lǐng)域,大多數(shù)創(chuàng)新都與降低成本有關(guān)。
如成本降低一定比例,生產(chǎn)力也能同比例提高。
這意味著,無論開源、閉源,基礎(chǔ)模型的發(fā)展都在加速往前跑,二者勢必走向彼此博弈搖擺、相輔相成的格局。
大模型顛覆摩爾定律,行業(yè)邏輯重構(gòu),玩家只能應(yīng)勢而變這也是百度此次擁抱開源的原因。
價值根本
“開閉”之爭,并非涇渭分明,與其囿于孰強(qiáng)孰弱的爭論,大眾目光更該放在已形成共識的問題上。
正如李彥宏所說,“歸根結(jié)底,最重要的是應(yīng)用,而不是使用哪種大模型。不管開源還是閉源,更重要的是可以在應(yīng)用層創(chuàng)造什么樣的價值!
沒有構(gòu)建于基礎(chǔ)模型之上、豐富的AI原生應(yīng)用生態(tài),大模型就一文不值。
今年以來,得益于DeepSeek爆火出圈,以及百度文心免費(fèi)等新的利好釋放,帶來AI應(yīng)用開發(fā)的門檻大幅降低。
AI應(yīng)用,迎接“安卓時刻”。
百度很早就給出判斷,必須加碼AI應(yīng)用,其提前布局,一直是堅(jiān)定的實(shí)踐派。
早在兩年前,李彥宏就多次表示,“百度要做第一個把所有現(xiàn)有產(chǎn)品重做一遍的公司!
這不是整合、接入,而是重構(gòu)。
大刀闊斧變革之下,百度的應(yīng)用矩陣,顯現(xiàn)全新氣象。
數(shù)據(jù)顯示,截至2024年11月,百度已手握日均15億次調(diào)用的文心大模型,4.3億用戶規(guī)模的文心一言,旗下的百度文庫、網(wǎng)盤等產(chǎn)品,亦老樹發(fā)新芽,加速煥新。
以文庫產(chǎn)品為例,年初,百度透露,百度文庫AI功能MAU突破9000萬,AI DAU年同比增長230%,同時,付費(fèi)用戶超4000萬,位居全球第二、中國第一。
驚人的成績背后,是一年上百項(xiàng)的AI功能更新,團(tuán)隊(duì)為去掉產(chǎn)品的“AI味”付出的不懈努力。
在產(chǎn)業(yè)端,百度亦憑借多年的技術(shù)投入和工具開發(fā),助力成千上萬企業(yè)用上趁手的AI應(yīng)用。
其已擁有龐大的大模型產(chǎn)業(yè)落地規(guī)模,超過六成的央企和大量的民營企業(yè),在聯(lián)合百度智能云進(jìn)行AI創(chuàng)新。
今年,百度的應(yīng)用創(chuàng)新,只快不慢,已釋放新的信號。
2月13日,文心一言新上線深度搜索功能,全面強(qiáng)化了專業(yè)咨詢類問題的解決能力,針對性地解決了一系列痛點(diǎn),包括專業(yè)問題查詢門檻高、查詢渠道專精、查詢結(jié)果分析難度大等。
由此,更多行業(yè)有了專家級問答,內(nèi)容的深度搜索和文檔閱讀、代碼解釋器等工具一配合,在解決復(fù)雜任務(wù)問題上變得更聰明。
加固底盤
高盛首席信息官馬可阿根提觀察到,AI技術(shù)的發(fā)展速度和影響力,與他當(dāng)年在亞馬遜見證云服務(wù)興起時的情景,驚人相似,AI的發(fā)展速度甚至更為迅猛。
超級應(yīng)用尚未出現(xiàn),但AI的實(shí)際滲透率已然不低。多數(shù)投資人和AI從業(yè)者都判斷,大模型賦能的AI原生應(yīng)用,會在2025年有井噴式發(fā)展。
這對基礎(chǔ)模型的支撐能力,提出更高要求,市場會加快整合,有實(shí)力、規(guī);耐婕也拍芰粼谂谱。
正如馬可阿根提所形容的,在模型的商品化方面,將看到“很多汽車,更少的引擎”,不同的應(yīng)用將基于更少的基礎(chǔ)模型之上構(gòu)建。
大模型競技?xì)埧,百度這類頭部玩家,必須將自己的技術(shù)底盤,加固得更結(jié)實(shí)。
“我們?nèi)孕鑼π酒、?shù)據(jù)中心和云基礎(chǔ)設(shè)施進(jìn)行持續(xù)投入,用于打造更好、更智能的下一代模型。”李彥宏表示。
除了多項(xiàng)AI開放政策于近期密集發(fā)布,據(jù)市場消息,今年下半年,公司或發(fā)布文心大模型5.0,將在模型多模態(tài)能力方面,有顯著增強(qiáng)。
換個角度看,這些產(chǎn)品動作的官宣時間,均早于落地時間至少1個半月,既是一種市場承諾,也是百度AI多年錘煉的技術(shù)自信。
畢竟,迄今為止,擁有AI技術(shù)全棧架構(gòu)的公司,能具備“芯片-框架-模型-應(yīng)用”這四層的,百度是國內(nèi)獨(dú)一份。
芯片算力上,近日,百度智能云成功點(diǎn)亮昆侖芯三代萬卡集群,這也是國內(nèi)首個正式點(diǎn)亮的自研萬卡集群。
未來,百度智能云將進(jìn)一步點(diǎn)亮3萬卡集群。
大規(guī)模集群可以通過任務(wù)并行調(diào)度、彈性算力管理等方式,提高計(jì)算資源利用率,避免算力閑置,降低整體算力成本。
百度開源開放的飛槳深度學(xué)習(xí)框架具備并行推理、量化推理等自研技術(shù),與文心大模型聯(lián)合優(yōu)化可以實(shí)現(xiàn)推理性能提升,推理成本降低。
百度通過端到端優(yōu)化,提升性能的同時,不斷把成本打下來。
AI技術(shù)飛入產(chǎn)業(yè)和千家萬戶,無法一蹴而就。技術(shù)最前沿的爬坡者,最先體會到風(fēng)雨。
李彥宏說,也許在某個時刻,能找到一條捷徑,比如只需600萬美元就能訓(xùn)練出一個模型,“在此之前,你可能已經(jīng)花費(fèi)數(shù)十億美元來探索,哪條路才是花費(fèi)這600萬美元的正確途徑!
1個多月前,在2025年全員信里,這位“AI先生”分享感受,說話直白一如既往,提到有些工作直到最后一天,才知道成或不成,機(jī)遇與挑戰(zhàn)并行。
“要不斷試錯,要知道哪一天方向走錯了需要迅速調(diào)整,重新出發(fā),甚至要對自己的能力邊界有清醒的認(rèn)知,并不斷總結(jié)經(jīng)驗(yàn)教訓(xùn),以利再戰(zhàn)!崩顝┖晏寡。