OpenAI仍在擠牙膏式更新,但當下資本市場的目光歸于博通。人們更關(guān)心誰會給行業(yè)帶來更多變化,誰會給明年帶來更多驚喜。
去年底,未盡研究發(fā)布《看DAO 2024》報告,對今年生成式AI最可能發(fā)生最值得關(guān)注的十大領(lǐng)域做出展望。事實上,十有八九都已在上半年被行業(yè)所兌現(xiàn)。
只不過,整個2024年,仍然屬于GPT-4時代。這是展望與事實偏離最大的一項,也是令行業(yè)最為遺憾的一項。
AI會選一條不同的道路前行嗎?未盡研究將在年底發(fā)布新一年的《看DAO 2025》報告,會繼續(xù)對明年大模型與生成式AI的發(fā)展趨勢做出展望。
在此之前,先讓我們簡要回顧一下,今年都發(fā)生了什么。
展望一:智能體作為任務助理進入更多應用場景和業(yè)務流程。回顧:智能體是2024年最熱的領(lǐng)域之一。它能提升推理效率,吳恩達團隊基于GPT-3.5的智能體性能甚至超過了GPT-4。智能體工作流正在引領(lǐng)白領(lǐng)工業(yè)革命,甚至破解數(shù)據(jù)中心碳排放不可能三角。微軟發(fā)布了一系列商用AI Agent,Salesforce財報重點也是Agent Force。越來越多對話機器人集成了智能體功能,如Claude3.5的Artifact。谷歌加大了智能體產(chǎn)品布局的力度,OpenAI正在加速產(chǎn)品化,重點押注了智能體。
展望二:操作系統(tǒng)集成下一代大模型,成為下一代操作系統(tǒng)
回顧:微軟與蘋果初步交付下一代操作系統(tǒng),中國也實現(xiàn)了本土化。蘋果發(fā)布了AppleIntelligence,還將集成OpenAI等第三方模型,與中國廠商的合作還在反復調(diào)試。微軟將旗下所有應用貼上Copilot標簽,但系統(tǒng)閱讀用戶行為的功能備受爭議。安卓系統(tǒng)的代表是谷歌的Pixel9 pro。華為HarmonyOS NEXT操作系統(tǒng)發(fā)布,獨立于iOS與安卓,首次融入盤古大模型5.0。
展望三:生成式AI制作的影視劇大量出現(xiàn),沖擊影視行業(yè)發(fā)生劇變回顧:早期嘗試驚艷,內(nèi)容行業(yè)尚未劇變。OpenAI的Sora融合了擴散模型和Transformer,驗證擴展定律繼續(xù)生效,但版權(quán)問題引發(fā)部分藝術(shù)家抗議。Luma、可靈、Vidu、Veo、pixeldance等追隨者正在加速,強調(diào)對多主體一致性與上下文理解的突破?煽诳蓸酚么竽P蜕闪耸フQ廣告宣傳片。谷歌與World Labs等在構(gòu)建世界模型的同時,為視頻生成提供了新的方向。
展望四:人形機器人開始量產(chǎn),自學習與環(huán)境互動能力進一步強化回顧:多家企業(yè)小批量訂單用于科研與測試。智元展示了千臺量產(chǎn),這是特斯拉明年的目標。宇樹科技G1低于10萬元,宣布離“iPhone時刻”不超過5年。英偉達圍繞GR00T機器人通用模型加速布局供應鏈。OpenAI重啟研究,投資了1X等數(shù)家企業(yè)。汽車流水線是最大的實習基地。中國人才與資金流動活躍,地平線、小米與華為等智能駕駛核心人員紛紛投身具身智能。
展望五:終端設備加載AI模型,推動換代升級回顧:AI原生硬件熱度沒有持續(xù)太久,傳統(tǒng)端側(cè)加載AI模型正在重塑用戶體驗。聯(lián)想率先交付真正的AI PC,足以容納完整而又最小可行的通用推理能力。高通X Elite等芯片將端側(cè)NPU算力推向50TOPS門檻。雷朋智能眼鏡全年出貨百萬副,Meta與谷歌都準備好了下一代產(chǎn)品。汽車行業(yè)言必稱端到端大模型,特斯拉的CyberCrab終于揭曉,2026年投產(chǎn)。
展望六:下一代閉源大模型推出,開始出現(xiàn)勝任人類水平的AGI“火花”,但規(guī)模邊際效應遞減展望七:數(shù)據(jù)來源的深度和廣度進一步開拓,進一步規(guī)范,更多合成數(shù)據(jù)與自然數(shù)據(jù)結(jié)合用于大模型訓練回顧:高質(zhì)量公開數(shù)據(jù)快速耗盡。GPT-5訓練遭遇了文本數(shù)據(jù)不足問題,OpenAI正在與主要媒體集團簽約合作。數(shù)據(jù)清洗的ScaleAI估值飆升到138億美元。Anthropic與Grok等企業(yè)被指游走于灰色地帶,違規(guī)爬蟲,漠視隱私。合成數(shù)據(jù)備受重視,英偉達開源了Nemotron-4,但使用不當導致模型污染崩潰。工業(yè)數(shù)據(jù)是具身智能的關(guān)鍵,但長期缺乏有效的數(shù)據(jù)治理。
展望八:蘋果真正入局,力爭復現(xiàn)AI“iPhone時刻”回顧:蘋果打破常規(guī)節(jié)奏發(fā)布了M4芯片,將AppleIntelligence集成入iOS18。它的個性與自然的交互體驗,在全技術(shù)棧保護用戶隱私,成為AI“iPhone時刻”的樣板。蘋果看好小模型(SLM),發(fā)布了DCLM-7B,還評估了規(guī)模參數(shù)低于2B的大模型的硬件和計算策略。它與OpenAI在模型與混合AI的合作,與AWS在芯片與云的合作,開始重塑當前的算力基礎(chǔ)設施格局。
展望九:一些開源模型及AI應用,因為無法建立起商業(yè)模式將面臨生存危機展望十:小模型結(jié)合軟硬件應用,新物種涌現(xiàn)回顧:領(lǐng)先開源模型追平發(fā)布已久的前沿封閉模型。Llama、Gemma、Mistral、Qwen歷次迭代,開源“小杯型”參數(shù)規(guī)模覆蓋更廣;蘋果專注小模型,微軟也不參與大模型競爭。中國算力緊缺,倒逼DeepSeek與零一等架構(gòu)創(chuàng)新,訓練出性能更強的小模型。它們可以部署于端側(cè)設備?ㄅ廖髡J為10億參數(shù)就能構(gòu)建認知核心。HuggingFace托管模型已破百萬,生態(tài)豐富。