當(dāng)前位置：人工智能實(shí)驗(yàn)室> 企業(yè)新聞 > 史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-16 10:11:49 瀏覽：104次

導(dǎo)讀：2024年的最后一個月，全球AI圈好像約好了，一起開啟年底狂卷模式，批量發(fā)布新品�！杆哪鞠鄬φ摗菇y(tǒng)計(jì)，這場年末上新的“戰(zhàn)局”，至少有15家全球Top級AI公司，上新了20+個功能。在海外，最受關(guān)注的無疑是OpenAI開啟12天大放送，期貨Sora終于兌現(xiàn)。差不多同期，Google、xAI、World Labs、Meta、Amazon、Pika、Runway等海外名企，也都上新了AI功能。國內(nèi)的12月，大廠、六小虎和AI ......

2024年的最后一個月，全球AI圈好像約好了，一起開啟年底狂卷模式，批量發(fā)布新品。

「四木相對論」統(tǒng)計(jì)，這場年末上新的“戰(zhàn)局”，至少有15家全球Top級AI公司，上新了20+個功能。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

在海外，最受關(guān)注的無疑是OpenAI開啟12天大放送，期貨Sora終于兌現(xiàn)。

差不多同期，Google、xAI、World Labs、Meta、Amazon、Pika、Runway等海外名企，也都上新了AI功能。

國內(nèi)的12月，大廠、六小虎和AI鯰魚DeepSeek，無一不踏入戰(zhàn)局。

“卷王”字節(jié)首當(dāng)其沖。它在豆包和即夢中上新了圖像理解能力。

六小虎中的MiniMax、階躍星辰、智譜AI，有的在卷模型，有的卷Agent應(yīng)用。Deepseek和騰訊，直接上新并開源了模型。

整體來看，各大公司近期的更新呈現(xiàn)以下特點(diǎn)：

視覺能力和生產(chǎn)力場景，是兩大主題。

80%以上的更新都圍繞“視覺”。

可協(xié)作、可編輯是產(chǎn)品層更新的方向。

解析理解能力依舊是模型層的重點(diǎn)。

但卷歸卷，不少產(chǎn)品也因缺乏曝光等原因，發(fā)布得“悄無聲音”。

還有些萬眾期待的產(chǎn)品，比如Sora，收獲了滿屏差評。

在這個轟轟烈烈的12月，目前你記住了誰？

海外：OAI擠牙膏，其他家無人care？

這個12月，已經(jīng)加入AI上新戰(zhàn)局的海外公司，至少有OpenAI、Google、xAI、Meta、Amazon、Pika......

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

"營銷專家"OpenAI的聲勢最大。

12月6日，它拉開了“雙十二”的陣仗，要連做十二場發(fā)布會。

目前日程已經(jīng)進(jìn)入到第七天，發(fā)布成果如下：

Day1：發(fā)布o(jì)1正式版以及o1 Pro版本，以及200美元的ChatGPT Pro會員。

Day2: 介紹強(qiáng)化微調(diào)（Reinforcement Finetuning）功能，即通過少量數(shù)據(jù)，讓模型在專業(yè)領(lǐng)域達(dá)專家水平。

Day3: Sora登場，接入了新模型Sora Turbo的Sora，最高上限支持生成1080p、20秒視頻，支持橫屏豎屏各種常見尺寸。

Day4: 發(fā)布生產(chǎn)力工具Canvas，該功能允許用戶與ChatGPT合作寫作和編碼。

Day5: ChatGPT融入蘋果生態(tài)。

Day6: 三個功能發(fā)布：實(shí)時視頻通話、實(shí)時理解幕、圣誕老人限定語音。

Day7: 推出了Projects In ChatGPT功能，可以將ChatGPT的各種功能整合至一處，便于用戶創(chuàng)建并管理各類項(xiàng)目。

不僅是OpenAI，Google、Pika、Midjourney、xAI也在這周有了新動作。

12月14日，Pika上新模型2.0，引入了場景元素（Scene Ingredients）功能。

這一功能允許用戶自由選擇角色、物品、服裝和場景元素，根據(jù)需求構(gòu)建特色鏡頭。同時， Pika 2.0支持多人在同一畫布上協(xié)作。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

12月12日凌晨，谷歌發(fā)布了Gemini2.0，聲稱“Gemini2.0 是我們迄今為止最新、功能最強(qiáng)大的 AI 模型�！�

這一模型，可以支持圖片、視頻和音頻等多模態(tài)的輸入和輸出，速度也是1.5Pro的兩倍，還能直接調(diào)用Google Search、代碼執(zhí)行等工具。

在Gemini2.0架構(gòu)之上，谷歌還推出或升級了三個新的AI Agent原型：通用大模型助手Project Astra、瀏覽器助手Project Mariner、編程助手Jules。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

不過Gemini2.0的聲量相較于Sora小得多。

幾乎官宣之后不到半小時， Gemini 2.0 詞條的熱度在Twitter上就已經(jīng)掉到了第8。在不斷下降的過程中，網(wǎng)友們還在分享 Sora 的鬼畜視頻，和 Hunyuan、Hailuo、Kling 與 Sora 的能力對比。

這可能也是因?yàn)镚emini 2.0 的更新，雖然好評很多，但至少從表述上看起來很“常規(guī)”：更快速的響應(yīng)、支持聯(lián)網(wǎng)搜索、新上線的“深度研究”功能支持多輪復(fù)雜推理、代碼生成增強(qiáng)、第三方工具調(diào)用能力補(bǔ)充。

同一天，Midjourney官宣了patchwork功能更新。

這是一個允許多人在線共同創(chuàng)建出一個世界的實(shí)驗(yàn)性功能，所有參與者將在一塊白板畫布上共同創(chuàng)作，(有點(diǎn)像Canva和Figma的共同編輯)。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

而且畫布還給了每個用戶的世界創(chuàng)建了一個傳送門，可以連接到別人的世界去。

之前Midjourney的更新，基本都圍繞著圖片生成的能力，比如支持AI修圖、支持新畫風(fēng)的模型等等。

但這次的Patchwork讓MJ在玩法上產(chǎn)生大不同，從一個只能一個人用的圖片生成工具，變成了一個可以讓大家一起玩起來的AI藝術(shù)創(chuàng)作產(chǎn)品。

手握巨卡的xAI，同樣在卷視覺方向。

12月10日，xAI發(fā)布了首款完全自研圖像生成模型Aurora。

Aurora已經(jīng)直接集成到了Grok，這是一個自回歸混合專家模型（MoE），在混合文本和圖像數(shù)據(jù)集上完成了訓(xùn)練。除了圖片生成，Grok還有編輯能力，用戶可以直接在生成的圖像上進(jìn)行修改，這一功能也將上線X。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

Meta也在12月7日發(fā)布了Llama 3.3，在性能上開卷。

據(jù)說，現(xiàn)在70B的版本就能實(shí)現(xiàn)以前405B的性能。

它在指令遵循（IFEval）、數(shù)學(xué)（MATH）、推理（GPQA Diamond）等領(lǐng)域，水平都超過了七月份發(fā)布的Llama 3.1 405B。在語言（MMLU）、代碼（HumanEval）、長文本和多語種能力上，成績也和Llama 3.1 405B比較接近。

官方將Llama 3.3的進(jìn)步歸功于新的對齊過程和在線強(qiáng)化學(xué)習(xí)技術(shù)的進(jìn)步。

Runway則在前一天，12月6日更新了自己的act-one功能。

這個新功能允許用戶將自己拍攝的表演動作或聲音直接“套用”到已有的視頻角色上（包括AI角色）。

在12月最早打響發(fā)布“競賽”的，其實(shí)是“AI教母”李飛飛。

12月3日，李飛飛創(chuàng)立的World Labs首次官宣了「空間智能」模型，利用一張圖，就能生成一個3D世界。

這些3D場景都能在瀏覽器中實(shí)時渲染，還能實(shí)現(xiàn)可控的相機(jī)效果，可調(diào)節(jié)的模擬景深。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

也是在同一天，亞馬遜對外發(fā)布了多模態(tài)模型Nova系列。

亞馬遜這次直接發(fā)了一個大號全家桶，包括：

超快速文本生成模型Amazon Nova Micro，能夠處理文本、圖像和視頻并生成文本的多模態(tài)模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier，用于生成高質(zhì)量圖像的Amazon Nova Canvas和用于生成高質(zhì)量視頻的Amazon Nova Reel。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

不管這一波海外年底上新如何轟轟烈烈，看起來，很多人只關(guān)注了Sora。

好吧，OpenAI的營銷又贏了。

國內(nèi)：六小虎大廠混戰(zhàn)視覺

相比海外，國內(nèi)廠商們的“卷”勢更早出現(xiàn)。

各家的方向從模型卷到產(chǎn)品，離不開視覺和生產(chǎn)力兩個話題。

「四木相對論」也對近半個月的新品進(jìn)行了匯總：

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

大公司里，字節(jié)和騰訊是12月最卷的大廠（通義千問在11月28日發(fā)布了QWQ模型）。

在這個月里，前者在豆包和即夢上先后更新功能，后者一下子開源了視頻生成模型。

先看字節(jié)。

12月10日，豆包官方表示，電腦版的視頻生成功能已經(jīng)開啟內(nèi)測。

獲得內(nèi)測資格的賬號顯示，每日可免費(fèi)生成十支視頻。內(nèi)測申請通過后，選擇“視頻生成”功能，上傳一張圖片，輸入提示詞，并添加運(yùn)鏡、分鏡信息，就能生成短視頻。

再往前的12月5日，豆包增加了AI生成文字圖功能。

也就是說，用戶現(xiàn)在可以在提示詞中加入文本要求，生成帶有指定文字的圖片，做海報、做表情包都能用。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

（四木用豆包做的圖，強(qiáng)調(diào)了「四木廚房」）

類似的功能還體現(xiàn)在即夢上。

12月2日晚，即夢上新2.1模型。這次的模型突破體現(xiàn)在中文文字穩(wěn)定生成，當(dāng)然也支持英文。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

騰訊混元這個月最大的動作，就是正式上線視頻生成能力。

12月3日，騰訊不僅上線了這個130億參數(shù)的模型，還開源了。

目前，模型已上線騰訊元寶APP，用戶可在AI應(yīng)用中的“AI視頻”板塊申請?jiān)囉�。企業(yè)客戶通過騰訊云提供服務(wù)接入，API同步開放內(nèi)測申請。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

「四木相對論」觀察到，騰訊混元系列模型在這兩個月動作比較頻繁。

11月初，它宣布最新的MoE模型“混元Large”以及混元3D生成大模型“ Hunyuan3D-1.0”正式開源。12月又上新文生視頻能力，正式加入了卷視頻模型的隊(duì)列。

大廠之外，大模型六小虎中的三虎智譜AI、MiniMax和階躍星辰也在本月上新。

先來看智譜。

12月的智譜，在模型和應(yīng)用兩端發(fā)力。首先是多模態(tài)模型 GLM-4V-Flash上線了智譜的開放平臺，可以免費(fèi)調(diào)用。

GLM-4V-Flash 模型擁有圖像描述生成、圖像分類、視覺推理、視覺問答（VQA）以及圖像情感分析等圖像處理功能。

多模態(tài)/視覺類的 API 都非常的貴，號稱視覺能力對標(biāo) GPT-4o mini 模型的 GLM-4V-FlashAPI免費(fèi)，也稱得上是真卷。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

產(chǎn)品方面，Auto-GLM是智譜近期的重點(diǎn)。

首先智譜在11月29日發(fā)布了Auto-GLM的手機(jī)版和電腦版。半個月之后的12月12日，Auto-GLM又更新了一個版本。

用戶打開 AutoGLM 后，可以語音發(fā)指令，讓智能體接管自己的手機(jī)，并在可操作的 App 上自動執(zhí)行購買外賣，訂高鐵票、目的地導(dǎo)航等任務(wù)。

經(jīng)過「四木相對論」測試，更新之后Auto-GLM支持的應(yīng)用更穩(wěn)定。同時它還增加了自定義高頻短口令，快速觸發(fā)常用任務(wù)等功能。

智譜 CEO 張鵬在發(fā)布會現(xiàn)場的AI發(fā)紅包操作一度刷屏�！杆哪鞠鄬φ摗挂矎�(fù)刻了“AI發(fā)的第一個紅包”。

Minimax，同樣在這個月卷起了多模態(tài)。

12月3日，海螺 AI 圖生視頻模型 I2V-01-Live 上線了。

視頻生成一定是MiniMax今年的亮點(diǎn)之一。之前，MiniMax的亮點(diǎn)幾乎全部集中于Talkie，但海螺視頻的上線，打破了這一印象。

這次 I2V-01-Live，更新了二維插畫的動態(tài)呈現(xiàn)方式，讓動畫穩(wěn)定性和細(xì)膩表現(xiàn)力有了增強(qiáng)。一張圖+一句話就能將 2D 插畫轉(zhuǎn)化為動態(tài)視頻。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

一直略顯低調(diào)的另一只小虎，階躍星辰也有模型層的更新。

周五（12月13日）階躍星辰發(fā)布了端到端語音大模型Step-1o 。

從官方介紹來看，Step-1o 支持語音、文本等混合形式的輸入和輸出，能理解和模仿音色、韻律、方言、個性化的口語表達(dá)習(xí)慣等聲音特征。它還能夠通過自學(xué)和模仿不斷提升回復(fù)質(zhì)量，提供解決問題的專業(yè)建議。

場景上，它支持包括新聞播報、聊天陪伴、有聲讀物、在線教育、智能硬件、汽車等對語音交互技術(shù)的需求。

近期，Step-1o 將接入躍問 App 端，實(shí)現(xiàn)實(shí)時語音通話服務(wù)。

國內(nèi)AI圈另一無法忽視的角色DeepSeek，在短短半月內(nèi)進(jìn)行了兩次上新。

最新開源的DeepSeek-VL2 （12月13日發(fā)布）是一個專家混合（MoE）語言模型。

DeepSeek-VL2 比一代 DeepSeek-VL 多一倍優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)，引入梗圖理解、視覺定位、視覺故事生成等新能力。視覺部分使用切圖策略支持動態(tài)分辨率圖像，語言部分采用 MoE 架構(gòu)低成本高性能。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

這次大模型價格“卷王”，更是在視覺模型上開“卷”。

根據(jù)DeepSeek提供的評測對比，DeepSeek-VL2在相似或更少的激活參數(shù)下實(shí)現(xiàn)了競爭性或最先進(jìn)的性能。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

另外，DeepSeek V2.5系列的最終版微調(diào)模型DeepSeek-V2.5-1210也在2月10日更新。

據(jù)官網(wǎng)介紹，這次更新通過 Post-Training 全面提升了模型各方面能力表現(xiàn)，包括數(shù)學(xué)、代碼、寫作、角色扮演等。同時，新版模型優(yōu)化了文件上傳功能，并且全新支持了聯(lián)網(wǎng)搜索，可以服務(wù)各類工作生活場景。

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？

不同于某些AI公司只強(qiáng)調(diào)功能或者模型的偏好，這次DeepSeekV2.5-1210模型更新后，它的Chat窗口呈現(xiàn)出兩個Tag“深度思考”和“聯(lián)網(wǎng)搜索”。

這似乎在告訴外界：產(chǎn)品日常場景和模型推理能力，我全都要。真的是卷王了。

12月才剛剛過半，接下來AI圈的上新還會繼續(xù)。

畢竟，OpenAI的年末發(fā)布剛剛走過一半。字節(jié)也會在下周舉行大會，強(qiáng)調(diào)豆包、即夢的更新。

最卷12月，AI永不眠。

相關(guān)熱詞： ai公司 openai google pika sora gpt 愛因斯坦相對論

上一篇：Liquid AI獲AMD領(lǐng)投2.5億美元融資，用靈活高效的“液態(tài)”模型挑戰(zhàn)Transformer

下一篇：大模型預(yù)訓(xùn)練時代即將終結(jié)! AI巨佬Ilya最新頂會演講全程

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-16 10:11:49 瀏覽：104次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？ 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-16 10:11:49 瀏覽：104次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

史上最卷12月：全球15家Top級AI公司瘋狂上新，你記住了誰？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-16 10:11:49 瀏覽：104次