展會信息港展會大全

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-16 10:11:49   瀏覽:104次  

導(dǎo)讀:2024年的最后一個月,全球AI圈好像約好了,一起開啟年底狂卷模式,批量發(fā)布新品!杆哪鞠鄬φ摗菇y(tǒng)計(jì),這場年末上新的“戰(zhàn)局”,至少有15家全球Top級AI公司,上新了20+個功能。在海外,最受關(guān)注的無疑是OpenAI開啟12天大放送,期貨Sora終于兌現(xiàn)。差不多同期,Google、xAI、World Labs、Meta、Amazon、Pika、Runway等海外名企,也都上新了AI功能。國內(nèi)的12月,大廠、六小虎和AI ......

2024年的最后一個月,全球AI圈好像約好了,一起開啟年底狂卷模式,批量發(fā)布新品。

「四木相對論」統(tǒng)計(jì),這場年末上新的“戰(zhàn)局”,至少有15家全球Top級AI公司,上新了20+個功能。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

在海外,最受關(guān)注的無疑是OpenAI開啟12天大放送,期貨Sora終于兌現(xiàn)。

差不多同期,Google、xAI、World Labs、Meta、Amazon、Pika、Runway等海外名企,也都上新了AI功能。

國內(nèi)的12月,大廠、六小虎和AI鯰魚DeepSeek,無一不踏入戰(zhàn)局。

“卷王”字節(jié)首當(dāng)其沖。它在豆包和即夢中上新了圖像理解能力。

六小虎中的MiniMax、階躍星辰、智譜AI,有的在卷模型,有的卷Agent應(yīng)用。Deepseek和騰訊,直接上新并開源了模型。

整體來看,各大公司近期的更新呈現(xiàn)以下特點(diǎn):

視覺能力和生產(chǎn)力場景,是兩大主題。

80%以上的更新都圍繞“視覺”。

可協(xié)作、可編輯是產(chǎn)品層更新的方向。

解析理解能力依舊是模型層的重點(diǎn)。

但卷歸卷,不少產(chǎn)品也因缺乏曝光等原因,發(fā)布得“悄無聲音”。

還有些萬眾期待的產(chǎn)品,比如Sora,收獲了滿屏差評。

在這個轟轟烈烈的12月,目前你記住了誰?

海外:OAI擠牙膏,其他家無人care?

這個12月,已經(jīng)加入AI上新戰(zhàn)局的海外公司,至少有OpenAI、Google、xAI、Meta、Amazon、Pika......

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

"營銷專家"OpenAI的聲勢最大。

12月6日,它拉開了“雙十二”的陣仗,要連做十二場發(fā)布會。

目前日程已經(jīng)進(jìn)入到第七天,發(fā)布成果如下:

Day1:發(fā)布o(jì)1正式版以及o1 Pro版本,以及200美元的ChatGPT Pro會員。

Day2: 介紹強(qiáng)化微調(diào)(Reinforcement Finetuning)功能,即通過少量數(shù)據(jù),讓模型在專業(yè)領(lǐng)域達(dá)專家水平。

Day3: Sora登場,接入了新模型Sora Turbo的Sora,最高上限支持生成1080p、20秒視頻,支持橫屏豎屏各種常見尺寸。

Day4: 發(fā)布生產(chǎn)力工具Canvas,該功能允許用戶與ChatGPT合作寫作和編碼。

Day5: ChatGPT融入蘋果生態(tài)。

Day6: 三個功能發(fā)布:實(shí)時視頻通話、實(shí)時理解幕、圣誕老人限定語音。

Day7: 推出了Projects In ChatGPT功能,可以將ChatGPT的各種功能整合至一處,便于用戶創(chuàng)建并管理各類項(xiàng)目。

不僅是OpenAI,Google、Pika、Midjourney、xAI也在這周有了新動作。

12月14日,Pika上新模型2.0,引入了場景元素(Scene Ingredients)功能。

這一功能允許用戶自由選擇角色、物品、服裝和場景元素,根據(jù)需求構(gòu)建特色鏡頭。同時, Pika 2.0支持多人在同一畫布上協(xié)作。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

12月12日凌晨,谷歌發(fā)布了Gemini2.0,聲稱“Gemini2.0 是我們迄今為止最新、功能最強(qiáng)大的 AI 模型!

這一模型,可以支持圖片、視頻和音頻等多模態(tài)的輸入和輸出,速度也是1.5Pro的兩倍,還能直接調(diào)用Google Search、代碼執(zhí)行等工具。

在Gemini2.0架構(gòu)之上,谷歌還推出或升級了三個新的AI Agent原型:通用大模型助手Project Astra、瀏覽器助手Project Mariner、編程助手Jules。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

不過Gemini2.0的聲量相較于Sora小得多。

幾乎官宣之后不到半小時, Gemini 2.0 詞條的熱度在Twitter上就已經(jīng)掉到了第8。在不斷下降的過程中,網(wǎng)友們還在分享 Sora 的鬼畜視頻,和 Hunyuan、Hailuo、Kling 與 Sora 的能力對比。

這可能也是因?yàn)镚emini 2.0 的更新,雖然好評很多,但至少從表述上看起來很“常規(guī)”:更快速的響應(yīng)、支持聯(lián)網(wǎng)搜索、新上線的“深度研究”功能支持多輪復(fù)雜推理、代碼生成增強(qiáng)、第三方工具調(diào)用能力補(bǔ)充。

同一天,Midjourney官宣了patchwork功能更新。

這是一個允許多人在線共同創(chuàng)建出一個世界的實(shí)驗(yàn)性功能,所有參與者將在一塊白板畫布上共同創(chuàng)作,(有點(diǎn)像Canva和Figma的共同編輯)。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

而且畫布還給了每個用戶的世界創(chuàng)建了一個傳送門,可以連接到別人的世界去。

之前Midjourney的更新,基本都圍繞著圖片生成的能力,比如支持AI修圖、支持新畫風(fēng)的模型等等。

但這次的Patchwork讓MJ在玩法上產(chǎn)生大不同,從一個只能一個人用的圖片生成工具,變成了一個可以讓大家一起玩起來的AI藝術(shù)創(chuàng)作產(chǎn)品。

手握巨卡的xAI,同樣在卷視覺方向。

12月10日,xAI發(fā)布了首款完全自研圖像生成模型Aurora。

Aurora已經(jīng)直接集成到了Grok,這是一個自回歸混合專家模型(MoE),在混合文本和圖像數(shù)據(jù)集上完成了訓(xùn)練。除了圖片生成,Grok還有編輯能力,用戶可以直接在生成的圖像上進(jìn)行修改,這一功能也將上線X。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

Meta也在12月7日發(fā)布了Llama 3.3,在性能上開卷。

據(jù)說,現(xiàn)在70B的版本就能實(shí)現(xiàn)以前405B的性能。

它在指令遵循(IFEval)、數(shù)學(xué)(MATH)、推理(GPQA Diamond)等領(lǐng)域,水平都超過了七月份發(fā)布的Llama 3.1 405B。在語言(MMLU)、代碼(HumanEval)、長文本和多語種能力上,成績也和Llama 3.1 405B比較接近。

官方將Llama 3.3的進(jìn)步歸功于新的對齊過程和在線強(qiáng)化學(xué)習(xí)技術(shù)的進(jìn)步。

Runway則在前一天,12月6日更新了自己的act-one功能。

這個新功能允許用戶將自己拍攝的表演動作或聲音直接“套用”到已有的視頻角色上(包括AI角色)。

在12月最早打響發(fā)布“競賽”的,其實(shí)是“AI教母”李飛飛。

12月3日,李飛飛創(chuàng)立的World Labs首次官宣了「空間智能」模型,利用一張圖,就能生成一個3D世界。

這些3D場景都能在瀏覽器中實(shí)時渲染,還能實(shí)現(xiàn)可控的相機(jī)效果,可調(diào)節(jié)的模擬景深。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

也是在同一天,亞馬遜對外發(fā)布了多模態(tài)模型Nova系列。

亞馬遜這次直接發(fā)了一個大號全家桶,包括:

超快速文本生成模型Amazon Nova Micro,能夠處理文本、圖像和視頻并生成文本的多模態(tài)模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier,用于生成高質(zhì)量圖像的Amazon Nova Canvas和用于生成高質(zhì)量視頻的Amazon Nova Reel。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

不管這一波海外年底上新如何轟轟烈烈,看起來,很多人只關(guān)注了Sora。

好吧,OpenAI的營銷又贏了。

國內(nèi):六小虎大廠混戰(zhàn)視覺

相比海外,國內(nèi)廠商們的“卷”勢更早出現(xiàn)。

各家的方向從模型卷到產(chǎn)品,離不開視覺和生產(chǎn)力兩個話題。

「四木相對論」也對近半個月的新品進(jìn)行了匯總:

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

大公司里,字節(jié)和騰訊是12月最卷的大廠(通義千問在11月28日發(fā)布了QWQ模型)。

在這個月里,前者在豆包和即夢上先后更新功能,后者一下子開源了視頻生成模型。

先看字節(jié)。

12月10日,豆包官方表示,電腦版的視頻生成功能已經(jīng)開啟內(nèi)測。

獲得內(nèi)測資格的賬號顯示,每日可免費(fèi)生成十支視頻。內(nèi)測申請通過后,選擇“視頻生成”功能,上傳一張圖片,輸入提示詞,并添加運(yùn)鏡、分鏡信息,就能生成短視頻。

再往前的12月5日,豆包增加了AI生成文字圖功能。

也就是說,用戶現(xiàn)在可以在提示詞中加入文本要求,生成帶有指定文字的圖片,做海報、做表情包都能用。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

(四木用豆包做的圖,強(qiáng)調(diào)了「四木廚房」)

類似的功能還體現(xiàn)在即夢上。

12月2日晚,即夢上新2.1模型。這次的模型突破體現(xiàn)在中文文字穩(wěn)定生成,當(dāng)然也支持英文。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

騰訊混元這個月最大的動作,就是正式上線視頻生成能力。

12月3日,騰訊不僅上線了這個130億參數(shù)的模型,還開源了。

目前,模型已上線騰訊元寶APP,用戶可在AI應(yīng)用中的“AI視頻”板塊申請?jiān)囉。企業(yè)客戶通過騰訊云提供服務(wù)接入,API同步開放內(nèi)測申請。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

「四木相對論」觀察到,騰訊混元系列模型在這兩個月動作比較頻繁。

11月初,它宣布最新的MoE模型“混元Large”以及混元3D生成大模型“ Hunyuan3D-1.0”正式開源。12月又上新文生視頻能力,正式加入了卷視頻模型的隊(duì)列。

大廠之外,大模型六小虎中的三虎智譜AI、MiniMax和階躍星辰也在本月上新。

先來看智譜。

12月的智譜,在模型和應(yīng)用兩端發(fā)力。首先是多模態(tài)模型  GLM-4V-Flash上線了智譜的開放平臺,可以免費(fèi)調(diào)用。

GLM-4V-Flash 模型擁有圖像描述生成、圖像分類、視覺推理、視覺問答(VQA)以及圖像情感分析等圖像處理功能。

多模態(tài)/視覺類的 API 都非常的貴,號稱視覺能力對標(biāo) GPT-4o mini 模型的 GLM-4V-FlashAPI免費(fèi),也稱得上是真卷。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

產(chǎn)品方面,Auto-GLM是智譜近期的重點(diǎn)。

首先智譜在11月29日發(fā)布了Auto-GLM的手機(jī)版和電腦版。半個月之后的12月12日,Auto-GLM又更新了一個版本。

用戶打開 AutoGLM 后,可以語音發(fā)指令,讓智能體接管自己的手機(jī),并在可操作的 App 上自動執(zhí)行購買外賣,訂高鐵票、目的地導(dǎo)航等任務(wù)。

經(jīng)過「四木相對論」測試,更新之后Auto-GLM支持的應(yīng)用更穩(wěn)定。同時它還增加了自定義高頻短口令,快速觸發(fā)常用任務(wù)等功能。

智譜 CEO 張鵬在發(fā)布會現(xiàn)場的AI發(fā)紅包操作一度刷屏!杆哪鞠鄬φ摗挂矎(fù)刻了“AI發(fā)的第一個紅包”。

Minimax,同樣在這個月卷起了多模態(tài)。

12月3日,海螺 AI 圖生視頻模型 I2V-01-Live 上線了。

視頻生成一定是MiniMax今年的亮點(diǎn)之一。之前,MiniMax的亮點(diǎn)幾乎全部集中于Talkie,但海螺視頻的上線,打破了這一印象。

這次 I2V-01-Live,更新了二維插畫的動態(tài)呈現(xiàn)方式,讓動畫穩(wěn)定性和細(xì)膩表現(xiàn)力有了增強(qiáng)。一張圖+一句話就能將 2D 插畫轉(zhuǎn)化為動態(tài)視頻。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

一直略顯低調(diào)的另一只小虎,階躍星辰也有模型層的更新。

周五(12月13日)階躍星辰發(fā)布了端到端語音大模型Step-1o 。

從官方介紹來看,Step-1o 支持語音、文本等混合形式的輸入和輸出,能理解和模仿音色、韻律、方言、個性化的口語表達(dá)習(xí)慣等聲音特征。它還能夠通過自學(xué)和模仿不斷提升回復(fù)質(zhì)量,提供解決問題的專業(yè)建議。

場景上,它支持包括新聞播報、聊天陪伴、有聲讀物、在線教育、智能硬件、汽車等對語音交互技術(shù)的需求。

近期,Step-1o 將接入躍問 App 端,實(shí)現(xiàn)實(shí)時語音通話服務(wù)。

國內(nèi)AI圈另一無法忽視的角色DeepSeek,在短短半月內(nèi)進(jìn)行了兩次上新。

最新開源的DeepSeek-VL2 (12月13日發(fā)布)是一個專家混合(MoE)語言模型。

DeepSeek-VL2 比一代 DeepSeek-VL 多一倍優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),引入梗圖理解、視覺定位、視覺故事生成等新能力。視覺部分使用切圖策略支持動態(tài)分辨率圖像,語言部分采用 MoE 架構(gòu)低成本高性能。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

這次大模型價格“卷王”,更是在視覺模型上開“卷”。

根據(jù)DeepSeek提供的評測對比,DeepSeek-VL2在相似或更少的激活參數(shù)下實(shí)現(xiàn)了競爭性或最先進(jìn)的性能。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

另外,DeepSeek V2.5系列的最終版微調(diào)模型DeepSeek-V2.5-1210也在2月10日更新。

據(jù)官網(wǎng)介紹,這次更新通過 Post-Training 全面提升了模型各方面能力表現(xiàn),包括數(shù)學(xué)、代碼、寫作、角色扮演等。同時,新版模型優(yōu)化了文件上傳功能,并且全新支持了聯(lián)網(wǎng)搜索,可以服務(wù)各類工作生活場景。

史上最卷12月:全球15家Top級AI公司瘋狂上新,你記住了誰?

不同于某些AI公司只強(qiáng)調(diào)功能或者模型的偏好,這次DeepSeekV2.5-1210模型更新后,它的Chat窗口呈現(xiàn)出兩個Tag“深度思考”和“聯(lián)網(wǎng)搜索”。

這似乎在告訴外界:產(chǎn)品日常場景和模型推理能力,我全都要。真的是卷王了。

12月才剛剛過半,接下來AI圈的上新還會繼續(xù)。

畢竟,OpenAI的年末發(fā)布剛剛走過一半。字節(jié)也會在下周舉行大會,強(qiáng)調(diào)豆包、即夢的更新。

最卷12月,AI永不眠。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港