今年過年,年味濃不濃俺不好說,但 AI 味肯定是夠夠的了。
小到年夜飯桌,大到熱搜新聞,哪哪都是 DeepSeek ,就連世超家族群里平時不咋關(guān)注科技的親戚,也在說中國的人工智能這次勝了老美一籌。
這么說吧, DeepSeek 憑一己之力,拉高了全國對 AI 的認(rèn)知程度。
至于 DeepSeek 到底有多厲害,想必這段時間哥幾個也已經(jīng)上手體驗(yàn)過了,說它是目前最懂中文互聯(lián)網(wǎng)的 AI 模型,應(yīng)該沒人有意見吧?
反正從身邊人統(tǒng)計(jì)學(xué)來看,這段時間什么 Claude 、 ChatGPT 通通都不香了。
不過大伙兒也先別急著開香檳,這次 DeepSeek 一冒頭,對手們就從四面八方吻了上來。
OpenAI 大年初四發(fā) o3 推理模型,今天又免費(fèi)開放了搜索功能,谷歌的 Gemini2.0 全量開放,還有阿里的 Qwen2.5-Max 也發(fā)力打榜 DeepSeek 。。。
要我說,這些科技公司還是得逼一把,不然你都不知道他們的實(shí)力到底有多少。
先說 OpenAI 的 o3 ,去年底的發(fā)布會就傳出了消息,說今年 1 月份要上線。
但奧特曼估計(jì)也沒想到,被 DeepSeek 狙了一手,現(xiàn)在這個發(fā)布的時間節(jié)點(diǎn),多少就有點(diǎn)耐人尋味了。包括世超也覺著, o3-mini 的發(fā)布是為了反擊 DeepSeek 。
當(dāng)然回到正題啊,這次的 o3-mini ,號稱是他們的推理系列中最具成本效益的模型,還尤其擅長科學(xué)、數(shù)學(xué)和編碼,響應(yīng)的速度也更快。
一句話總結(jié), o3-mini 就像一個家庭條件一般,但智商很高的理科學(xué)霸。
就拿編程來說,除了 o3-mini ( low )打不過 o1 以外, o3-mini 三個檔位的模型,基本亂殺前輩 o1 系列。
競賽數(shù)學(xué)也不在話下, o3-mini ( high )的表現(xiàn)都要好過 o1 系列。
就連博士級別的題目, o3-mini 也能跟 o1 系列打得有來有回。
x 上有老哥用同一組 prompt 測試了 o3-mini 和 DeepSeek R1 ,得出的結(jié)論是 “ o3-mini ( 編程能力 )碾壓 DeepSeek R1 ” 。
說實(shí)話,光看視頻的話,確實(shí)是 o3-mini 的效果更逼真。
另外一位老哥也測試了一把 o3-mini 的物理理解能力( prompt :編寫一個球在超立方體內(nèi)彈跳的 Python 腳本 ),直接夸 o3-mini 可能是物理學(xué)得最好的模型。
反正看了一波大伙兒的測試,世超覺著 o3-mini 似乎更接近咱們一直在說的,能夠理解物理世界、模擬物理規(guī)律的世界模型。
重點(diǎn)是, o3-mini 現(xiàn)在免費(fèi)就能用上,可比之前的 o1 要大方的多了。
而且, o3-mini 只是 o3 系列的第一個版本,后面還會有滿血版的 o3 出來。我的建議是讓 DeepSeek 再整個大活,給奧特曼上點(diǎn)強(qiáng)度,到時候指不定還會有大升級。
這不,除了發(fā)布 o3-mini 外, OpenAI 又趁著咱們開工的這兩天,免費(fèi)開放了 ChatGPT 搜索。
現(xiàn)在你甚至都不需要注冊,就能直接用。
過年那陣,微軟也讓所有的 Copilot 用戶免費(fèi)用上了 o1 推理模型,要不說還得謝謝 DeepSeek 呢。
另外一邊,谷歌也有點(diǎn)坐不住了。
同樣是去年 12 月發(fā)布 Gemini 2.0 ,但那會兒只有開發(fā)者和一部分測試者能用,一直咕咕咕也不見有動靜。
結(jié)果被 DeepSeek 這么一激,一口氣發(fā)了三個版本的 Gemini2.0 模型。
基準(zhǔn)測試中,各方面性能也都優(yōu)于前代模型。
但相比 DeepSeek 和 OpenAI 的熱度,谷歌這邊多少就顯得有些無人在意了。
再來看國內(nèi)的情況,阿里云算是第一個對 DeepSeek 發(fā)起 “ 進(jìn)攻 ” 的公司。
根據(jù)阿里云官方的說法, Qwen2.5-Max 在多個基準(zhǔn)測試中,超越 DeepSeek V3 、 o1-mini 等多個模型。
并且在 Chatbot Arena 的大模型盲測排行榜上, Qwen2.5-Max 沖到了第七的位置。
具體看模型的數(shù)學(xué)和編程能力,甚至還能拿第一。
所以 Qwen2.5-Max 在發(fā)布后,國內(nèi)有不少媒體都出來捧了一波。
反正世超看下來,這次由 DeepSeek 掀起的新一輪 AI 軍備競賽,領(lǐng)頭的這一批公司已經(jīng)掏出了不少真家伙。
不過說實(shí)在的, DeepSeek 這出后來者居上的戲碼,的確給咱上了一課。
指不定后邊兒還會有更加出色的模型出現(xiàn),畢竟有 DeepSeek R1 的珠玉在前,如果再不拿出點(diǎn)實(shí)力相當(dāng),或者足夠炸場的東西來,那就沒啥意思了。
咱們坐著等就成,今年的模型大戰(zhàn)肯定有的看了。