DeepSeek“轟炸”數(shù)日,OpenAI終于出手。
當(dāng)?shù)貢r間1月31日,人工智能(AI)巨頭OpenAI正式發(fā)布推理模型o3-mini,支持low、medium和high低中高三種推理難度。
目前ChatGPT Plus、團隊和Pro用戶可以直接使用o3-mini,企業(yè)用戶將于2月推出。所有付費用戶可以在模型中選擇o3-mini-high,以獲得生成回復(fù)時間稍長的高智能版本。專業(yè)用戶可以無限制使用o3-mini和o3-mini-high。
同時,免費用戶也可以通過勾選 “推理”來使用o3-mini,這也是ChatGPT首次向免費用戶提供推理模型。
ChatGPT免費用戶也支持推理模型的使用。
作為此次升級的一部分,OpenAI把Plus和團隊用戶的速率限制,從o1-mini的每天50條信息提高到o3-mini的每天150 條信息。此外,o3-mini還能通過搜索功能查找最新答案,并提供相關(guān)的網(wǎng)絡(luò)鏈接。OpenAI表示,這是公司在推理模型中整合搜索功能的早期原型。
OpenAI表示o3-mini是公司推理系列中最新、最具成本效益的模型,旨在推動高性價比推理的發(fā)展。
與o1類似,o3-mini針對STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))推理進行了優(yōu)化。o3-mini-medium的能力在數(shù)學(xué)、編碼和科學(xué)方面與o1表現(xiàn)相當(dāng),響應(yīng)速度更快。專家測試人員的評估表明,與o1-mini相比,o3-mini的答案更準(zhǔn)確、更清晰,推理能力更強。測試人員在56%的時間里更喜歡o3-mini的回答,并觀察到在困難的現(xiàn)實問題上重大錯誤減少了39%。o3-mini-medium在一些最具挑戰(zhàn)性的推理和智力評估(包括AIME競賽數(shù)學(xué)和GPQA博士水平的專家推理)上的表現(xiàn)與o1相當(dāng)。同時,o3-mini的響應(yīng)速度比o1-mini快24%,平均響應(yīng)時間為7.7秒,而o1-mini為10.16秒。
不過o3-mini暫不支持視覺功能,開發(fā)者需要繼續(xù)使用 o1進行視覺推理任務(wù)。
o3-mini與o1在AIME競賽數(shù)學(xué)的得分對比。
模型發(fā)布后,OpenAI的核心團隊也密集回答了網(wǎng)友的問題。
對于DeepSeek,OpenAI CEO山姆奧特曼(Sam Altman)稱:“這是一個非常好的模型!我們將生產(chǎn)出更好的模型,但領(lǐng)先優(yōu)勢將不會像前幾年那么大了。”
在另一個問答中,奧特曼表示,在開源權(quán)重模型和研究成果這個問題上,“我個人認(rèn)為,我們已經(jīng)站在了歷史的錯誤一邊,需要制定不同的開源策略。OpenAI并非所有人都認(rèn)同這一觀點,這也不是我們當(dāng)前最首要的事項。”
山姆奧特曼回答網(wǎng)友提問。
當(dāng)被問及遞歸自我改進是一個漸進的過程還是一個艱難的起飛過程時,奧特曼表示個人認(rèn)為快速起飛比幾年前想的更有可能。
值得注意的是,此次新發(fā)布的o3-mini也展示了回答提問是的思考邏輯。對于思維鏈展示,有網(wǎng)友詢問是否后續(xù)是否能看到模型思考的所有token,奧特曼表示很快就會展示一個更有用、更詳細(xì)的版本,并感謝R1提供的最新信息。
有網(wǎng)友問及o3 mini價格與DeepSeek和Gemini相比仍然沒有競爭力時,OpenAI API研究主管米歇爾波克拉斯(Michelle Pokrass)的回答是:“o3-mini與美國托管的 DeepSeek版本相比具有競爭力。我們認(rèn)為對于這種級別的智能來說,這是一個真正實惠的選擇!
此外,奧特曼還表示將會在推理模型中增加文件附件功能,同時,隨著時間的推移,會考慮減少Plus會員價格的提高。
根據(jù)此前發(fā)布會上的表述,o3將會在mini正式發(fā)布后上線。那么究竟?jié)M血版o3何時上線?奧特曼依舊沒有給出具體時間,只是稱“我猜會是幾周以上,幾個月以下”。
此前,據(jù)外媒報道,OpenAI正以3000億美元的估值尋求新一輪400億美元的融資。本輪融資由軟銀領(lǐng)投,軟銀計劃最多向OpenAI投資250億美元。這一融資規(guī)模將打破OpenAI上一輪創(chuàng)下的硅谷單輪融資紀(jì)錄,而公司的估值相較于上一輪的1500億美元足足翻了一倍。
當(dāng)?shù)貢r間2月1日,奧特曼在o3-mini正式發(fā)布的消息下面跟帖表示:“很多人更喜歡這個而不是o1,而且它只是mini版本的模型!