界面新聞?dòng)浾?| 伍洋宇
界面新聞編輯 | 宋佳楠
OpenAI還是那個(gè)最會(huì)玩營(yíng)銷的AI公司,早早預(yù)告了自己的“12 Days of Christmas”,這將是其年底最重要的一系列發(fā)布會(huì)。
12月6日凌晨,OpenAI年末狂歡“Day 1”開啟,在山姆奧特曼的總結(jié)下,兩項(xiàng)更新最為重磅:o1模型“滿血版”,以及價(jià)值200美元/月的ChatGPT Pro訂閱計(jì)劃。
相較于三個(gè)月前發(fā)布的o1-preview,o1的智能水平、處理速度、多模態(tài)能力均有明顯變化。
通過(guò)模型解決數(shù)學(xué)競(jìng)賽題、編程競(jìng)賽題的結(jié)果呈現(xiàn),o1對(duì)比o1-preview的智能水平普遍上升40%-50%,不過(guò)在博士級(jí)別科學(xué)問(wèn)題的處理上,o1表現(xiàn)反倒稍遜o1-preview。
圖片來(lái)源:OpenAI
山姆奧特曼提到,o1在處理復(fù)雜問(wèn)題時(shí)的重大錯(cuò)誤率降低了34%,并且不再是所有難度的問(wèn)題都會(huì)花費(fèi)較長(zhǎng)時(shí)間,新版o1會(huì)根據(jù)問(wèn)題的難易程度調(diào)整處理時(shí)間,簡(jiǎn)單問(wèn)題往往僅需幾秒,而非幾分鐘,這個(gè)調(diào)整可讓用戶等待時(shí)間普遍下調(diào)50%,也解決了o1模式此前最受詬病的問(wèn)題之一。
更重要的是,新版o1加入了多模態(tài)識(shí)別能力。OpenAI對(duì)此的展現(xiàn)方式格外“硬核”,o1負(fù)責(zé)人直接手繪了一張供太空數(shù)據(jù)中心使用的“太空中太陽(yáng)能收集流程圖”。由于太空中無(wú)法水冷,員工要求o1計(jì)算,如果需要供給1GW的電,多大面積散熱片才能維持GPU正常運(yùn)轉(zhuǎn)。
10秒之后,o1堆積了滿屏的精密計(jì)算,最終給出了正確的結(jié)果:242萬(wàn)平方米。
根據(jù)OpenAI的安排,即日起,o1面向ChatGPT Plus和團(tuán)隊(duì)用戶開放,企業(yè)和教育用戶則需要等到下周。
相比智能水平明顯升級(jí)的o1,200美元/月的ChatGPT Pro更值得關(guān)注。盡管此前已有傳聞,但外界一直驚訝于OpenAI竟然會(huì)將一個(gè)訂閱制收費(fèi)提升到這么高,這是此前基礎(chǔ)訂閱版本20美元費(fèi)用的10倍。
實(shí)際上,OpenAI對(duì)ChatGPT Pro并不敷衍,在這套服務(wù)系統(tǒng)中,它提供了目前最強(qiáng)的o1 pro mode。
在國(guó)際數(shù)學(xué)奧林匹克預(yù)選賽題目(AIME 2024)中,o1 pro正確率達(dá)到86,高于o1版本的78。在編程問(wèn)題上,兩者能力以90對(duì)89旗鼓相當(dāng)。不過(guò)在處理博士級(jí)科學(xué)問(wèn)題上,o1 pro實(shí)現(xiàn)了約3%的優(yōu)勢(shì)。
為了證明這些個(gè)位數(shù)性能提升是否值得200美元,OpenAI還通過(guò)極其嚴(yán)苛的連續(xù)測(cè)試來(lái)展示o1 pro mode的穩(wěn)定性與可靠性。顯然,這些能力并不是針對(duì)普通需求用戶打造,而是那些對(duì)模型使用體驗(yàn)有同樣嚴(yán)格要求的高階用戶。
值得一提的是,在ChatGPT Pro模式下,用戶可以無(wú)限制使用各種高階模型,包括高級(jí)語(yǔ)音模式。
這僅僅是OpenAI連續(xù)12天狂歡的第一天,還有超過(guò)90%的內(nèi)容等待解鎖。不過(guò)從各種傳聞來(lái)看,剩余內(nèi)容中相對(duì)重磅的可能是成為“期貨”已久的Sora。在視頻模型上,OpenAI終于需要對(duì)行業(yè)做個(gè)更具體的交代了。