智東西(公眾號(hào):zhidxcom)
作者 | 香草
編輯 | 李水青
智東西5月11日消息,今天凌晨,OpenAI宣布將于美國(guó)時(shí)間13日上午10點(diǎn)(北京時(shí)間14日凌晨1點(diǎn))在官網(wǎng)直播,演示ChatGPT、GPT-4的更新內(nèi)容。
據(jù)外媒The Information今日?qǐng)?bào)道,OpenAI正在構(gòu)建具備音頻和視覺理解能力的AI語(yǔ)音助手,其中一些功能已經(jīng)開始向客戶展示,可能在下周的發(fā)布活動(dòng)中預(yù)覽。
知情人士消息透露,OpenAI可能會(huì)在今年內(nèi)完成GPT-5的開發(fā)并公開發(fā)布。此外,OpenAI還計(jì)劃推出一種新的定價(jià)模式,客戶通過預(yù)付費(fèi)預(yù)定Token,最高可以享受50%的折扣。
此前有多家外媒和博主曝料,稱OpenAI將在近日發(fā)布AI搜索引擎。其CEO阿爾特曼對(duì)此回應(yīng)道:“不是GPT-5,也不是搜索引擎,但我們一直在努力開發(fā)一些我們認(rèn)為會(huì)得到喜歡的新東西。”
▲阿爾特曼回應(yīng)新品演示(圖源:X)
值得注意的是,其競(jìng)爭(zhēng)對(duì)手谷歌的I/O開發(fā)者大會(huì)時(shí)間定在美國(guó)時(shí)間14日上午10點(diǎn)(北京時(shí)間15日凌晨1點(diǎn)),預(yù)計(jì)可能發(fā)布Gemini大模型的重要更新。OpenAI此次發(fā)布時(shí)間沒有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大會(huì)的前一天,火藥味可謂濃厚。
要知道,這已經(jīng)不是OpenAI第一次“卡點(diǎn)”狙擊谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,結(jié)果沒過幾個(gè)小時(shí),OpenAI就掏出文生視頻“王炸”模型Sora,狠狠搶了Gemini 1.5 Pro的風(fēng)頭。
直播發(fā)布地址:http://openai.com
一、AI語(yǔ)音助手仍存在“幻覺”問題,或?qū)⒓芍罜hatGPT免費(fèi)版
據(jù)The Information報(bào)道,阿爾特曼的終極目標(biāo)是開發(fā)出類似電影《她》(Her)中,可高度響應(yīng)的虛擬助手,提升蘋果Siri等現(xiàn)有語(yǔ)音助手的可用程度。
▲電影《她》劇照
OpenAI認(rèn)為,具有視覺和音頻功能的AI語(yǔ)音助手具有像智能手機(jī)一樣的變革性潛力,理論上其可以做到一系列現(xiàn)在的AI助手無(wú)法做到的事,例如充當(dāng)論文、數(shù)學(xué)問題指導(dǎo)老師,或是翻譯交通標(biāo)識(shí)、幫助解決汽車故障等。
但類似的技術(shù)目前所需硬件門檻太高,無(wú)法在個(gè)人設(shè)備上運(yùn)行,用戶可以在短期內(nèi)使用基于云的版本來(lái)獲取這些功能,例如自動(dòng)化客戶服務(wù)Agent。
OpenAI目前已經(jīng)推出具備音頻轉(zhuǎn)錄、文本轉(zhuǎn)語(yǔ)音等功能的軟件,不過這些功能是基于獨(dú)立的對(duì)話AI模型實(shí)現(xiàn),而新的語(yǔ)音助手則將這些功能整合在一起。據(jù)知情人士透露,該AI語(yǔ)音助手的音頻功能能夠幫助客服人員更好地理解對(duì)方的語(yǔ)氣。
目前尚不清楚OpenAI何時(shí)向付費(fèi)客戶提供這些新功能,但據(jù)試用過該語(yǔ)音助手的人士透露,OpenAI最終的計(jì)劃是將這些功能都納入ChatGPT免費(fèi)版本,目標(biāo)是比目前其最先進(jìn)模型GPT-4 Turbo的運(yùn)行成本更低。該人士還談道,AI語(yǔ)音助手在有些類型的問題上回答優(yōu)于GPT-4 Turbo,但仍然存在幻覺問題。
對(duì)此,OpenAI發(fā)言人沒有回應(yīng)置評(píng)請(qǐng)求。
二、與谷歌競(jìng)爭(zhēng)iPhone合作位,GPT-5或于年底前發(fā)布
OpenAI推出AI語(yǔ)音助手主要目標(biāo)是與谷歌競(jìng)爭(zhēng)。
谷歌的AI模型Gemini能實(shí)時(shí)響應(yīng)語(yǔ)音命令,并識(shí)別圖像、視頻等。不過這些功能目前仍需要研究人員附以圖像和文字說明,且并不能理解許多傳統(tǒng)的語(yǔ)音指令,也不能像Siri和谷歌助手等傳統(tǒng)語(yǔ)音助手那樣與用戶對(duì)話。
▲谷歌展示Gemini多模態(tài)功能(圖源:谷歌)
另一方面,提高模型的視覺、音頻能力也有助于OpenAI與蘋果達(dá)成合作。
最近幾個(gè)月,蘋果與OpenAI就下一代iPhone操作系統(tǒng)如何整合OpenAI的模型進(jìn)行了討論。然而,與此同時(shí),蘋果也與谷歌進(jìn)行著類似的談判。
這場(chǎng)競(jìng)爭(zhēng)的最新消息是,據(jù)彭博社今早報(bào)道,蘋果已接近與OpenAI達(dá)成協(xié)議,將在下一代iPhone操作系統(tǒng)iOS 18中使用ChatGPT;與谷歌尚未達(dá)成協(xié)議,但談判仍在進(jìn)行中。
除了可能在下周推出的AI語(yǔ)音助手外,OpenAI還一直致力于構(gòu)建一款A(yù)I搜索引擎,旨在與谷歌競(jìng)爭(zhēng)。此外,其也在開發(fā)一種被稱作“計(jì)算機(jī)使用Agent”的自動(dòng)化軟件,用來(lái)輔助軟件開發(fā)和其他計(jì)算機(jī)任務(wù)。
阿爾特曼還在與iPhone開發(fā)者喬尼艾維(Jony Ive)合作開發(fā)一款獨(dú)立的AI硬件。然而,最先進(jìn)的AI模型體積龐大,需要在云端運(yùn)行,并需要互聯(lián)網(wǎng)連接才能工作。要使具有視覺和聽覺功能的復(fù)雜AI模型變得足夠小巧,以便在設(shè)備上運(yùn)行,可能需要幾個(gè)月甚至幾年的時(shí)間。
不過,大家最關(guān)心的可能還是GPT-5。據(jù)The Information報(bào)道,一位接近OpenAI領(lǐng)導(dǎo)人的人士稱,其可能在今年年底完成GPT-5并公開發(fā)布。
OpenAI的新產(chǎn)品和AI模型開發(fā)工作進(jìn)展得如火如荼,與此同時(shí),其此前宣布的一些項(xiàng)目卻變得不再那么受關(guān)注。盡管OpenAI曾向開發(fā)者承諾,會(huì)在今年第一季度推出GPT Store開發(fā)者激勵(lì)計(jì)劃,但目前仍沒有實(shí)現(xiàn)。
三、計(jì)劃推出預(yù)付費(fèi)定價(jià)模式,最高提供50%折扣
在定價(jià)方面,據(jù)知情人士透露,OpenAI計(jì)劃推出一種新的定價(jià)模式,如果客戶通過預(yù)付費(fèi)預(yù)定Token,最高可以享受50%的折扣。
這樣的優(yōu)惠形式在云計(jì)算領(lǐng)域比較常見,微軟Azure、谷歌云、亞馬遜云服務(wù)(AWS)等都提供提前預(yù)定服務(wù)器容量折扣的方式來(lái)降低成本。
目前,按需定價(jià)提供API(應(yīng)用程序接口)是OpenAI大模型的主要付費(fèi)形式,通過每生成100萬(wàn)Tokens,向開發(fā)者收取幾美分至一百多美分不等的費(fèi)用,其中大客戶可以享受批量折扣。
此前OpenAI已經(jīng)提供了一種降低開發(fā)者成本的方式,其在4月推出Batch API,如果開發(fā)者批量上傳模型查詢,并接受等待最長(zhǎng)24小時(shí)的時(shí)間,就可以獲取更低的價(jià)格。
Together AI和Anyscale等AI服務(wù)器經(jīng)銷商曾表示,在他們的軟件上運(yùn)行開源模型要比使用OpenAI的模型便宜6倍。通過更靈活的定價(jià),OpenAI與其他模型開發(fā)商的競(jìng)爭(zhēng)將更具優(yōu)勢(shì)。據(jù)透露,其今年的營(yíng)收可能達(dá)到數(shù)十億美元。
結(jié)語(yǔ):OpenAI谷歌相爭(zhēng),蘋果微軟得利?
OpenAI與谷歌之間的競(jìng)爭(zhēng)愈發(fā)激烈,二者之間的“商戰(zhàn)”火藥味也愈發(fā)濃厚。OpenAI又一次將新品發(fā)布時(shí)間定在了谷歌重大發(fā)布時(shí)間附近,似乎執(zhí)著于搶奪谷歌風(fēng)頭這件事。
這一邊,蘋果同時(shí)與OpenAI、谷歌商談模型集成至iPhone事宜,再次加劇了兩家公司之間的競(jìng)爭(zhēng)。雖然OpenAI被曝已與蘋果達(dá)成合作,但谷歌那邊的談判也仍在繼續(xù)。
而另一邊,微軟作為OpenAI最大的財(cái)務(wù)支持者,可以優(yōu)先使用其先進(jìn)技術(shù)來(lái)改進(jìn)自己的語(yǔ)音助手。而微軟也并非“孤注一擲”,除了積極自研模型外,還投資了OpenAI有力競(jìng)對(duì)Mistral AI,后者成為第二家在微軟Azure云平臺(tái)上提供商業(yè)AI模型的公司。
下周的OpenAI新品發(fā)布和谷歌I/O大會(huì),或許會(huì)將這場(chǎng)“商戰(zhàn)”推向新高度。究竟誰(shuí)的“大招”會(huì)更厲害,我們拭目以待。