克雷西 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
剛剛,OpenAI收購了數(shù)據(jù)庫初創(chuàng)公司Rockset。
公司由Facebook工程師創(chuàng)立,主打?qū)崟r搜索和數(shù)據(jù)分析,能夠?qū)崿F(xiàn)毫秒級延遲。
這項收購作價5億美元(約36億人民幣),而且與之前收購另一家公司不同,這次除了要人,技術(shù)也會被整合進(jìn)OpenAI的產(chǎn)品。
按照官方說法,這次收購將增強(qiáng)OpenAI的檢索基礎(chǔ)設(shè)施,幫助企業(yè)把數(shù)據(jù)轉(zhuǎn)化為“可操作的智能”(actionable intelligence)。
有網(wǎng)友表示,OpenAI的算法和算力都已經(jīng)很強(qiáng)了,此次收購也將幫助其應(yīng)對數(shù)據(jù)層面的挑戰(zhàn)。
還有人猜測,OpenAI是不是要造搜索引擎了。
誰是Rockset?
Rockset于2016年創(chuàng)立,總部位于加州的圣馬特奧(San Mateo)。
領(lǐng)英資料顯示,該公司規(guī)模為51-200人,有86名用戶的資料與之相關(guān)。
假設(shè)按照80人來計算,5億美元平均到每個人頭上,就是625萬美元,約合4500多萬人民幣。
該公司由Facebook的工程師創(chuàng)辦,包括兩名聯(lián)合創(chuàng)始人在內(nèi),公司的六名高管中有四人都曾有過在Facebook工作的經(jīng)歷。
創(chuàng)始人兼CEOVenkat Venkataramani,威斯康星大學(xué)麥迪遜分校計算機(jī)碩士,在2016年創(chuàng)立Rockset時已有14年的數(shù)據(jù)庫工作經(jīng)驗。
他曾任Facebook基礎(chǔ)設(shè)施團(tuán)隊的工程總監(jiān),所帶領(lǐng)的團(tuán)隊為15億用戶管理在線數(shù)據(jù)服務(wù);更早之前,Venkat在甲骨文公司擔(dān)任主要技術(shù)人員,同樣從事數(shù)據(jù)庫工作。
聯(lián)創(chuàng)兼CTODhruba Borthakur,是比Venkat早七屆的校友,同樣在Facebook從事過數(shù)據(jù)庫工作,還是Hadoop分布式文件系統(tǒng)的創(chuàng)始工程師之一,以及開源Apache HBase項目的貢獻(xiàn)者。
架構(gòu)負(fù)責(zé)人Tudor Bosman,斯坦福計算機(jī)碩士,擁有7年的Facebook工作經(jīng)歷,是Facebook搜索引擎Unicorn的領(lǐng)導(dǎo)者,還曾在甲骨文、谷歌等公司擔(dān)任軟件工程師。
還有負(fù)責(zé)工程的副總裁Louis Brandy,于2021年加入Rockset,此前在Facebook工作了10年,做到了工程部門的主管。
Rockset的主營業(yè)務(wù)自然也是與數(shù)據(jù)庫相關(guān),具體來說是實時搜索和分析數(shù)據(jù)庫,旨在為事件流、CDC流和向量提供毫秒延遲的分析查詢。
而為Rockset“貢獻(xiàn)”了四名高管、現(xiàn)已成為Meta的Facebook,也成了Rockset的客戶。
據(jù)介紹,Meta在PyTorch上,用兩周就完成了Rockset的部署和遷移,并將查詢延遲降低到了亞(sub)秒級別。
截止上一輪融資,Rockset已經(jīng)獲得了1.17億美元,主要投資者包括紅杉資本,以及頂級風(fēng)投機(jī)構(gòu)greylock等。
最近的一次融資是在去年8月,Rockset獲得了4400萬美元,估值為1-5億美元,最終OpenAI的收購價格也是敲定在了5億美元。
OpenAI意在何為?
雖然OpenAI確實投資過很多初創(chuàng)公司,但是直接公開收購的舉動并不多見。
加上去年收購游戲公司Global Illumination,一共就只進(jìn)行了這兩次。
至于OpenAI到底想要干什么,也和上次一樣沒有披露詳情。
OpenAI公告中的說法是增強(qiáng)基礎(chǔ)設(shè)施,讓AI“變得更有幫助”。
可以確定的是,此次收購之后Rockset的技術(shù)將會被整合,支持OpenAI的檢索基礎(chǔ)設(shè)施,另一方面團(tuán)隊成員也將加入OpenAI。
而被收購的Rockset一方,CEO Venkat在通告中直接說,此舉將會幫助構(gòu)建安全有益的AGI。
官方消息之外,有網(wǎng)友發(fā)現(xiàn),ChatGPT最近的聯(lián)網(wǎng)搜索變得比perplexity快,不知道是不是已經(jīng)提前用上了Rockset。
的確,實時的數(shù)據(jù)索引和檢索能夠為AI模型的準(zhǔn)確性和性能顯著提高。
所以,整合這樣的技術(shù),一定程度上可以幫助解決所有大模型從業(yè)者都在面臨的數(shù)據(jù)問題,也可以為此前傳聞中的“OpenAI搜索引擎”鋪路。
另一方面,這種做法,也被一些網(wǎng)友看作是OpenAI進(jìn)一步邁向B端市場的一種舉措。
不過,在如此之多的推斷當(dāng)中,熱度最高的一條評論,關(guān)心的還是GPT-4o的“視頻通話”到底什么時候上線,還有Sora又在哪里……
One More Thing
雖然GPT-4o的視頻通話依然沒有鋪開,但關(guān)于GPT-5,OpenAI CTO卻已經(jīng)有了新的暗示。
不久前,Mira回到了母校達(dá)特茅斯工程學(xué)院,并接受了訪談。
期間Mira對各代GPT的表現(xiàn)做出了評價,表示GPT-3是幼兒園水平,GPT-4則達(dá)到了高中生水準(zhǔn)。
而目前OpenAI的目標(biāo),是讓下一代模型(大概是GPT-5)在特定任務(wù)上達(dá)到博士水平。
至于具體的問世時間,Mira表示,或許是(Let’s say)一年半之后。
參考鏈接:
[1]https://openai.com/index/openai-acquires-rockset/
[2]https://rockset.com/blog/openai-acquires-rockset/
[3]https://twitter.com/OpenAI/status/1804168339289432355
[4]https://www.youtube.com/watch?v=yUoj9B8OpR8