IT之家 2 月 18 日消息,OpenAI 首席執(zhí)行官薩姆·奧爾特曼于當?shù)貢r間 2 月 17 日在 X 社交平臺上發(fā)文,就公司下一個開源項目的方向征詢公眾意見。他提出了兩種可能的開源模型方向:一種是“相當小但仍需在 GPU 上運行的 o3-mini 級模型”,另一種則是“盡可能優(yōu)化的手機大小模型”。這或許意味著 OpenAI 即將開源新的大模型,也將是 2019 年 OpenAI 開源 GPT-2 之后再次開源某個大模型。
IT之家注意到,奧爾特曼在 1 月 31 日 Reddit 的“問我任何事”活動中,被問及 OpenAI 是否會公開部分 AI 模型技術并發(fā)布更多系統(tǒng)工作原理的研究時,他表示公司內(nèi)部正在討論這種可能性,并反思了 OpenAI 在開源方面的過往立場。他承認,OpenAI 此前在開源策略上可能“站在了歷史的錯誤一邊”,并稱需要制定不同的開源策略。不過他也指出,公司內(nèi)部并非所有人都認同這一觀點。
2015 年成立后,OpenAI 曾表示會在符合公眾利益的情況下公布其模型的研究和數(shù)據(jù)。但后來出于競爭壓力和對信息披露可能帶來的安全風險的擔憂,公司轉(zhuǎn)向了專有模型的開發(fā)。
然而,近期 AI 科技行業(yè)的新變化似乎促使 OpenAI 重新審視其開源策略。DeepSeek 的橫空出世,以其低成本和開源模式迅速吸引了眾多用戶,其大模型 DeepSeek-R1 僅用兩個月完成訓練,成本僅為 550 萬美元,相比之下,OpenAI 等公司的同類項目成本要高出許多。自 ChatGPT 于 2022 年年底推出后,許多 AI 公司為保持競爭力,選擇不公開過多技術細節(jié)。但如今,隨著 DeepSeek 等開源技術的興起,部分開發(fā)者和客戶可能會轉(zhuǎn)向更具性價比的開源解決方案。