中國(guó)的 OpenAI,出現(xiàn)了。
作者 | 宛辰編輯| 靖宇
對(duì)標(biāo) OpenAI o1 正式版的國(guó)產(chǎn)大模型來了!1 月 20 日晚,DeepSeek(深度求索)公司發(fā)布推理模型 DeepSeek-R1 正式版,同步開源模型權(quán)重,并允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。網(wǎng)友熱評(píng):這,才是真正的OpenAI。能力相當(dāng)于一個(gè)月 200 美元的 ChatGPT o1 版本,卻完全免費(fèi)。不止如此,DeepSeek 一同開源的還有「技術(shù)報(bào)告」,那些訓(xùn)練 R1 時(shí)踩過的坑、做過的事通通講給你聽,只為鋪平 AGI 的路。第一時(shí)間閱讀這份技術(shù)報(bào)告后,英偉達(dá)高級(jí)研究科學(xué)家 Jim Fan 帶來了新鮮解讀,值得我們大聲齊讀:
「我們生活在這樣一個(gè)時(shí)代:由非美國(guó)公司保持 OpenAI 最初的使命做真正開放的前沿研究、為所有人賦能。這似乎講不通,但戲劇性的往往最有可能發(fā)生。DeepSeek-R1 不僅開源了大量模型,還泄露了所有訓(xùn)練秘密。他們可能是第一個(gè)顯示 RL(強(qiáng)化學(xué)習(xí))飛輪發(fā)揮主要作用、持續(xù)增長(zhǎng)的 OSS 項(xiàng)目。影響可以通過『內(nèi)部實(shí)現(xiàn)了 ASI』或『草莓計(jì)劃』等神話名稱來實(shí)現(xiàn)。也可以通過簡(jiǎn)單地轉(zhuǎn)儲(chǔ)原始算法和 matplotlib 學(xué)習(xí)曲線來產(chǎn)生影響!怪袊(guó)公司 DeepSeek,正在實(shí)現(xiàn)趕超 OpenAI 的使命。