國產(chǎn)大模型深度求索(DeepSeek)正在與大洋彼岸的人工智能巨頭OpenAI“掰手腕”。
2月7日,據(jù)全球最大代碼托管平臺GitHub顯示,在兩個月內(nèi),DeepSeek的Star量(星標(biāo))已經(jīng)超過了OpenAI。截至18時,DeepSeek旗下熱度最高的項目DeepSeek-V3大模型Star量達(dá)到7.82萬,超越同平臺中OpenAI最熱門項目(6.93萬)。Meta旗下的llama星標(biāo)量最高超過5.7萬,阿里旗下的Qwen 2.5星標(biāo)量超1.4萬。
據(jù)官方介紹,“星標(biāo)”意味著被用戶收藏,許多項目的評級取決于擁有的星標(biāo)數(shù)量,“標(biāo)星操作便于以后再次找到倉庫或主題?梢詫Υ鎯旌椭黝}標(biāo)星以跟蹤感興趣的項目,并在消息饋送中發(fā)現(xiàn)相關(guān)內(nèi)容!盙ithub如此解釋了標(biāo)星的意義。
不過,有業(yè)內(nèi)人士向澎湃新聞記者分析,由于DeepSeek是開源大模型,OpenAI未開源,最熱門的是API案例和使用指南,在一定程度上會影響星標(biāo)數(shù)量。星標(biāo)數(shù)量不能完全代表兩個大模型在能力上的區(qū)別,但是代表了AI行業(yè)整體的認(rèn)可程度。
據(jù)研究公司SimilarWeb估計,在短短一周內(nèi),DeepSeek網(wǎng)站的用戶數(shù)量就超過了谷歌的Gemini聊天AI,后者已經(jīng)存在了近兩年。DeepSeek.com上周二的訪問量達(dá)到了創(chuàng)紀(jì)錄的4900萬次,比前一周增長了614%。
DeepSeek因其開源、低成本等優(yōu)勢,成為近期最火熱的話題之一。數(shù)據(jù)顯示,DeepSeek應(yīng)用上線20天,日活就突破了2000萬。
據(jù)公開資料顯示,DeepSeek旗下開放式V3模型訓(xùn)練成本為550萬美元,明顯低于美國類似解決方案的成本。同時,它的能力與ChatGPT的功能相當(dāng),但有一個重要的區(qū)別:該模型可以免費下載并在本地服務(wù)器上運行,也因此廣受企業(yè)和組織關(guān)注。
由于DeepSeek的強(qiáng)大能力,引發(fā)全球性震動,尤其是引發(fā)美國科技公司集體性焦慮。據(jù)美國全國廣播公司(NBC)報道,美國總統(tǒng)特朗普當(dāng)?shù)貢r間1月27日在佛羅里達(dá)州邁阿密舉行的共和黨會議上表示,中國人工智能初創(chuàng)公司DeepSeek的AI技術(shù)給美國科技企業(yè)敲響“警鐘”,美國公司“需要專注于競爭以贏得勝利”。
海外科技巨頭正在加速追趕,密集加快上新速度。當(dāng)?shù)貢r間2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗艦大模型Gemini 2.0 Pro實驗版,并在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking實驗版,作為對近期走紅的推理模型DeepSeek-R1和OpenAI旗下模型o3-mini的回應(yīng)。
同樣是在2月5日,在谷歌Gemini模型上新的幾小時后,OpenAI宣布ChatGPT Search向所有人開放,無需注冊。目前,就同谷歌搜索一樣,來到OpenAI官網(wǎng)首頁就可以直接使用搜索功能。這對于谷歌而言無疑是一次巨大的沖擊,不少網(wǎng)友調(diào)侃道“谷歌再見”,也有網(wǎng)友表示“感恩DeepSeek”。
2月6日,外交部發(fā)言人郭嘉昆主持例行記者會。韓聯(lián)社記者提問,據(jù)報道,韓國的一些政府部門屏蔽對DeepSeek的訪問,意大利、澳大利亞、印度、美國、日本等國家也傳出禁止或限制使用DeepSeek的消息,一些企業(yè)也屏蔽了訪問。對此,中方如何看待?
“我注意到有關(guān)情況,”郭嘉昆強(qiáng)調(diào),中國政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全,從來沒有也不會要求企業(yè)或個人以違法的形式采集或存儲數(shù)據(jù)。中方一貫反對泛化國家安全概念,將經(jīng)貿(mào)科技問題政治化的做法,同時中方也將堅定維護(hù)中國企業(yè)的合法權(quán)益。
在2月初,華為云、騰訊云、阿里云、百度智能云等國內(nèi)主流云平臺紛紛宣布上線DeepSeek旗下的R1大模型。海外各大云廠商和芯片廠商在更早之前就已紛紛宣布上線DeepSeek-R1模型。北京時間1月31日,英偉達(dá)宣布DeepSeek-R1模型登陸NVIDIA NIM。據(jù)介紹,在單個英偉達(dá)HGX H200系統(tǒng)上,完整版DeepSeek-R1 671B的處理速度可達(dá)每秒3872 Token。英偉達(dá)競爭對手AMD也宣布,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,針對Al推理進(jìn)行了優(yōu)化。