界面新聞?dòng)浾?| 查沁君
界面新聞編輯 | 文姝琪
2023年夏季,一條隱秘的行業(yè)情報(bào)在技術(shù)圈流傳:私募巨頭幻方量化持有的英偉達(dá)A100顯卡數(shù)量突破萬(wàn)張,這個(gè)數(shù)字僅次于BAT等科技巨頭。
“當(dāng)時(shí)業(yè)內(nèi)都在猜測(cè),一家量化交易公司為何需要如此龐大的算力儲(chǔ)備。”好未來(lái)(NYSE:TAL)CTO田密對(duì)界面新聞稱。
這個(gè)謎題在2024年1月揭曉幻方正式推出自研大模型DeepSeek,其迭代速度震驚業(yè)界:1月發(fā)布V1版,5月推出V2版,目前已迭代至V3與R1版本,并在這個(gè)春節(jié)成功出圈,與電影《哪吒2》一同成為“國(guó)產(chǎn)之光”。
在這場(chǎng)由DeepSeek掀起的AI浪潮中,教育科技公司也不想錯(cuò)過(guò)這趟快車。
好未來(lái)、網(wǎng)易有道、云學(xué)堂、中公教育、猿輔導(dǎo)、編程貓、讀書(shū)郎等一眾教育機(jī)構(gòu)密集接入DeepSeek,從線上教育到職業(yè)培訓(xùn),從個(gè)性化學(xué)習(xí)到企業(yè)員工培訓(xùn),DeepSeek在教育生態(tài)的卡位戰(zhàn)中已經(jīng)占據(jù)了一個(gè)無(wú)法忽視的重要位置,行業(yè)人士甚至將之稱為“教育AI真正的諾曼底時(shí)刻”。
量變到質(zhì)變
對(duì)于DeepSeek的“橫空出世”,田密并不對(duì)此感到意外,團(tuán)隊(duì)從最一開(kāi)始的V1版本就在追蹤其進(jìn)展,并應(yīng)用到好未來(lái)旗下業(yè)務(wù)中。
目前教育公司普遍采取的策略,并非從零訓(xùn)練通用大模型,而是基于全球頂尖開(kāi)源模型,疊加行業(yè)數(shù)據(jù)做后訓(xùn)練。在DeepSeek V3版本發(fā)布后,田密緊鑼密鼓地安排團(tuán)隊(duì)啟動(dòng)“雙線作戰(zhàn)”。
一方面,模型團(tuán)隊(duì)基于DeepSeek做后訓(xùn)練提升學(xué)而思九章大模型的能力;另一方面,應(yīng)用團(tuán)隊(duì)快速接入其API至學(xué)習(xí)機(jī)等產(chǎn)品,同時(shí)公司內(nèi)部客服、視頻腳本、講義生成等環(huán)節(jié)也在測(cè)試提效。
效果令人驚喜,“V3版本大幅領(lǐng)先其它開(kāi)源模型,甚至產(chǎn)生量變到質(zhì)變的變化”。
其它教育公司也感受到DeepSeek帶來(lái)的變化。據(jù)網(wǎng)易有道(NYSE:DAO)提供的內(nèi)部評(píng)測(cè)數(shù)據(jù)顯示,DeepSeek-R1在有道K12測(cè)試集上的準(zhǔn)確率高達(dá)88%。
網(wǎng)易有道首席科學(xué)家段亦濤指出,DeepSeek-R1憑借完善的計(jì)算基礎(chǔ)設(shè)施、高效的DualPipe訓(xùn)練框架、低精度訓(xùn)練的創(chuàng)新應(yīng)用,以及稀疏連接、合理分層設(shè)計(jì)等架構(gòu)優(yōu)化,實(shí)現(xiàn)模型性能的大幅提升與成本的有效控制。
尤為值得一提的是,DeepSeek-R1采用的“強(qiáng)化學(xué)習(xí)”技術(shù),摒棄了傳統(tǒng)的PRM方法,直接以結(jié)果為導(dǎo)向進(jìn)行獎(jiǎng)勵(lì),促使AI學(xué)會(huì)更高效地思考,并展現(xiàn)出初步的反思能力。
高途(NYSE:GOTU)聯(lián)合創(chuàng)始人羅斌在接受多知網(wǎng)采訪時(shí)透露,該公司接入DeepSeek后也收獲了一些顯著變化:比如,內(nèi)部協(xié)同工具AI助手在接入后,日訪問(wèn)量提升200%。
在用戶產(chǎn)品側(cè),高途高中數(shù)學(xué)測(cè)評(píng)準(zhǔn)確率從此前最佳情況的74%提升至90%左右,如果知識(shí)點(diǎn)下沉到初中、小學(xué),DeepSeek-R1的準(zhǔn)確率會(huì)提升得更顯著,可能接近于真人的狀態(tài)。
答疑是推理模型在教育領(lǐng)域應(yīng)用的關(guān)鍵場(chǎng)景。過(guò)去與模型溝通對(duì)提示詞工程要求高,需精心撰寫(xiě)提示詞才能得到較好答案,但現(xiàn)在DeepSeek具備深度思考和聯(lián)網(wǎng)能力,與它溝通像正常人說(shuō)話一樣表達(dá)需求,它就能完成任務(wù)。
不同于以往的通用大模型,DeepSeek-R1展現(xiàn)了理科天賦,在數(shù)學(xué)、編程和推理等關(guān)鍵領(lǐng)域表現(xiàn)優(yōu)異。
網(wǎng)易有道CEO周楓認(rèn)為,這對(duì)于教育應(yīng)用非常關(guān)鍵,可以說(shuō)教學(xué)過(guò)程中最大的場(chǎng)景,最難的問(wèn)題都依賴?yán)砜拼竽P偷哪芰!袄砜拼竽P偷某墒鞂⒋蟠笸卣笰I在教育和其它行業(yè)中的應(yīng)用”。
在編程領(lǐng)域,編程貓自稱是全國(guó)首個(gè)將編程軟件與DeepSeek深度整合的人工智能品牌,目前該公司旗下編程貓全套編程軟件矩陣接入DeepSeek,覆蓋圖形化編程、Python及C++三大核心教學(xué)場(chǎng)景。
以編程貓自研的圖形化編程軟件源碼編輯器為例,當(dāng)孩子提出創(chuàng)意想法“我想做個(gè)飛機(jī)大戰(zhàn)游戲”,傳統(tǒng)做法是由AI先生成一套代碼,孩子只需按部就班地跟著仿寫(xiě),再進(jìn)行運(yùn)行測(cè)試,動(dòng)手跟著做即可。
而在接入了DeepSeek大模型的AI助手后,整體的學(xué)習(xí)思維邏輯開(kāi)始轉(zhuǎn)變,孩子需要在軟件內(nèi)置的AI助手中提出創(chuàng)意,AI助手不再直接輸出代碼,而是將創(chuàng)意拆解為可實(shí)現(xiàn)的任務(wù)模塊,引導(dǎo)學(xué)生通過(guò)問(wèn)答交互自主構(gòu)建游戲邏輯框架,深度實(shí)現(xiàn)孩子與AI協(xié)同共創(chuàng)編程作品。
“本質(zhì)上是兩套自主技術(shù)體系的化學(xué)反應(yīng),讓AI重構(gòu)交互方式,同時(shí)也驅(qū)動(dòng)教育評(píng)估體系發(fā)生根本性變革!本幊特埾嚓P(guān)負(fù)責(zé)人談及該公司與DeepSeek的融合。
首先是教學(xué)模式的改變,讓學(xué)生從“學(xué)工具”到“練思維”的轉(zhuǎn)變,以“創(chuàng)造性主題”取代“編程知識(shí)點(diǎn)”為課程核心;其次,教育者角色將不再是傳統(tǒng)的“傳道授業(yè)解惑”,而是引導(dǎo)孩子將AI落地為現(xiàn)實(shí)生活的實(shí)際應(yīng)用。最終落腳回到學(xué)生能力的培養(yǎng)。
在編程貓看來(lái),學(xué)生能力的培養(yǎng)將是超越編程的深層價(jià)值,編程作為“實(shí)現(xiàn)創(chuàng)意的語(yǔ)法”,最終目的不是培養(yǎng)程序員,而是培養(yǎng)學(xué)生擁有理解非線性因果關(guān)系的復(fù)雜系統(tǒng)思維、正向循環(huán)“失敗-洞察-突破”的韌性創(chuàng)造力、解決具體問(wèn)題的技術(shù)人文素養(yǎng)和快速適應(yīng)未來(lái)人機(jī)協(xié)作的核心能力,培養(yǎng)駕馭“生物智能×人工智能”的復(fù)合型人才。
與其他領(lǐng)域不同,教育領(lǐng)域?qū)?nèi)容的準(zhǔn)確性、安全性有著更高的要求。猿輔導(dǎo)尤為強(qiáng)調(diào)了這一點(diǎn),該公司表示,猿力大模型由專業(yè)教研團(tuán)隊(duì)基于新課改的教學(xué)目標(biāo),對(duì)模型的回答內(nèi)容進(jìn)行調(diào)優(yōu),對(duì)符合青少年兒童的內(nèi)容有著更專業(yè)的邊界設(shè)定。
例如,當(dāng)孩子試圖與大模型聊“王者榮耀”等游戲內(nèi)容時(shí),小猿將不會(huì)直接回答,而是引導(dǎo)孩子回歸學(xué)習(xí)或閱讀內(nèi)容本身。
DeepSeek的爆發(fā)式增長(zhǎng)也帶來(lái)甜蜜的煩惱。日活躍用戶突破2000萬(wàn)后,DeepSeek官網(wǎng)搜索功能可用率驟降,暴露出云資源儲(chǔ)備的短板。
“我們不得不自建搜索引擎接口,將必應(yīng)搜索結(jié)果實(shí)時(shí)喂給模型,同時(shí)接入各大云廠商及官方原版的API,若一家不穩(wěn)定可迅速切換!碧锩芊Q。
行業(yè)也隨即展開(kāi)自救:華為、360等廠商提供安全防護(hù),手機(jī)廠商協(xié)助流量分流,形成獨(dú)特的“中國(guó)式協(xié)作生態(tài)”。
重構(gòu)競(jìng)爭(zhēng)格局
對(duì)于整個(gè)行業(yè)來(lái)說(shuō),DeepSeek的橫空出世,實(shí)質(zhì)性地改變了教育AI的競(jìng)爭(zhēng)邏輯。
“過(guò)去基于60分基礎(chǔ)模型能做到90分就是優(yōu)勢(shì),現(xiàn)在對(duì)手拿著90分的基座稍作優(yōu)化就能達(dá)到93分,差距被不斷縮小。”田密坦言。
換言之,過(guò)往行業(yè)格局中,頭部企業(yè)憑借算力投入和算法積累,能在60分的開(kāi)源基座上打造出90分的垂直模型,形成顯著技術(shù)壁壘。但當(dāng)基礎(chǔ)模型直接躍升至90分水平時(shí),各家的優(yōu)化空間被壓縮至5-8分的狹窄區(qū)間。
這種技術(shù)平權(quán)現(xiàn)象,使得中小教育科技公司首次獲得與行業(yè)巨頭同臺(tái)競(jìng)技的機(jī)會(huì),不過(guò),若想超越可能還要多花些力氣。
有行業(yè)人士對(duì)界面新聞表示,頭部教企過(guò)往積累的教育數(shù)據(jù)是核心資產(chǎn),也是訓(xùn)練各家垂直大模型最關(guān)鍵的來(lái)源,即使Deepseek提高了行業(yè)整體基準(zhǔn)線,但頭部企業(yè)仍保有數(shù)據(jù)優(yōu)勢(shì)。
田密認(rèn)為,這整體是好事,有助于催生AI原生應(yīng)用。一直以來(lái)大家期待的大模型時(shí)代的原生AI產(chǎn)品尚未誕生,而隨著DeepSeek開(kāi)源技術(shù)的提升,將降低應(yīng)用開(kāi)發(fā)成本,讓更多原本無(wú)法嘗試的事情變?yōu)榭赡,從而加速大模型時(shí)代原生APP的涌現(xiàn)。
周楓也認(rèn)為,高質(zhì)量開(kāi)源和低價(jià)模型會(huì)帶來(lái)AI的大繁榮!敖芪乃广U摗币环N經(jīng)濟(jì)現(xiàn)象,指隨著技術(shù)進(jìn)步導(dǎo)致資源使用效率提高,資源消耗量反而增加的現(xiàn)象。這是DeepSeek將給千行萬(wàn)業(yè)帶來(lái)的一大變化,中國(guó)團(tuán)隊(duì)將AI的成本降低,必將加速行業(yè)發(fā)展,很快將有更多的AI使用,更多的算力需求,更多的就業(yè)機(jī)會(huì),和更快的科技和經(jīng)濟(jì)的進(jìn)步。
對(duì)于應(yīng)用層來(lái)說(shuō),更大的難點(diǎn)在于,如何激活模型的專業(yè)能力。
以AI老師為例,如何讓它扮演專業(yè)教育老師,輔助撰寫(xiě)講義、課件等,這不是技術(shù)難題,而是業(yè)務(wù)難題,即如何將通用大模型與自身領(lǐng)域?qū)I(yè)知識(shí)更好結(jié)合,以得到更專業(yè)的結(jié)果。
盡管DeepSeek作為通用大模型已足夠優(yōu)秀,但在田密看來(lái),該公司旗下業(yè)務(wù)涉及的專用場(chǎng)景仍采用的是其自研九章大模型,通用場(chǎng)景才會(huì)選用DeepSeek。
如學(xué)而思學(xué)習(xí)機(jī)內(nèi)置智能助手“小思”的泛聊問(wèn)答功能,將從其它的通用大模型換成DeepSeek,但拍照搜題、批改、答疑、精準(zhǔn)學(xué)等專用功能,用的是九章大模型。
新東方優(yōu)編程董事長(zhǎng)朱宇在接受多知網(wǎng)采訪時(shí)同樣提到,用DeepSeek很難直接去教學(xué),還是會(huì)有幻覺(jué),有錯(cuò)誤的題型,甚至有錯(cuò)誤的答案。教育公司做微調(diào)之后,效果會(huì)更好。
減少幻覺(jué)有兩種解決方式:一是用DeepSeek的解決方案來(lái)訓(xùn)練和微調(diào)模型,訓(xùn)練成本降低了很多,二是輸出的環(huán)節(jié)也要做調(diào)整。比如,一些題目的分析要做調(diào)整,再喂到模型中去調(diào)整輸出。
DeepSeek的崛起,正在重新定義AI在教育中的角色,關(guān)于大模型是否將替代老師輔導(dǎo)學(xué)生的討論也未曾斷過(guò)。
在田密看來(lái),過(guò)去一年多來(lái),大模型用于教學(xué)仍存在諸多問(wèn)題,比如會(huì)產(chǎn)生幻覺(jué)講錯(cuò)知識(shí),不能適配學(xué)生年級(jí),存在超綱講解情況,對(duì)話互動(dòng)存在自問(wèn)自答,不能很好理解或推理用戶輸入。
“通用大模型應(yīng)用于行業(yè)還有很大差距,從優(yōu)秀的DeepSeek到出色的AI老師,還有很多工作要做,不能過(guò)于樂(lè)觀!碧锩芊Q。
他以自動(dòng)駕駛為例,教育行業(yè)的L5是能完全替代人類老師的全自動(dòng)AI老師,目前大模型的發(fā)展只是讓行業(yè)從“L2輔助駕駛”提升到“2.5”的水平,距離L3、L4仍有距離。
這些技術(shù)瓶頸的背后,是教育場(chǎng)景的特殊性對(duì)AI提出的獨(dú)特挑戰(zhàn),也同樣意味著,教育AI的進(jìn)化不僅是算法問(wèn)題,更是對(duì)學(xué)習(xí)科學(xué)本質(zhì)的理解問(wèn)題。
當(dāng)技術(shù)參數(shù)競(jìng)賽逐漸讓位于場(chǎng)景創(chuàng)新競(jìng)賽時(shí),教育公司的核心命題不再是“如何做出更好的模型”,而是“如何創(chuàng)造不可替代的教育價(jià)值”。
那些能夠?qū)I的認(rèn)知優(yōu)勢(shì)與教育規(guī)律深度融合,在規(guī);c個(gè)性化之間找到平衡點(diǎn)的機(jī)構(gòu),終將在這次技術(shù)浪潮中實(shí)現(xiàn)從工具革新到教育范式的跨越。