“不要期待有了AI之后就能一劍封喉!
來源|多知
作者|徐晶晶
興奮。
未知。
這是高途聯(lián)合創(chuàng)始人羅斌面對當(dāng)下DeepSeek引發(fā)的這一輪AI技術(shù)浪潮時的心境。
興奮,是因?yàn)榭吹靡姷拇_定性,“拉長周期來看,DeepSeek帶來了巨大的變量,創(chuàng)造了新的可能性。”
不過,這份確定性又是模糊的、未知的!按笾路较蚴悄芸吹靡姷模钦麄路徑、節(jié)奏是模糊的、非共識的,這其中存在很大的不確定性和未知性。這也意味著,一種壓力!
2月12日,高途正式宣布接入DeepSeek大模型,不過,其對DeepSeek的關(guān)注要比后者大范圍步入公眾視野更早。
高途透露了接入DeepSeek后帶來的一些顯著變化:
比如,內(nèi)部協(xié)同工具AI助手在接入后,截至目前,日訪問量提升了200%,預(yù)計(jì)在2月中旬完成內(nèi)部業(yè)務(wù)系統(tǒng)和協(xié)作平臺全面打通之后,訪問量將會進(jìn)一步增加。
再比如,在用戶產(chǎn)品側(cè),以DeepSeek為技術(shù)核心的高中數(shù)學(xué)測評準(zhǔn)確率提升了15%,而后高中AI選科規(guī)劃服務(wù)也借由AI助力實(shí)現(xiàn)了服務(wù)質(zhì)量提高。
在高途官宣接入的當(dāng)天,多知就DeepSeek相關(guān)話題對話了高途聯(lián)合創(chuàng)始人羅斌。
羅斌嚴(yán)謹(jǐn)?shù)亟o出了一些判斷和預(yù)期:
1.DeepSeek-R1大模型的準(zhǔn)確率已達(dá)到在教育場景相對可用的狀態(tài)。
2.今天的大模型還處在整個AI能力進(jìn)化的相對早期階段,如果成熟狀態(tài)是100分,那么今天的這些大模型最好的狀態(tài)也就是5-10分的水平,離終態(tài)還很遙遠(yuǎn)。
3.在基座模型不斷迭代時,對每家公司來說,更重要的是要找到一種機(jī)制,以便在大廠的基座模型快速迭代的過程中,能及時跟上這一波變化,并在每次變化的過程中,能及時把新的能力結(jié)合進(jìn)來,為自己所用。
4.回到教育這個場景,至少在我們現(xiàn)在能看見的一個周期內(nèi),AI能力本身是一個關(guān)鍵要素,但不是一個決定性的要素。不要期待有了AI之后就能一劍封喉。
5.如果有了更強(qiáng)大的大模型能力,過去拍搜的這種模式就會發(fā)生變化,就不需要提前去生產(chǎn)積累自己的題庫,現(xiàn)在是一種實(shí)時解答的方式,通過大模型就能夠達(dá)到一個非常高的準(zhǔn)確率了。
6.教育AI的iPhone時刻一定會發(fā)生,但時間、形式不確定。教育公司要想在應(yīng)用AI層面改變格局,至少需要3-5年的周期。
7.眾多學(xué)習(xí)環(huán)節(jié)里,AI能替代的,其一,是一個相對簡單的學(xué)習(xí)任務(wù)。其二,AI更適合于學(xué)生主動來發(fā)起、AI來接聽響應(yīng)的場景。而需要由我們來主動地管理和影響學(xué)生的這個部分,今天的AI還做不到。
8.小型的創(chuàng)業(yè)公司,在某些單點(diǎn)上、在某些形態(tài)的產(chǎn)品上,有可能獲得一波特殊的機(jī)會。但是如果回到重交付、端到端、以學(xué)習(xí)結(jié)果為導(dǎo)向的領(lǐng)域里,這里的機(jī)會對于創(chuàng)業(yè)公司而言,挑戰(zhàn)還是非常大的。
01
DeepSeek-R1大模型的準(zhǔn)確率已達(dá)到“在教育場景相對可用的狀態(tài)”
多知:DeepSeek將如何影響教育行業(yè)未來的發(fā)展?會帶來哪些顛覆性的改變?
羅斌:第一個變化,DeepSeek這波算是完成了一次比較好的市場教育,提升了大眾對于AI能力的關(guān)注度,也讓普通用戶使用AI工具的滲透率得到了提升。
第二個變化,結(jié)合公開信息和我們內(nèi)部驗(yàn)證來看,DeepSeek-R1的模型做了一些創(chuàng)新(包括引入了更強(qiáng)的推理能力)后,在一些教育場景下的應(yīng)用效果確實(shí)有很大的提升。這種提升意味著,從應(yīng)用的角度來說,它的準(zhǔn)確率已經(jīng)達(dá)到了一個相對可用的狀態(tài)。
教育行業(yè)的容錯率比較低。原來,大模型的準(zhǔn)確率并沒有達(dá)到可用狀態(tài)。但是今天,以DeepSeek-R1為代表的這些模型的能力迅速提升,讓整個可用性變得更高,也讓更多的場景引入這一大模型的能力變得更加可行。
舉例來說,在我們內(nèi)部高中數(shù)學(xué)的一個題庫上,之前我們用原有模型測試,準(zhǔn)確率最佳情況是能做到74%。我們現(xiàn)在拿DeepSeek-R1結(jié)合內(nèi)部級數(shù)據(jù)測了一下,經(jīng)過調(diào)優(yōu)之后,準(zhǔn)確率大概能到90%。這還是其在高中數(shù)學(xué)的知識體系里的表現(xiàn)。如果知識點(diǎn)下沉到初中、小學(xué),DeepSeek-R1的準(zhǔn)確率會提升得更顯著,可能接近于真人的狀態(tài)。
第三個變化,讓更多企業(yè)堅(jiān)定了對AI的投入。之前很多企業(yè)對AI還沒有形成很好的共識,畢竟AI的投入成本比較高,也需要專業(yè)人才。但今天很多企業(yè)意識到了,必須要擁抱AI。
回到教育場景下,它可能會帶來的變化主要是在兩個方向:
一個方向是為學(xué)生創(chuàng)造更好的價(jià)值。
從產(chǎn)品的角度來講,目前行業(yè)里的教學(xué)環(huán)境,大部分還是通過以真人老師為主來跟學(xué)生進(jìn)行交付。有了DeepSeek能力的輔助后,老師和學(xué)生在整個教學(xué)過程中的反應(yīng)的速度、平均的專業(yè)度、效率、服務(wù)群體的規(guī)模,都能得到大幅提升。
這帶來的一個變化是,原來必須要由專業(yè)的真人老師來提供一些教學(xué)服務(wù),今天通過大模型的輔助,不管是教學(xué)、練習(xí)還是答疑,直接通過AIToC或者通過AI輔助老師來ToC這兩種情況下,整個效果和效率都能夠有顯著的提升。
另一個方向是改善企業(yè)內(nèi)部的運(yùn)營效率。不管是市場營銷、銷售轉(zhuǎn)化或服務(wù)的環(huán)節(jié),效率都會有顯著提升。
必須要明確的是,雖然以DeepSeek為代表的大模型現(xiàn)在很火,但是總體來講,它們還是在整個AI能力進(jìn)化的相對早期階段,如果成熟狀態(tài)是100分,那么今天的這些大模型最好的狀態(tài)也就是5-10分的水平,離終態(tài)還很遙遠(yuǎn),在短周期內(nèi),我們還不能對它的節(jié)奏和價(jià)值期待過高。
02
在基座模型快速迭代的過程中,教育公司也要讓自有模型及時跟上變化
多知:市面上很多教育公司已經(jīng)有自研的大模型,同時接入了DeepSeek,怎么看其未來的路徑?
羅斌:如今,DeepSeek是一個更強(qiáng)大的基座模型,無論是把自己原有的模型或數(shù)據(jù)和DeepSeek結(jié)合,還是以DeepSeek模型作為基座,重新去訓(xùn)練新的自有模型,每家公司會用不同的路徑來做。
但我的基本觀點(diǎn)是,今天大模型的底層生態(tài),如果只是5-10分的水平,那么在未來的半年、一年、兩年、三年,底層的大模型還會有突飛猛進(jìn)的變化。
今天各家在這樣的場景下構(gòu)建起的自有模型的能力提升速度,跟大廠的模型提升速度相比,完全不在一個量級。
在這種情況下,對每家公司來說,更重要的是要找到一種機(jī)制,以便在大廠的基座模型快速迭代的過程中,能及時跟上這一波變化,并在每次變化的過程中,能及時把新的能力能結(jié)合進(jìn)來,為自己所用。
03
不要期待有了AI之后就能一劍封喉
多知:當(dāng)教育公司普遍擁抱DeepSeek,大家的差異化、本質(zhì)區(qū)別將體現(xiàn)在哪里?
羅斌:不管是以DeepSeek為代表開源的基座模型,還是一些大廠的閉源模型,它都會有某種方式開放給整個社會使用。所以在底層的基礎(chǔ)的能力上,是相對標(biāo)化的、是平等的,大家在這個地方不會有明顯的差異。
但可能會存在差異的地方是什么呢?
第一個維度就是在模型的本身。
各家根據(jù)自己的需要,嘗試建垂直模型、小模型或者專屬模型,這樣能更好地適配不同應(yīng)用場景。比如高途有考研業(yè)務(wù),也有公考業(yè)務(wù),可能用于考研業(yè)務(wù)的模型和用于考公業(yè)務(wù)的模型就不太一樣。這里可能存在差異化的模型的版本。
各家在專屬模型的建設(shè)能力和水平上實(shí)際上是有差異的。
第二個維度是在應(yīng)用層。
關(guān)于基座模型,教育公司們不會有顯著的差異。但在應(yīng)用層,可能變化會更多一些。現(xiàn)在的模型,更多的還是偏系統(tǒng)1的這種模型,還不具備非常強(qiáng)的推理、調(diào)度或者真正意義上的智能。
未來,大家也在提,比如大套型套小模型的方式,或者是通用模型嵌套專有模型的方式,包括未來有市面上有這么多的模型,怎樣做混用,不同的場景下可能調(diào)用不同的模型,另外,包括人機(jī)怎么結(jié)合,老師和AI怎樣協(xié)作,讓整個過程能夠變得更加高效和專業(yè),這個地方可能各家的做法會有差異。
還有一個就是怎樣做運(yùn)營。同樣的一個能力,在不同的團(tuán)隊(duì)里面,你的推廣、宣傳、運(yùn)營,可能會導(dǎo)致最終的使用的廣度、深度、效果上,也會有明顯的差距。
第三個維度是在產(chǎn)品層。
站在學(xué)員的角度,學(xué)員需要的產(chǎn)品是一個解決方案。他并沒有那么在意你提供的是真的AI還是別的什么。
所以結(jié)合AI的能力后,每家提供的解決方案,是不一樣的。但是從學(xué)員角度看,他需要更好的體驗(yàn),更好的效果和更好的性價(jià)比。因此,在產(chǎn)品上,變化會更大。
最后一個維度是組織能力。
同樣的一種AI能力,隨著時間的演進(jìn),大家的迭代方向和迭代速度是會有差異的。
拉長周期來看,不管是從產(chǎn)品層面還是從運(yùn)營層面,都會形成更加明顯的差異。
這里面,人才的影響是比較大的。
總結(jié)來講,底層能力、標(biāo)準(zhǔn)化的這些能力,大家是類似的。但是回到教育這個場景,至少在我們現(xiàn)在能看見的一個周期內(nèi),AI能力本身是一個關(guān)鍵要素,但不是一個決定性的要素。更重要的還是在產(chǎn)品、在應(yīng)用等方面,可能需要結(jié)合AI來做重新的思考設(shè)計(jì)。面向未來的一個周期(3-5年)來做這樣的布局和迭代,可能是更加重要的。
不要期待有了AI之后就能一劍封喉,這件事情不太會發(fā)生。
04
大模型實(shí)時解答,正在消解拍搜解題產(chǎn)品的題庫門檻
羅斌:原來學(xué)生有一道題不會做,他要么問老師,要么就用拍搜工具。拍搜工具內(nèi)部是要做大量題庫的生產(chǎn)和累積的,但今天看起來,如果有了更強(qiáng)大的大模型能力,過去拍搜的這種模式就會發(fā)生變化,就不需要提前去生產(chǎn)積累自己的題庫,現(xiàn)在是一種實(shí)時解答的方式。
所以我的感覺是,未來在解題的這個部分,你問AI一道標(biāo)準(zhǔn)化的題,AI給你進(jìn)行解題這件事,會變得比較標(biāo)準(zhǔn)化了,通過大模型就能夠達(dá)到一個非常高的準(zhǔn)確率了。相當(dāng)于拍搜題庫這件事不會有絕對的門檻了。當(dāng)然可能每一家自己做出來這個模型,通過不同的數(shù)據(jù)和調(diào)優(yōu)以后,可能還會有一定的準(zhǔn)確率的差異。但這個差異就沒有那么大了。
原來可能你手里有一億的題庫,人家手里可能只有一千萬的題庫,差異可能會特別大。但有了更強(qiáng)大的大模型能力,以后可能的差異是,你的準(zhǔn)確率可能是93%,人家的準(zhǔn)確率可能是91%?赡苤皇沁@種層面的一個區(qū)別。但是在覆蓋率上,可能大家都能夠做到非常高的覆蓋率。
05
學(xué)習(xí)環(huán)節(jié)里,相對簡單的任務(wù)和交互,更容易被AI替代
多知:DeepSeek會不會取代一些現(xiàn)有的學(xué)習(xí)產(chǎn)品?
羅斌:如果把整個學(xué)習(xí)進(jìn)行拆解,不管是面向?qū)W生,還是站在企業(yè)內(nèi)部的角度,有很多環(huán)節(jié)。
哪些環(huán)節(jié)受到AI的影響更大呢?可能是相對簡單的任務(wù),相對簡單的交互,在這種邏輯下,更容易發(fā)生。但如果它是一個長周期的、多任務(wù)的、復(fù)雜的鏈條,AI在里面產(chǎn)生很大作用的難度會比較大一些。
所以,第一個,AI替代的應(yīng)該是一個相對簡單的這種學(xué)習(xí)任務(wù)。第二個是,它更適合于學(xué)生主動來發(fā)起、AI來接聽響應(yīng)的場景。而需要由我們來主動地管理和影響學(xué)生的這個部分,今天的AI還做不到。這是因?yàn),AI的能力還不夠,也很難讓學(xué)生真正遵從AI的指令。
所以從這兩個角度來講,AI能夠在里面發(fā)揮作用的一些環(huán)節(jié)還是可以羅列的:
第一種場景,在企業(yè)內(nèi)部的一個場景下,通過AI來輔助做一些內(nèi)容的生產(chǎn),做一些知識庫的建設(shè),包括做一些內(nèi)部的問答平臺搭建,這是可以做得到的。
第二種場景,一些簡單的對話場景,比如像客服、拍搜(學(xué)生問一個問題,你要給他一個答案,這種就是用戶過來之后就去尋找一個答案的這樣一種邏輯,跟標(biāo)準(zhǔn)化的DeepSeek的用法類似。你給一個輸入,它會反饋你一個輸出,提供一些專業(yè)的內(nèi)容解答)這種類型的場景下,AI的能力會越來越強(qiáng)。
第三種場景,在一些特定的練習(xí)場景下,AI是可以承擔(dān)這樣一個角色的。舉個例子,英語對話練習(xí),市面上有很多的產(chǎn)品在做類似的一個事情,這也是比較簡單的對話性的任務(wù),或者是你需要他給你針對一個特定的題目做一下講解,講特定的一道題,簡單的教學(xué)或者是對練,是可以通過AI來做一定的替換的。
但是除了這三種情況以外,對于其他的比較復(fù)雜的這種任務(wù),以及這種需要老師和學(xué)生進(jìn)行強(qiáng)互動,強(qiáng)引導(dǎo),甚至帶有一定的管控屬性的任務(wù)和場景,AI在里面更多的只能起到一個簡單的輔助的作用,也很難真的替代真人來完成這些邏輯。
06
教育AI的iPhone時刻一定會發(fā)生,但時間、形式不確定
多知:隨著AI的快速發(fā)展,未來教育行業(yè)的格局會發(fā)生怎樣的大變化?
羅斌:教育行業(yè)格局如果要發(fā)生大的變化,一定要有一個重要的變量會不會有真正意義上新形態(tài)的產(chǎn)品出現(xiàn)。教育+AI里會不會有一個iPhone時刻,像當(dāng)年iPhone橫空出世一樣,帶來根本性的產(chǎn)品的變化和升級?