展會(huì)信息港展會(huì)大全

專訪第四范式戴文淵:澄清AI熱潮背后的誤解,向“無(wú)窮大”前進(jìn)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-13 14:26:43   瀏覽:4030次  

導(dǎo)讀:每經(jīng)記者:可楊每經(jīng)編輯:張海妮 一部由史蒂文斯皮爾伯格(Steven Spielberg)執(zhí)導(dǎo)的電影《人工智能》,講述的是一個(gè)小男孩最終發(fā)現(xiàn)自己是人工智能的故事。 人工智能什么時(shí)候才能達(dá)到這樣的水平?難道人工智能的作用就是制造一個(gè)類人智能體嗎?這是第四范式...

每經(jīng)記者:可楊每經(jīng)編輯:張海妮

專訪第四范式戴文淵:澄清AI熱潮背后的誤解,向“無(wú)窮大”前進(jìn)

一部由史蒂文斯皮爾伯格(Steven Spielberg)執(zhí)導(dǎo)的電影《人工智能》,講述的是一個(gè)小男孩最終發(fā)現(xiàn)自己是人工智能的故事。

人工智能什么時(shí)候才能達(dá)到這樣的水平?難道人工智能的作用就是制造一個(gè)類人智能體嗎?這是第四范式創(chuàng)始人、董事長(zhǎng)戴文淵投身人工智能產(chǎn)業(yè)早期最令他迷惑的兩個(gè)問(wèn)題。

最終,他在圖靈獎(jiǎng)獲得者詹姆斯尼古拉格雷(James Nicholas Gray,昵稱Jim Gray)2007年《科學(xué)發(fā)展的四個(gè)范式》的演講中找到答案。其中,第四范式階段是指數(shù)據(jù)科學(xué)隨著數(shù)據(jù)爆發(fā)式增長(zhǎng)以及技術(shù)演進(jìn),科學(xué)理論由計(jì)算機(jī)從海量數(shù)據(jù)中發(fā)現(xiàn)。

戴文淵所創(chuàng)立的人工智能公司“第四范式”的名字也由此而來(lái)。這家成立于2014年的企業(yè)級(jí)人工智能平臺(tái)企業(yè),迎著人工智能的潮起與潮落成長(zhǎng)至今,作為掌舵者,戴文淵向《每日經(jīng)濟(jì)新聞》記者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因?yàn)檫@對(duì)于市場(chǎng)來(lái)說(shuō)也不重要,客戶關(guān)心的問(wèn)題是:“我是賣雞翅的,AI能做的所有的事情,跟我有什么關(guān)系?重要的是我的雞翅能不能(通過(guò)AI)賣得更好。”

大模型時(shí)代,第四范式主張對(duì)模型進(jìn)行“剪裁”,以求用最“經(jīng)濟(jì)”的方式做領(lǐng)先的AI。在戴文淵眼中,通用大模型和行業(yè)大模型是實(shí)現(xiàn)AGI的不同路徑,區(qū)別在于是用一個(gè)模型去實(shí)現(xiàn)AGI,還是用很多模型去實(shí)現(xiàn)AGI。而兩相比較之下,行業(yè)大模型是他認(rèn)為最“經(jīng)濟(jì)”的方式。

熱潮與誤解一同翻涌,市場(chǎng)期望AI解決所有的問(wèn)題

新的熱浪翻涌在第四范式成立的第十年,這也促使戴文淵作出了一些改變。

2023年,很多人找到戴文淵,問(wèn)他:“ChatGPT會(huì)怎么幫助到我的企業(yè)?”上一次他被問(wèn)及類似的問(wèn)題是在2016年,那時(shí),問(wèn)句的主語(yǔ)是AlphaGO。

更有趣的是,這一次,幾乎所有的客戶、投資人、媒體記者都在使用“技術(shù)的語(yǔ)言”來(lái)提問(wèn),“參數(shù)”成為高頻詞,與之前的狀況大不相同。

戴文淵說(shuō):“要把AI做好,就先不要談AI的問(wèn)題,先談?wù)劰臼亲鍪裁吹,把這些問(wèn)題談清楚,咱們?cè)倩仡^看看AI是不是可以(對(duì)公司)有幫助。”

市場(chǎng)和客戶都對(duì)新技術(shù)感到興奮時(shí),戴文淵希望能借此機(jī)會(huì)引導(dǎo)一個(gè)正確的“AI價(jià)值觀”:“不能先把參數(shù)做到一千億,再想這千億的參數(shù)到底能干什么?”

市場(chǎng)期望AI解決所有的問(wèn)題,這反映了一種恐慌心理:萬(wàn)一AI能做但是自己沒(méi)有用到,那可能會(huì)失去一些機(jī)會(huì)。戴文淵將此視為一個(gè)機(jī)遇,“擔(dān)憂”打開(kāi)了世人想要了解AI的窗子,但誤解也同熱潮一同翻涌,第四范式要做的,是把AI的價(jià)值帶到眾人面前。

ChatGPT,這個(gè)目前最火爆的大模型應(yīng)用,將大模型帶到了人工智能圈層以外的世界,熱浪之下,一些人對(duì)于大模型的理解或許是:和ChatGPT一樣的技術(shù)。

直至今天,市場(chǎng)中最受關(guān)注的大模型依舊是以大語(yǔ)言模型為主,即“預(yù)測(cè)下一個(gè)字”的模型,年初爆火的Sora則是“預(yù)測(cè)下一幀畫面”的模型。

專訪第四范式戴文淵:澄清AI熱潮背后的誤解,向“無(wú)窮大”前進(jìn)

但應(yīng)用是更加實(shí)際的事,對(duì)于絕大多數(shù)企業(yè)而言,“預(yù)測(cè)下一個(gè)字”解決不了核心問(wèn)題。例如,金融機(jī)構(gòu)需要解決風(fēng)控問(wèn)題,但這不是語(yǔ)言問(wèn)題;大語(yǔ)言模型可能會(huì)輔助金融機(jī)構(gòu)解決客服事宜,但這可能不是它的核心問(wèn)題。真正的行業(yè)大模型應(yīng)當(dāng)是針對(duì)不同場(chǎng)景,構(gòu)建不同模態(tài),去預(yù)測(cè)下一個(gè)“事情”。

這背后有一個(gè)更大的誤解很多人問(wèn),能不能基于開(kāi)源大模型底座或GPT,訓(xùn)練行業(yè)需要的新模態(tài)模型。但即使同樣出自O(shè)penAI之手,要在GPT模型上直接精調(diào)出Sora,也是不可能的事情。

戴文淵介紹,大多數(shù)行業(yè)大模型是要基于特定業(yè)務(wù)所積累的特定模態(tài)的數(shù)據(jù),訓(xùn)練出一個(gè)基座大模型,就像目前訓(xùn)練底座的大語(yǔ)言模型、視頻模型一樣。

其實(shí),行業(yè)大模型這件事,其實(shí)已經(jīng)發(fā)生了十年之久。2014年,第四范式推出人工智能平臺(tái)先知1.0,用建模型的方式,挖掘業(yè)務(wù)數(shù)據(jù)價(jià)值,提升業(yè)務(wù)效果。如今“先知”已經(jīng)迭代到了5.0版本,定位于降門檻,讓企業(yè)自行構(gòu)建高價(jià)值場(chǎng)景所需的行業(yè)大模型,例如預(yù)測(cè)疾病風(fēng)險(xiǎn)、欺詐行為、災(zāi)害險(xiǎn)情、設(shè)備故障等,打破大語(yǔ)言模型只能生成文字、圖像、視頻的局限。

信心不再是問(wèn)題,但市場(chǎng)的耐心有限

1956年夏天,在達(dá)特茅斯學(xué)院舉辦了一場(chǎng)人工智能研討會(huì),主題研究“讓機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí),即用計(jì)算機(jī)模擬人的智能”的科學(xué)。

這次會(huì)議被普遍視為人工智能技術(shù)的起點(diǎn),由此出發(fā),人工智能開(kāi)始沿著一條波浪式的曲線前進(jìn),經(jīng)歷著巨大的潮起與潮落,穿梭在失望與希望之間。

兩到三年,戴文淵認(rèn)為這是市場(chǎng)能給一場(chǎng)技術(shù)熱潮的最大耐心。

距離我們最近的一次潮起被認(rèn)為來(lái)自2016年,基于強(qiáng)化學(xué)習(xí)算法的AlphaGo戰(zhàn)勝人類圍棋選手李世石,“機(jī)器是否會(huì)代替人類”在彼時(shí)引發(fā)市場(chǎng)關(guān)注,商湯科技、曠視科技等一批人工智能“獨(dú)角獸”站到臺(tái)前。

第四范式是一家幸運(yùn)的公司,這家公司誕生于2014年,從誕生的第一天就開(kāi)始做企業(yè)端的生意。不過(guò)那時(shí)候,很多企業(yè)告訴戴文淵,自己沒(méi)有人工智能預(yù)算。隨著AlphaGO成為那枚投向平靜水面的石子,突然之間,所有的客戶都找來(lái)問(wèn)他:“你們是人工智能企業(yè),你來(lái)給我講一講AlphaGO可以幫我做什么?”“我們有預(yù)算,我們要AlphaGO。”

兩三年的時(shí)間,人們理想中的人工智能工具沒(méi)有誕生,市場(chǎng)信心在2019年崩盤。據(jù)獵豹全球智庫(kù)數(shù)據(jù),與2018年相比,2019年中國(guó)人工智能企業(yè)的融資金額由1484.53億元下降至967.27億元,下降幅度達(dá)到34.8%,融資數(shù)量也由737個(gè)下降至431個(gè),下降幅度達(dá)四成。

直到ChatGPT成為下一顆石子,這場(chǎng)“寒冬”結(jié)束,AI市場(chǎng)再度迎來(lái)熱潮。

戴文淵認(rèn)為,在2023年以前,市場(chǎng)對(duì)AI是信心問(wèn)題;從2023年開(kāi)始,不再是信心問(wèn)題,而是要找到正確路徑的問(wèn)題。“不用擔(dān)心客戶認(rèn)為AI沒(méi)有用,需要解決的是,引導(dǎo)客戶反過(guò)來(lái)想業(yè)務(wù)的問(wèn)題。”戴文淵說(shuō)。

潮起潮落,似乎已經(jīng)成為人工智能行業(yè)的常態(tài)。潮為什么落,戴文淵認(rèn)為和“價(jià)值”相關(guān)。2016年,每家企業(yè)都陷入“怎么去用AlphaGO幫助到我”的問(wèn)題中,這個(gè)潮落了。今天也一樣,如果每家企業(yè)想的都是“怎么用ChatGPT幫助到我”,可能這個(gè)潮也會(huì)落。

戴文淵判斷,兩三年內(nèi),如果大模型不能創(chuàng)造巨大價(jià)值,可能就會(huì)再度潮落,等待下一顆“石子”或許是一個(gè)新的能夠吸引眼球的東西,或許是能夠在合理的投入產(chǎn)出中創(chuàng)造出足夠價(jià)值的技術(shù)。

當(dāng)下的機(jī)遇是市場(chǎng)的目光重新被吸引,但挑戰(zhàn)同樣在于,兩到三年內(nèi)能否兌現(xiàn)大模型的價(jià)值?

市場(chǎng)關(guān)注到人工智能“+”,戴文淵認(rèn)為這個(gè)加號(hào)非常重要,這意味著,未來(lái)的兩到三年,人工智能有可能可以去創(chuàng)造很大的價(jià)值,如果大家想的都是ChatGPT能不能幫到企業(yè),可能不見(jiàn)得能創(chuàng)造市場(chǎng)預(yù)期的價(jià)值。

“以語(yǔ)言模型而言,去年主要的落地場(chǎng)景都與客服相關(guān),如果在這么大的關(guān)注度之下,落地的應(yīng)用全是問(wèn)答類場(chǎng)景,可能兩三年以后大家就失望了。”他說(shuō)。

專訪第四范式戴文淵:澄清AI熱潮背后的誤解,向“無(wú)窮大”前進(jìn)

圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1472123004

AI是一個(gè)實(shí)驗(yàn)的過(guò)程,目標(biāo)是提升“北極星指標(biāo)”

目前來(lái)看,大模型賦能行業(yè),依舊是一個(gè)充滿前景的故事。每個(gè)行業(yè)都有人在做貢獻(xiàn),有人在的地方,AI就有發(fā)揮作用的機(jī)會(huì)理論上不存在大模型無(wú)法賦能的行業(yè),人效上可以充分發(fā)揮想象力。

目前,絕大多數(shù)企業(yè)的核心業(yè)務(wù)都由人來(lái)作決策,但人作決策時(shí)往往面臨兩個(gè)困境:水平參差不齊、精力有限。當(dāng)AI能力提升,哪怕其能力尚未全面超越人類,即便僅達(dá)到人類的平均水平,但如果能復(fù)制很多“人”,就很有可能提供更好的業(yè)務(wù)價(jià)值。

企業(yè)招聘員工時(shí),并非需要每個(gè)員工都達(dá)到頂尖水平,而是注重每個(gè)員工是否能為企業(yè)帶來(lái)積極的貢獻(xiàn)。因此,戴文淵認(rèn)為,盡管第四范式的目標(biāo)是使得AI的表現(xiàn)超越絕大多數(shù)業(yè)務(wù)專家,但從實(shí)踐角度來(lái)看,AI即使僅僅達(dá)到專家平均的能力水平,也有可能為企業(yè)帶來(lái)顯著的價(jià)值提升。

從數(shù)字化時(shí)代開(kāi)啟到數(shù)智化時(shí)代來(lái)臨,賦能傳統(tǒng)企業(yè)與實(shí)體經(jīng)濟(jì)始終是市場(chǎng)對(duì)技術(shù)的期待。隨著大模型來(lái)臨,數(shù)字技術(shù)從傳統(tǒng)的信息搜集、傳輸、整理、儲(chǔ)存,逐漸走到輔助決策甚至替代決策階段。

戴文淵指出,一些企業(yè)當(dāng)前在使用AI時(shí),依舊存在數(shù)字化時(shí)代的慣性思維,即過(guò)于依賴同行業(yè)的成功案例,試圖直接移植成熟方案落地到本企業(yè)。但實(shí)際上AI和企業(yè)核心競(jìng)爭(zhēng)力相關(guān)以后,不同企業(yè)的目標(biāo)是不一樣的。

這背后的根本原因在于,數(shù)字化時(shí)代,技術(shù)解決的不是核心業(yè)務(wù)問(wèn)題,而是通過(guò)提升邊緣問(wèn)題的效率,進(jìn)而讓整個(gè)企業(yè)的效率提升,但是核心問(wèn)題仍然是人在解決。進(jìn)入AI時(shí)代,核心問(wèn)題將交由機(jī)器學(xué)習(xí),所以每家企業(yè)所定位的核心競(jìng)爭(zhēng)力也不同,無(wú)法完全復(fù)制。

理想狀態(tài)下,大模型應(yīng)該能夠幫助企業(yè)完成核心決策。為此,第四范式將企業(yè)的戰(zhàn)略目標(biāo)轉(zhuǎn)化為計(jì)算機(jī)可以記錄和跟蹤的語(yǔ)言,即企業(yè)的“北極星指標(biāo)”,以此作為企業(yè)最核心的關(guān)鍵指標(biāo)。

戴文淵認(rèn)為,對(duì)于企業(yè)而言,在使用AI前,需要先想明白一點(diǎn):對(duì)于提升“北極星指標(biāo)”,什么叫好,什么叫不好。以實(shí)體零售企業(yè)為例,其核心效率體現(xiàn)在每平方米所貢獻(xiàn)的效益上,這可能就是一家零售企業(yè)的“北極星指標(biāo)”。所有圍繞這一指標(biāo)的改進(jìn),都需要量化其對(duì)“北極星指標(biāo)”的實(shí)際影響,無(wú)論是提升還是下降。

戴文淵強(qiáng)調(diào),企業(yè)的“北極星指標(biāo)”永遠(yuǎn)是正確目標(biāo)的近似。因?yàn)榉较蚩倳?huì)發(fā)生偏移,需要及時(shí)調(diào)整后又前進(jìn)。而定位的調(diào)整,需要企業(yè)的核心決策者來(lái)完成。他認(rèn)為,企業(yè)有效使用大模型的核心是,一定要變成企業(yè)的“一把手”工程,因?yàn)?ldquo;一把手”需要告訴AI什么是對(duì)的,什么是好的,否則轉(zhuǎn)型很難成功在人工智能的世界里,0和1是確定的。

而在實(shí)踐中,AI的應(yīng)用并不意味著每一步都能帶來(lái)提升。

“AI其實(shí)是一個(gè)實(shí)驗(yàn)的過(guò)程。”戴文淵舉例,假設(shè)有一百萬(wàn)的客戶基礎(chǔ),可能將九十萬(wàn)作為基線,剩余的十萬(wàn),每一萬(wàn)作為一個(gè)實(shí)驗(yàn)組,持續(xù)嘗試模型的優(yōu)化與迭代。“早期的實(shí)驗(yàn)基本上是成功的,每次實(shí)驗(yàn)都會(huì)比九十萬(wàn)更好。但是到了一定階段絕大多數(shù)的實(shí)驗(yàn)都是失敗的,也沒(méi)有關(guān)系,往往到了一定的規(guī)模體量以后,一百次體驗(yàn)如果能成功一次,就能賺回前面九十九次失敗的所有成本。”戴文淵說(shuō)。

AI是一個(gè)實(shí)驗(yàn)的過(guò)程,這是戴文淵的認(rèn)知,但尚未在客戶中達(dá)成共識(shí)。

客戶的認(rèn)知提升是AI產(chǎn)業(yè)發(fā)展至關(guān)重要的一環(huán)。如果認(rèn)知遲遲沒(méi)有發(fā)生變化,AI會(huì)重新變成“需要有一個(gè)大模型、交付一個(gè)大模型,這個(gè)大模型的參數(shù)是不是一千億,是一千億就驗(yàn)收通過(guò)付款、結(jié)束”的過(guò)程,也許再經(jīng)過(guò)一年半載,客戶會(huì)覺(jué)得,大模型好像沒(méi)什么用。

這時(shí),熱潮可能將會(huì)再度遺憾告終。

專訪第四范式戴文淵:澄清AI熱潮背后的誤解,向“無(wú)窮大”前進(jìn)

圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1307121233

AI是科學(xué)問(wèn)題,AI應(yīng)用是經(jīng)濟(jì)問(wèn)題

在通往通用人工智能(AGI)的路上,通用大模型和行業(yè)大模型是兩條不同的技術(shù)路線,戴文淵認(rèn)為,大家都是朝著AGI的方向前進(jìn),區(qū)別在于是用一個(gè)模型去實(shí)現(xiàn)AGI,還是用很多模型去實(shí)現(xiàn)AGI。

在他看來(lái),從架構(gòu)角度、算力、能源成本而言,用一個(gè)模型去解決所有的問(wèn)題,不是最經(jīng)濟(jì)的。

戴文淵還提出了一個(gè)更為少見(jiàn)的觀點(diǎn):并不存在真正的通用大模型,所謂的通用大模型,本質(zhì)是將多種場(chǎng)景融入一個(gè)模型中。例如,通過(guò)收集網(wǎng)絡(luò)上的廣泛語(yǔ)料,并進(jìn)行切分以支持不同垂直場(chǎng)景。優(yōu)化通用大模型的過(guò)程,需要對(duì)其各項(xiàng)能力進(jìn)行全面評(píng)估,一旦發(fā)現(xiàn)某項(xiàng)能力相對(duì)薄弱,再增加相關(guān)數(shù)據(jù),以強(qiáng)化該能力。從某種程度上講,這可以視為不同場(chǎng)景的組合。

而第四范式的做法是,進(jìn)行剪裁,先做垂直的行業(yè)模型。如果模型僅針對(duì)某一特定場(chǎng)景進(jìn)行應(yīng)用,就先通過(guò)該場(chǎng)景的數(shù)據(jù)模態(tài)構(gòu)建專用模型,同樣參數(shù)量往往能實(shí)現(xiàn)更好的效果。相反,若模型被設(shè)計(jì)為一個(gè)通用大型模型,最后通用大模型應(yīng)用到某一具體場(chǎng)景,往往很可能是不經(jīng)濟(jì)的。

戴文淵說(shuō):“比如我現(xiàn)在是人工智能的從業(yè)者,其實(shí)也是被剪裁的,我花了絕大多數(shù)的腦細(xì)胞去干AI,沒(méi)有花心思去學(xué)習(xí)怎么寫小說(shuō)。如果我是一個(gè)全才,每個(gè)方面都很厲害,我去選擇做AI就很屈才了。從經(jīng)濟(jì)角度說(shuō),一個(gè)被剪裁過(guò)的模型更好。”

“經(jīng)濟(jì)”,在一個(gè)小時(shí)的采訪里,戴文淵至少5次提到這個(gè)詞。“我們致力于把這個(gè)問(wèn)題(解決),或者把這個(gè)技術(shù)做出來(lái),如果我選擇了不經(jīng)濟(jì)的一條路,可能最后我會(huì)做不出來(lái),我們要綜合考慮每一種方向,每一個(gè)路線所面臨的問(wèn)題,最后找到一個(gè)最有可能的解決方法。”戴文淵說(shuō)。

“做最領(lǐng)先的AI是特別特別貴的事,需要花很多錢。”或許正因?yàn)槿绱,在技術(shù)信仰派和商業(yè)信仰派之爭(zhēng)中,戴文淵認(rèn)為自己處于兩者之間。

AI顯然是個(gè)科學(xué)問(wèn)題,但做出最領(lǐng)先的AI技術(shù),是個(gè)需要計(jì)算的經(jīng)濟(jì)問(wèn)題。

戴文淵認(rèn)為,經(jīng)營(yíng)一家AI技術(shù)公司,需要站在商業(yè)的角度思考問(wèn)題:最領(lǐng)先的AI技術(shù)需要海量的算力和數(shù)據(jù),如果不能和商業(yè)更好(地)結(jié)合,那么長(zhǎng)期持續(xù)的資金投入將變得難以為繼,“既需要技術(shù)又需要商業(yè),如果你要做最好的東西,就必須要都有”。

此外,對(duì)于AI從業(yè)者的自我修養(yǎng),戴文淵認(rèn)為,還需要具備韌勁與恒心,“人工智能就是一個(gè)起起伏伏的賽道,可能這兩年又被大家關(guān)注到了,甚至被吹上天,被吹上天的時(shí)候你不要覺(jué)得自己是神仙。同時(shí),被踩到地下的時(shí)候,也不要覺(jué)得自己沒(méi)有價(jià)值”。

波浪式前進(jìn)的過(guò)程中,可以肯定的是,通往AGI的道路并沒(méi)有一個(gè)標(biāo)準(zhǔn)的指路牌。

“AGI是我們所有人的理想,AGI就是我自己心目當(dāng)中的一個(gè)無(wú)窮大。”戴文淵從來(lái)不認(rèn)為AGI是一件三年、五年甚至十年就能實(shí)現(xiàn)的事,相反,他覺(jué)得,AGI是一件永遠(yuǎn)做不到,但永遠(yuǎn)都在做的事。他又補(bǔ)充道,可能在不久的將來(lái)所誕生的人工智能,在人類看來(lái)已經(jīng)是AGI,判斷的因素在于,“對(duì)于人來(lái)說(shuō),人工智能究竟是不是AGI,在于能不能發(fā)現(xiàn)它還有地方不會(huì)。如果發(fā)現(xiàn)不了,那這對(duì)人來(lái)說(shuō)已經(jīng)是AGI了”。

每日經(jīng)濟(jì)新聞

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港