文|《中國企業(yè)家》記者 趙東山
編輯|米娜
圖片來源|中企圖庫
7月27日,由《中國企業(yè)家》雜志社主辦的2024(第二十四屆)中國企業(yè)未來之星年會在上海舉行,本屆年會的主題是“向新求質(zhì),生成未來”。獵豹移動董事長兼CEO、獵戶星空董事長傅盛現(xiàn)身【洞見:AIGC特別分享】環(huán)節(jié),并發(fā)表主題為《端模合一:大模型賦能機器人的創(chuàng)新實踐》的演講。
以下為演講的核心要點:
1.如果再過幾十年回頭看這一波AI浪潮,可能和現(xiàn)在看牛頓和愛因斯坦一樣。
2.現(xiàn)在創(chuàng)業(yè)就關(guān)注兩件事:第一,真正追求快速閉環(huán);第二,做一些穿越周期的事。
3.今天在企業(yè)用大模型的時候,它回答得都很對,但沒有什么用,都是常識性的回答,很難和私有的知識連接起來。如果真的要企業(yè)應(yīng)用,私有數(shù)據(jù)是關(guān)鍵。
4.大模型和云最大的不同,云更像倉庫,是不拆包的,只要租用我的倉庫,我不關(guān)心你存了什么。大模型不一樣,存的數(shù)據(jù)它都要看一遍,才能寫報告和整理,這些數(shù)據(jù)都經(jīng)過它了。所以企業(yè)就應(yīng)該有自己的私有化大模型。
5.今天人形機器人很火,但是我對雙足機器人在商業(yè)化上的成功不是很看好,作為科研是可以,如果落地到產(chǎn)線上工作,沒有三五年就不可能。
6.為什么做機器人還要做大模型?大模型就是機器人的大腦,你做機器人,自己不做大腦去買別人的大腦,你的競爭力就有限了,體驗也不會好。我們就是要做端模一體化,根據(jù)場景應(yīng)用找一款好的模型,做自己的大模型機器人。
以下為傅盛演講實錄(有刪改):
要做穿越周期的事
我從2010年開始創(chuàng)業(yè),創(chuàng)立了獵豹移動,經(jīng)歷了三個時段:第一個時段,把金山毒霸這款工業(yè)時代的軟件變成了互聯(lián)網(wǎng)時代的軟件,現(xiàn)在還有營收,同一期的其他軟件都沒有了;第二個時段,我們開始去做全球出海的業(yè)務(wù),全球6億月活用戶,4億來自海外,Musical.ly也是我們投的天使投資,后來賣給了字節(jié)跳動,也就是現(xiàn)在大家熟知的TikTok;第三個時段,2016年,我們看到了AI,并提出All in AI,當(dāng)時我們認為AI可以快速改變?nèi)祟悺?/p>
但有時候技術(shù)不是一直高歌猛進,有高潮期,也有低谷期,現(xiàn)在終于等來了ChatGPT。我們當(dāng)時就認為AI是底層的技術(shù)變革,要做機器人就要以AI為核心,做好端模一體,才能把一款產(chǎn)品真正做出革命性的體驗。我們的Slogan是在AGI時代成為全球領(lǐng)先的新質(zhì)生產(chǎn)力工具提供商。
很多人問我賣掉Musical.ly會不會后悔,沒什么后悔的,因為我們沒有這個基因,字節(jié)就是做得好。如果我們自己做,肯定不如今天TikTok做得好。況且我們也收獲了很高的投資回報。每個人、每個團隊都有自己的能力圈,做工具就是因為我們的基因,能把工具做好就非常了不起了。
如果再過幾十年回頭看這一波AI浪潮,可能和現(xiàn)在看牛頓和愛因斯坦一樣。前段時間我去拜訪羅振宇,聊現(xiàn)在如何創(chuàng)業(yè),我們一起探討就兩件事:第一,真正追求快速閉環(huán),我是個擺攤的,哪怕出現(xiàn)很大的變化,也有自己的小循環(huán);第二,做一些穿越周期的事,就像愛因斯坦1905年的四篇論文,“相對論”奠定了現(xiàn)在的信息技術(shù)基矗
ChatGPT不是技術(shù)的勝利,而是技術(shù)信仰的勝利
2022年底ChatGPT的出現(xiàn),改變了人類社會的方方面面。最近,阿里巴巴的王堅說AI也會改變科研,為什么這次AI和2016年那一波不一樣呢?因為那時候看到AI很激動,覺得計算機可以識圖、認人臉,就覺得它可以做一切。今天知道識別并不是人類獨有的技能,語言才是人獨有的技能,尤其是邏輯推理的語言。今天看起來能夠突破語義理解,是人工智能的重大突破。
OpenAI之所以牛,是因為它改變了學(xué)習(xí)路線,之前的大部分路線是讓計算機學(xué)規(guī)則,但是OpenAI相信只要給它足夠多的語言數(shù)據(jù),OpenAI就會像小孩一樣突然有一天開口說話。在此之前,大家都沒有那么相信,所以其實在GPT3.0出現(xiàn)之前,OpenAI在硅谷都不被看好。所以,ChatGPT不是技術(shù)的勝利,而是技術(shù)信仰的勝利。
因為人工智能就像大樹下的根基都是一點點長出來的,一直長到Transformer,OpenAI相信只要做好下一次預(yù)測就能產(chǎn)生智能。這條路線非常艱難,艱難在于并不知道它的核心原理,但必須堅信,不斷地試。它最難的是每次試都要花幾千萬美元,再去試,試完之后再調(diào)整。這也解釋了,今天的“百模大戰(zhàn)”不是技術(shù)的難度,而是技術(shù)信仰的難度,真的敢于相信、敢于投錢,才能真的把“ChatGPT”做出來。
今天有很多文章說它產(chǎn)生意識,說它替代人類,都不用相信,ChatGPT就是預(yù)測下一個詞的計算器,不斷預(yù)測下一次概念的時候就產(chǎn)生了智能。為什么能出現(xiàn)這樣的智能,它的原理還屬于黑盒,就是沒有數(shù)學(xué)公式推導(dǎo)能證明會出現(xiàn)這樣的智能。我們這個行業(yè)有一個俗語,每次訓(xùn)練大模型就像煉丹,開始煉的時候不知道效果怎么樣,一定要最后結(jié)果出來才持續(xù)。
為什么OpenAI很厲害呢?2016年我們開始做語音識別、視覺識別的時候,隨著數(shù)據(jù)量的增加,以前系統(tǒng)的智能水平很快就上來了,但是它只能上到一定的水平,這次給了大量的數(shù)據(jù),它一直不怎么樣,突然某一個時刻,水平一下子就起來了,到了原來系統(tǒng)到不了的智能化水平。
正是因為技術(shù)信仰,今天我們也認為OpenAI的道路也未必是唯一正確的。因為技術(shù)有意思就在于它會不斷地分支,不斷產(chǎn)生新的可能性,當(dāng)OpenAI在大參數(shù)模型上一騎絕塵的時候,越來越多的小參數(shù)模型開源社區(qū)開始出現(xiàn)。今天也有一幫人沒有那么有錢,技術(shù)沒有那么強,能不能做一個平民化的模型,只要解決專門的問題就行了,今天開源陣營就是在做這件事,用更便宜的算力成本、更小的參數(shù)量在某一個領(lǐng)域?qū)崿F(xiàn)更好的效果,我們都堅定走在開源陣營的道路上。
模型還是應(yīng)用?
去年我和朱嘯虎有一次“吵架”,做AI到底是應(yīng)用重要還是模型重要?當(dāng)時由于大模型出來,太震驚了,很多人都說大模型會占據(jù)99%的產(chǎn)業(yè)鏈價值,但當(dāng)時我就說應(yīng)用是核心。今年世界人工智能大會(WIAC),幾乎每個大佬都在談應(yīng)用,大家終于意識到給一個聊天窗口,給一個用戶,就可以解決他生活中的所有問題,這件事情不可能,只有結(jié)合實際的需求,足夠多的應(yīng)用,才能讓大模型為更多用戶所用。
前兩天蘋果發(fā)布會演示iOS 18后,股價漲了近10%,漲出了一個茅臺和騰訊,這是蘋果歷史上第一次沒有發(fā)布任何的硬件產(chǎn)品,而是發(fā)布一個概念,就是因為把Siri的概念重新升級,它就變成了你的助理,它用GPT技術(shù)做了交互。未來Siri就是我們和手機最重要的交互窗口,蘋果的展示里就有Siri說:明天你媽媽要來機場了,記得去接她。這是主動提供助理的方式,以前是很難想象的。
雖然以前我們有很多智能系統(tǒng),但每個智能系統(tǒng)都要做開發(fā)、做適配,所以它并不能實現(xiàn)邊際成本趨近于零,這次是可以實現(xiàn)的。
推薦大家用一下秘塔搜索,搜一下就是一份報告,把需要一個晚上時間整理的報告變成了2分鐘,搜索一定是重要的革命。這兩天ChatGPT推出了自己的Search GPT,搜索就是一個強應(yīng)用。
還有就是微軟的Copilot PC,它沒有用英特爾的芯片,而是高通的芯片,高通的芯片是有45TOPS的NPU(神經(jīng)處理單元),它可以獨立處理AI的各種運算,有可能你對電腦說今天晚上把哪些文章搜一遍,整理出哪些東西,它就幫你搞定了。以前計算機也是一個生產(chǎn)力工具,但必須人伴隨它,以后就是把計算機一放,它就把該做的做了。
大模型落地要和企業(yè)深度打磨
現(xiàn)在看起來AI非常熱,但好的案例幾乎沒有,除了大模型公司自己講,真正在客戶端,沒有落實好的案例。而且今天很多人都在說,我們都在期待一個好的to C應(yīng)用,好像都沒有出現(xiàn)。
尤其是我們在做企業(yè)應(yīng)用,在做機器人,它有三大阻礙:第一,我們的訓(xùn)練數(shù)據(jù)來自互聯(lián)網(wǎng),但互聯(lián)網(wǎng)實際上是人類知識系統(tǒng)冰山顯露出的一部分,書本是批量教育的產(chǎn)物,真正好的知識是深入的詢問。很多知識來自日常的探討,來自會議,來自各種討論,但是今天大模型得不到這些數(shù)據(jù)。所以,造成的問題是今天在企業(yè)用大模型的時候,它回答得都很對,但沒有什么用,都是常識性的回答,很難和私有的知識連接起來。如果真的要企業(yè)應(yīng)用,私有數(shù)據(jù)是關(guān)鍵。
這次蘋果發(fā)布iOS 18那么成功,因為它把手機里的各種數(shù)據(jù)打通了,郵件等等都讓大模型處理。其實都不是大參數(shù)模型,它是在端上處理的2.7億參數(shù)的模型,但數(shù)據(jù)打通之后,爆發(fā)出來的能量驚人。所以我們提供的解決方案是一定要結(jié)合企業(yè)的私有知識。
第二,數(shù)據(jù)的安全性。大模型和云最大的不同,云更像倉庫,是不拆包的,只要租用我的倉庫,我不關(guān)心你存了什么。大模型不一樣,存的數(shù)據(jù)它都要看一遍,才能寫報告和整理,這些數(shù)據(jù)都經(jīng)過它了。
即便美國OpenAI這樣的公司都經(jīng)常被爆出竊取私有數(shù)據(jù)等問題,所以企業(yè)就應(yīng)該有自己的私有化大模型。個人以后要用好大模型,也應(yīng)該有自己的大模型。蘋果iOS 18就是個人端的Copilot。
第三,生成式的模型,大模型的幻覺和一本正經(jīng)的胡說八道,它不可避免,但它不知道自己不知道。人說錯話,馬上就知道,但大語言模型不是,它一本正經(jīng)地講林黛玉拿繡花針打虎的故事,它沒有反思能力。今天我們發(fā)現(xiàn)和大模型打通以后,客服需要95%以上的能力,但大模型只能做到70%,這是大模型目前落地時天然的缺陷。
今天業(yè)界提出了Agent的方式,通過一套規(guī)則或者自我反思、規(guī)劃等等,和大語言模型在一起,去完成對一個具體場景的落地。很多大模型公司覺得“找人用一下”就可以把大模型做好,不是的,我們應(yīng)該基于客戶的訴求,做深度評估,才能做落地部署。我認為真正要把標(biāo)桿,把很多東西抽象出來,形成標(biāo)準(zhǔn)化。
ChatGPT到今天發(fā)布才不到兩年,產(chǎn)業(yè)鏈上還有很多不成熟,它沒有很好的供應(yīng)商,很多苦活只能自己干。就跟特斯拉做第一輛車,整個電路都要自己干一遍,才能做自己的產(chǎn)品,大模型處于很早的時代,真的要做企業(yè)案例就要和企業(yè)深度打磨。
如何做好機器人,通過私有化部署的方案,不需要特別強的模型,但是做好Agent應(yīng)用,再加上私有知識庫在很多場景可以做到95%左右準(zhǔn)確率,滿足客戶的需求。
我們提出一個企業(yè)應(yīng)用大模型有三個段位:青銅段位是企業(yè)發(fā)動大家結(jié)合公有數(shù)據(jù)應(yīng)用;黃金段位是把私有數(shù)據(jù)做好,做出數(shù)字員工;真正的王者是企業(yè)如何運營,大模型可以給出判斷。美國就有這樣的公司,專門通過大模型分析,給企業(yè)提供決策經(jīng)營建議。
今天大家都問應(yīng)用什么時候會崛起?至少要到明年,會在C端看到一些應(yīng)用開始出現(xiàn),比如高通的那款芯片一出來,很多大廠都會在CPU上加上一個AI模塊,本地應(yīng)用機會崛起。這次蘋果發(fā)布iOS 18,專門說會給手機配上開發(fā)圖形的API,只有這樣才能出現(xiàn)好的AI應(yīng)用,或者深度化的AI應(yīng)用。最后是物理的AI,今天最火的是具身智能,就是自動駕駛、智能座艙都是這個范疇。
今年我們訓(xùn)練了一個14B的模型(Orion-14B),我們訓(xùn)練這個模型的核心就是讓團隊先學(xué)習(xí)。第二我們就是瞄準(zhǔn)小參數(shù),因為以后我們的機器人上,要跑本地化的模型,并與云端相結(jié)合。
機器人是下一個大模型終端
2018年我就提出機器人公式,AI、軟件、硬件和服務(wù),為什么這些年一直不溫不火呢?因為以前AI的體驗做不上去。我女兒經(jīng)常諷刺我說:老爸,你做了一個人工智障機器人?我告訴她,不是老爸不行,是當(dāng)時的技術(shù)不行,那時候雪不夠厚、坡度不夠長,今天大語言模型會把這個體驗一下子提升很多。美國基金說可能會出現(xiàn)一個新物種,GPU+大語言模型+數(shù)據(jù)+電力,我覺得機器人就是這樣的新物種。
為什么我們做機器人還要做大模型?大模型就是機器人的大腦,你做機器人,自己不做大腦去買別人的大腦,你的競爭力就有限了,體驗也不會好。我們就是要做端模一體化,根據(jù)場景應(yīng)用找一款好的模型,做自己的大模型機器人。現(xiàn)在我們在1.0階段,但至少要做到3.0、4.0才有體驗上革命般的進步。
大家都看到過餐廳的遞送、講解機器人等等,但加入了大模型就不一樣。其實,Robot來源捷克語,這個詞本沒有那么強的人的概念,是“勞動力、奴役”的意思,在外國人眼里自動的就是Robot,只是我們翻譯為“機器人”。事實上在大模型出現(xiàn)之前,機器人絕大部分都是自動化機器,產(chǎn)線上的機械臂看上去那么精密,都是寫好的規(guī)則,事實上它是沒有智能的。機器人有了大模型之后才能真正理解和決策,這是很大的改變。以前大部分都是基于規(guī)則,現(xiàn)在是端到端。
它會像人一樣理解世界,并作出決策,這個決策不需要人管中間的過程,這是機器人的極大提升。我們投資的一家公司做走播機器人,在直播間說話的聲音像一個小姐姐一樣,都是AI生成的,評論區(qū)說帶我去生蠔區(qū)看看,她就去生蠔區(qū),告訴你:“我們的生蠔又大又新鮮,趕快來吧。”
之前請小姐姐直播一個月大概賣幾千塊優(yōu)惠券,但用走播機器人一天賣3000塊錢,用小姐姐播3個小時就太累了,但是機器人一天可以12小時,如果你愿意甚至可以24小時。
今天人形機器人很火,但是我對雙足機器人能成功商業(yè)化不是很看好,作為科研項目是可以,如果落地到產(chǎn)線上工作,沒有三五年就不可能。盡管馬斯克認為可以,但還是很難。而雙臂這件事還是有機會的,用臂做一些以前不好做的工作,所以我們在具身智能發(fā)展的是雙臂。
今天我們發(fā)現(xiàn)海外也是一個巨大的市場,今年上半年我跑了幾次日本,日本真的勞動力極其稀缺,所以他們對機器人的需求非常大,我們機器人能夠為服務(wù)員省時、省力,他們非常愿意買單。
今天有兩個超級端:一個是Phone,一個是PC。下一個超級端是汽車,下下一個就是機器人,我相信讓機器人插上AI翅膀就會完全不一樣。最后希望所有企業(yè)家、創(chuàng)業(yè)者都一起全力用好AI,插上AI的翅膀。