劃重點(diǎn)
01商湯科技作為一家中國(guó)人工智能公司,經(jīng)歷了行業(yè)的爆發(fā)式增長(zhǎng)和調(diào)整,目前已成為一家成熟的商業(yè)化公司。
02商湯科技在AI基礎(chǔ)設(shè)施方面的投入和通用大模型的路線選擇,與OpenAI等國(guó)際巨頭十分吻合。
03為此,商湯制定了“大裝置-大模型-應(yīng)用”的三位一體核心戰(zhàn)略,以降低訓(xùn)練、推理和部署成本。
04目前,商湯在傳統(tǒng)AI領(lǐng)域已有非常成熟的產(chǎn)品和解決方案,同時(shí)也在積極布局算力運(yùn)營(yíng)服務(wù)。
05除此之外,商湯科技在海外市場(chǎng)也取得了顯著的增長(zhǎng),占集團(tuán)總收入比例提升至18.5%。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
要堅(jiān)持的和將放棄的,都基于未來(lái)想成為的樣子做考量
文 | 施然中國(guó)人工智能(AI)產(chǎn)業(yè)在過(guò)去10年歷經(jīng)多個(gè)關(guān)鍵節(jié)點(diǎn)。2017年谷歌AlphaGo在中國(guó)戰(zhàn)勝圍棋世界冠軍柯潔,驗(yàn)證了AI在這一度被認(rèn)為人類(lèi)智力巔峰的領(lǐng)域超過(guò)了人類(lèi)的最高水平,從而開(kāi)啟了AI產(chǎn)業(yè)的新一輪爆發(fā)式增長(zhǎng),AI算法快速在各個(gè)產(chǎn)業(yè)里落地并產(chǎn)生價(jià)值:從人臉識(shí)別、身份驗(yàn)證,再到互聯(lián)網(wǎng)平臺(tái)的算法推薦,廣告精準(zhǔn)投放等。多輪技術(shù)周期轉(zhuǎn)換中,出現(xiàn)了一大批前期被肯定、后期被驗(yàn)證的公司。商湯科技是其中一家。商湯成立于2014年,到今年已經(jīng)是第10個(gè)年頭。從最早的人臉識(shí)別算法,到今天的大模型,商湯參與并見(jiàn)證了中國(guó)AI產(chǎn)業(yè)的發(fā)展、挑戰(zhàn)和調(diào)整。2021年12月,商湯在港交所上市,最新市值569億港元。今年以來(lái),商湯市值上漲超過(guò)50%。10年過(guò)去,商湯從一家快速增長(zhǎng)的AI明星初創(chuàng)公司,變成一家成熟的商業(yè)化公司。經(jīng)歷了中國(guó)AI科技投資的狂熱期到冷靜期,經(jīng)歷了AI技術(shù)的兩次大變革,也經(jīng)歷了國(guó)際形勢(shì)變化帶來(lái)的地緣政治影響。今天,生成式AI的發(fā)展日新月異,世界距離通用人工智能的目標(biāo)越來(lái)越近,商湯作為中國(guó)人工智能行業(yè)的代表,也快速調(diào)整戰(zhàn)略目標(biāo)。和今天備受關(guān)注的創(chuàng)業(yè)新貴不同,在AI圈里摸爬滾打了十年的商湯更關(guān)注如何盈利,如何真正讓AI技術(shù)落地應(yīng)用,如何成為一家有能力穿越周期的科技公司。
圖說(shuō):商湯科技上海總部大樓
摸爬滾打的十年
商湯最早是通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)(CV)進(jìn)入AI行業(yè)。商湯科技董事長(zhǎng)兼CEO徐立回憶,當(dāng)科研突破進(jìn)入產(chǎn)業(yè)的時(shí)候,大家都在驗(yàn)證一件事,就是AI技術(shù)精度究竟能不能過(guò)工業(yè)的紅線。彼時(shí)各家公司開(kāi)發(fā)不同的AI模型在垂直行業(yè)中試水落地,大概經(jīng)過(guò)兩到三年的驗(yàn)證后,就像AlphaGo在圍棋中的驗(yàn)證一樣,以人臉識(shí)別、圖像識(shí)別為核心的一批模型過(guò)了工業(yè)應(yīng)用的紅線。2017年前后,人臉識(shí)別技術(shù)開(kāi)始陸續(xù)應(yīng)用于不同垂直場(chǎng)景中,包括智慧城市、身份識(shí)別驗(yàn)證等。接下來(lái),行業(yè)思考的新問(wèn)題是如何讓AI應(yīng)用于更多場(chǎng)景和行業(yè)中。在當(dāng)時(shí)更普遍的方式是造更多模型。今天回頭來(lái)看,通過(guò)投入大量研發(fā)人員造更多領(lǐng)域模型的路徑已經(jīng)基本被迭代,主流方式是造更通用的大模型,再在模型基礎(chǔ)上微調(diào)出專(zhuān)用模型。當(dāng)時(shí)那個(gè)節(jié)點(diǎn),很少有人去想更遠(yuǎn)的未來(lái),去探索未來(lái)的路徑,畢竟模型是否能通用尚需驗(yàn)證。商湯無(wú)疑是有遠(yuǎn)見(jiàn)的,率先投入通用模型的研發(fā)和AI算力的發(fā)展。“如果你每個(gè)場(chǎng)景都用投入研究人員訓(xùn)練不同模型,最后可能你要做成百上千個(gè)模型,完成一個(gè)復(fù)雜的任務(wù),模型的生產(chǎn)降不下來(lái)! 徐立發(fā)現(xiàn),這階段AI模型的生產(chǎn)成本主要是人。事實(shí)上,當(dāng)時(shí)的AI公司的研發(fā)成本幾乎就等價(jià)于研發(fā)人員薪酬。伴隨商業(yè)化進(jìn)程的深入,要做通用的、端到端的模型變成商湯思考的主要方向。2019年,商湯對(duì)外提出做通用視覺(jué)大模型;在自動(dòng)駕駛領(lǐng)域,又率先提出了做端到端的大模型UniAD。徐立發(fā)現(xiàn),在走向通用的過(guò)程中,AI算力的重要性愈發(fā)上升。一個(gè)復(fù)雜的任務(wù)如果能分解為三個(gè)子問(wèn)題,假設(shè)每個(gè)環(huán)節(jié)有10個(gè)參數(shù),訓(xùn)練3個(gè)專(zhuān)用模型來(lái)解決這些問(wèn)題只需要30個(gè)參數(shù),而如果要用一個(gè)通用端到端模型來(lái)解決,那就變成有1000個(gè)參數(shù)(10乘10乘10),相當(dāng)于參數(shù)量增加了100倍,這意味著算力規(guī)模要呈幾何級(jí)數(shù)增加!叭绻忝總(gè)場(chǎng)景都用一個(gè)不同的模型去做,最后可能你要做1000個(gè)模型,這很難實(shí)現(xiàn),人手都不夠,模型的價(jià)格也降不下來(lái)!毙炝l(fā)現(xiàn),這一路徑顯然距離跨越“工業(yè)紅線”越來(lái)越遠(yuǎn)。所以,通用模型的打造成了2019年商湯的重中之重,商湯是國(guó)內(nèi)最早一批投入通用大模型研發(fā)的廠商,這也成為其構(gòu)建AI價(jià)值商業(yè)閉環(huán)的先發(fā)優(yōu)勢(shì),而這背后的大規(guī)模AI基礎(chǔ)設(shè)施建設(shè)投入也隨之提上日程。徐立原計(jì)劃用租賃算力完成通用模型研發(fā),但當(dāng)時(shí)市場(chǎng)上沒(méi)有成熟的大規(guī)模算力基礎(chǔ)設(shè)施,只能自己去建不說(shuō),此前甚至都沒(méi)有前人經(jīng)驗(yàn)完整搭建過(guò)一套大規(guī)模智算系統(tǒng)。商湯成了第一個(gè)吃螃蟹的人,投建了自己的算力大裝置,組建了大裝置團(tuán)隊(duì)完成超大規(guī)模的算力訓(xùn)推軟件平臺(tái)的搭建。取名算力大裝置,徐立是將其對(duì)于AI的作用類(lèi)比于粒子對(duì)撞機(jī)之于高能物理學(xué)。如今商湯所持有的5.4萬(wàn)塊GPU和超過(guò)20,000petaFLOPS算力,已經(jīng)成為行業(yè)公認(rèn)的稀缺資源。而在2018年2022這幾年間,資本對(duì)于AI的態(tài)度以及國(guó)際環(huán)境都發(fā)生了巨變。2018年到2021年是中國(guó)AI創(chuàng)業(yè)、融資爆發(fā)式增長(zhǎng)的四年,以商湯為代表的AI創(chuàng)業(yè)公司們?cè)谀菐啄昕焖佾@得高額融資,走到上市節(jié)點(diǎn)。創(chuàng)投數(shù)據(jù)服務(wù)商IT桔子數(shù)據(jù)顯示,2018年,中國(guó)AI領(lǐng)域共融資2373億元,同比增長(zhǎng)93%。2021年共融資3996億元,同比增長(zhǎng)51%。但市場(chǎng)熱度在2022年出現(xiàn)明顯下滑,這一年AI領(lǐng)域融資額降至1579億元,同比下滑64%,2023年繼續(xù)下滑至1101億元。和融資熱度下滑同時(shí)出現(xiàn)的,還有外部水溫的變化。在此之前,AI領(lǐng)域的融資以美元投資機(jī)構(gòu)為主,他們看重前沿技術(shù),也愿意為初創(chuàng)公司早期的高額研發(fā)買(mǎi)單。但2021年,美國(guó)加大對(duì)中國(guó)科技公司的制裁力度,美元機(jī)構(gòu)陸續(xù)退出。商湯的融資上市過(guò)程可謂是一個(gè)縮影:商湯在2019年被美國(guó)列入實(shí)體清單,2021年上市期間又被美國(guó)列入涉軍企業(yè)清單(CMIC)。但仍頂著壓力于當(dāng)年12月30日在港交所掛牌上市,獲得了穩(wěn)定的融資渠道,提升了抗風(fēng)險(xiǎn)能力,這為商湯繼續(xù)發(fā)展通用智能和AI智算奠定了基礎(chǔ)。和全球大部分AI公司一樣,商湯還處于虧損階段,但作為上市公司,商湯面臨商業(yè)化落地和保持技術(shù)領(lǐng)先的雙重考驗(yàn),想要扭虧,需要一邊擴(kuò)大收入,一邊降低成本,F(xiàn)在看來(lái),商湯在AI基礎(chǔ)設(shè)施方面的投入和通用大模型的路線選擇,與OpenAI等國(guó)際巨頭十分吻合。要搞好算力基礎(chǔ)設(shè)施軟件能力,需要深入理解大模型。2023年4月,商湯在國(guó)內(nèi)率先發(fā)布了“日日新SenseNova”大模型體系,發(fā)布時(shí),徐立提到,通用模型的能力比單純的規(guī)模更重要,商湯在過(guò)去積累了不少客戶,解決了很多行業(yè)問(wèn)題,因此積累了大量真實(shí)數(shù)據(jù),能夠讓模型在通用的基礎(chǔ)上,在垂直領(lǐng)域更好用。在此后一年3個(gè)月的時(shí)間內(nèi),“日日新”迭代至5.5版本,交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)標(biāo)GPT-4o,也是國(guó)內(nèi)對(duì)標(biāo)GPT-4 Turbo領(lǐng)先的國(guó)產(chǎn)大模型之一。商湯技術(shù)上的領(lǐng)先也迅速體現(xiàn)在商業(yè)上。今年8月商湯發(fā)布的半年財(cái)報(bào)顯示,2024年上半年,商湯收入17.4億元,同比增長(zhǎng)21%;毛利7.7億元,同比增長(zhǎng)18%。商湯財(cái)報(bào)中,收入來(lái)源按業(yè)務(wù)分為三大類(lèi),生成式AI、智能汽車(chē)和傳統(tǒng)AI,其中生成式AI占比60.4%,是目前商湯收入占比最高的業(yè)務(wù)。
新的機(jī)遇和挑戰(zhàn)
把原來(lái)傳統(tǒng)AI構(gòu)建一個(gè)個(gè)場(chǎng)景模型的時(shí)代稱(chēng)為AI1.0的話,徐立認(rèn)為,生成式AI或者AI2.0時(shí)代除了模型的通用性之外,最大的特點(diǎn)是成本結(jié)構(gòu)由“研發(fā)人員密集型”轉(zhuǎn)化為了“算力資源密集型”。OpenAI研發(fā)ChatGPT的時(shí)候研發(fā)人員只有87人。由一套算力基礎(chǔ)設(shè)施支持行業(yè)應(yīng)用,實(shí)現(xiàn)服務(wù)邊際成本極低,是理想的模式。但實(shí)際上,目前算力資源成本巨大,以現(xiàn)有的應(yīng)用規(guī)模來(lái)說(shuō),很難看到盈虧平衡。2024年9月,微軟與貝萊德攜手成立300億美金的AI基建基金。商湯是上一輪AI產(chǎn)業(yè)爆發(fā)中,少數(shù)成功上市的AI公司。一些業(yè)內(nèi)人士擔(dān)心,商湯在資金儲(chǔ)備方面不及互聯(lián)網(wǎng)大廠,可以大規(guī)模投入今天的生成式大模型;又不像初創(chuàng)公司那樣可以暫時(shí)不考慮商業(yè)回報(bào),通過(guò)一級(jí)市場(chǎng)大規(guī)模融資來(lái)獲得技術(shù)投入資本。徐立卻認(rèn)為,過(guò)往十年的AI1.0時(shí)代客戶和應(yīng)用,使得商湯更了解市場(chǎng)需要什么樣的AI產(chǎn)品和服務(wù)。其次,也因?yàn)殚L(zhǎng)期專(zhuān)注于AI底層基礎(chǔ)設(shè)施與模型應(yīng)用,商湯積累了可觀的算力規(guī)模和技術(shù)資源,以及高效運(yùn)營(yíng)這些資源的能力!半娏屯ㄐ帕髁慷际腔A(chǔ)設(shè)施,一套基礎(chǔ)設(shè)施就能服務(wù)千行百業(yè),但是早期的成本也都居高不下,隨著技術(shù)的迭代以及使用人數(shù)的擴(kuò)大,邊際成本就忽略不計(jì)了”,現(xiàn)在AI基礎(chǔ)設(shè)施正處在這樣的重要轉(zhuǎn)折點(diǎn)。他總結(jié),商湯是最懂模型的算力服務(wù)商,最懂算力的模型服務(wù)商。商湯也需要將傳統(tǒng)AI客戶轉(zhuǎn)化為生成式AI客戶,隨著客戶需求和技術(shù)迭代,讓生成式AI商業(yè)應(yīng)用能夠快速進(jìn)入市場(chǎng)。在具體應(yīng)用行業(yè)上,商湯需要做到更聚焦。AI1.0時(shí)代的行業(yè)客戶,在通用人工智能來(lái)臨之際,已經(jīng)快速將日日新大模型部署到各領(lǐng)域,一些垂直行業(yè)場(chǎng)景包括金融領(lǐng)域,如商湯金融的數(shù)據(jù)先兵產(chǎn)品聚焦數(shù)字化分析;在智能辦公領(lǐng)域,比如在Copilot助手(個(gè)人AI助手)商湯 “小浣熊”產(chǎn)品個(gè)人用戶和開(kāi)發(fā)者達(dá)數(shù)十萬(wàn),亦服務(wù)于金山辦公等頭部應(yīng)用。此外,在大模型擬人交互領(lǐng)域,商湯日日新大模型支持了新浪微博、閱文集團(tuán)筑夢(mèng)島、愛(ài)奇藝等互聯(lián)網(wǎng)應(yīng)用,日均Tokens數(shù)達(dá)數(shù)百億,調(diào)用量在半年內(nèi)增長(zhǎng)近22倍。商湯下一步的產(chǎn)品和業(yè)務(wù)目標(biāo)是“用得上、用得好、用得起”。用得上是指能真正為用戶創(chuàng)造價(jià)值;用得好是要進(jìn)入客戶的生產(chǎn)和流程中;用得起,則是需要大幅降低訓(xùn)練、推理和部署成本。為了實(shí)現(xiàn)這一目標(biāo),商湯決策層制定了“大裝置-大模型-應(yīng)用”的三位一體核心戰(zhàn)略。大裝置是指模型的基礎(chǔ)設(shè)施服務(wù),以算力服務(wù)為主。徐立提到,如果只有基礎(chǔ)設(shè)施,不懂大模型的話,就有競(jìng)爭(zhēng)力。今天使用算力主要有兩類(lèi),一是訓(xùn)練模型,二是使用模型。訓(xùn)練模型時(shí),需要優(yōu)化算力使用效率;使用模型的時(shí)候,則需要節(jié)約算力成本。“今天人工智能的商業(yè)模式不管是訓(xùn)練模型,還是用模型對(duì)外服務(wù),本質(zhì)意義上都是在消耗資源,付的是資源的費(fèi)用。所有的商業(yè)模式最后都和計(jì)算資源消耗畫(huà)了一個(gè)等號(hào),就是通過(guò)‘三位一體’,把資源以最有效的方式利用起來(lái)!毙炝⒈硎尽0凑者@樣的戰(zhàn)略布局,商湯認(rèn)為,算力和模型的深度協(xié)同,能讓大模型迅速迭代,并降低推理成本,從而獲得更多用戶和調(diào)用量增長(zhǎng),實(shí)現(xiàn)收入提升。例如在推理場(chǎng)景中,商湯以創(chuàng)新的技術(shù)架構(gòu)實(shí)現(xiàn)了相同算力及電力成本下的每秒請(qǐng)求數(shù)(QPS)提升4倍,并實(shí)現(xiàn)了推理服務(wù)彈性按需伸縮,優(yōu)化了大規(guī)模AI推理的整體成本。算力服務(wù)是不少科技巨頭也在重點(diǎn)布局的方向,徐立認(rèn)為,一些科技巨頭的重心在于自己的生態(tài),包括自研芯片和云平臺(tái)等。但當(dāng)下AI領(lǐng)域要搶占先機(jī),什么資源更快更好用就先用起來(lái),不局限于一家的產(chǎn)品和平臺(tái)。徐立認(rèn)為,商湯提供的基礎(chǔ)服務(wù)更貼近AI發(fā)展現(xiàn)狀。
穿越技術(shù)周期的兩條腿
今天,AI領(lǐng)域最大的挑戰(zhàn)就是商業(yè)模式不清晰。算力的投入,數(shù)據(jù)的投入和人才的投入都相對(duì)確定,甚至連AI可能帶來(lái)的風(fēng)險(xiǎn)和威脅都已經(jīng)被多次討論。但AI究竟能怎么賺錢(qián),最終的產(chǎn)品形態(tài)如何,目前還很難有定論。商湯這樣的AI技術(shù)公司,能否成功穿越新一輪技術(shù)轉(zhuǎn)換周期,取決于兩點(diǎn):其一,走得夠快;其二,走得夠遠(yuǎn)。徐立說(shuō),今天對(duì)于AI公司來(lái)說(shuō)挑戰(zhàn)很大,因?yàn)椤凹夹g(shù)投入永遠(yuǎn)要比商業(yè)化前置”。如果決定要做大模型,那就需要長(zhǎng)期的資源投入,有新的方向出現(xiàn)都要跟進(jìn)。但實(shí)際的回報(bào)可能要等很長(zhǎng)的周期。上市后的商湯有了更清晰的規(guī)劃盈利。
徐立說(shuō),商湯目前有兩條腿,一條腿是傳統(tǒng)AI,技術(shù)成熟,不斷降低成本、拓展市場(chǎng)(包括海外市場(chǎng)),聚焦利潤(rùn)貢獻(xiàn);另一條腿新一代的AI大模型,目標(biāo)是盈虧平衡,這條腿增長(zhǎng)很快,且能看得到未來(lái)。前者保證商湯“走得夠快”,后者保證“走得夠遠(yuǎn)”。商湯在不斷探索不同的商業(yè)的模式,比如:賣(mài)一體機(jī)。一臺(tái)機(jī)器配一定數(shù)量的賬號(hào),能夠?qū)崿F(xiàn)本地化部署,即買(mǎi)即用,一方面能降低客戶應(yīng)用AI的門(mén)檻,另一方面也能幫助客戶節(jié)約使用成本。這一模式相對(duì)軟件模式,毛利偏低,但商業(yè)化效率提升明顯。在海外市場(chǎng),商湯也未放棄軟件模式。事實(shí)上,目前全球范圍內(nèi),中國(guó)和美國(guó)是AI領(lǐng)域的兩大高地,中國(guó)的AI技術(shù)對(duì)很多海外國(guó)家來(lái)說(shuō),都是非常領(lǐng)先的。徐立說(shuō),海外客戶對(duì)于AI軟件的購(gòu)買(mǎi)意愿很高,且回款周期短。目前商湯在傳統(tǒng)AI領(lǐng)域已經(jīng)有非常成熟的產(chǎn)品和解決方案,只需要繼續(xù)拓展海外銷(xiāo)售渠道即可。據(jù)了解,商湯目前海外市場(chǎng)的年?duì)I收增長(zhǎng)率約40%,高于21%的整體增長(zhǎng)率,海外市場(chǎng)占集團(tuán)總收入比例提升至18.5%。目前,海外市場(chǎng)對(duì)于商湯來(lái)說(shuō)是賺錢(qián)主力之一,且在海外能沿用軟件模式,毛利更高。海外市場(chǎng)營(yíng)收和利潤(rùn)的增長(zhǎng)也能夠幫助商湯更好地投入到大模型業(yè)務(wù)中。接下來(lái),考驗(yàn)AI公司的是如何實(shí)現(xiàn)大模型的商業(yè)化。據(jù)媒體報(bào)道,OpenAI GPT-4的一次訓(xùn)練成本約6300萬(wàn)美元,2022年的總訓(xùn)練成本約5.4億美元。OpenAI稱(chēng)2024年的運(yùn)營(yíng)成本將超過(guò)85億美元,預(yù)計(jì)虧損約50億元美元,預(yù)計(jì)2023年至2028年的總虧損(不包括股權(quán)補(bǔ)償)將達(dá)到440億美元。OpenAI還提到,模型訓(xùn)練成本還將進(jìn)一步增長(zhǎng),預(yù)計(jì)到2026年每年將達(dá)到95億美元?梢灶A(yù)見(jiàn)的是,大模型依然會(huì)在通用的道路上前進(jìn),但很難在短時(shí)間內(nèi)實(shí)現(xiàn)真正的通用。此外,隨著開(kāi)源模型的能力越來(lái)越強(qiáng),對(duì)于一些科技公司來(lái)說(shuō),再去“卷”參數(shù)、做預(yù)訓(xùn)練價(jià)值不大。更實(shí)際的方式是,通過(guò)針對(duì)性訓(xùn)練,去提升較小模型的專(zhuān)有能力,也相當(dāng)于是“降本增效”,這可能是更符合當(dāng)下市場(chǎng)環(huán)境的做法。從訓(xùn)練到推理,算力的資源屬性愈發(fā)顯現(xiàn)。商湯也在積極布局算力運(yùn)營(yíng),希望在現(xiàn)有條件下將已投入打造的資源變現(xiàn)。現(xiàn)實(shí)情況是,目前市場(chǎng)上的算力資源分散且標(biāo)準(zhǔn)不統(tǒng)一,使用起來(lái)效率不高。而商湯可提供算力運(yùn)營(yíng)服務(wù),將不同標(biāo)準(zhǔn)的卡連接起來(lái),適配不同需求,滿足那些需要使用算力的客戶。2024年10月18日,商湯科技十周年國(guó)際論壇上,徐立表示,當(dāng)下正處于AGI(通用AI)的轉(zhuǎn)折點(diǎn),大模型快速發(fā)展很大程度是因?yàn)榛A(chǔ)設(shè)施水平有顯著提高,讓通用AI模型成為可能。徐立還提到,早在2014年商湯成立之時(shí),商湯創(chuàng)始人湯曉鷗就強(qiáng)調(diào),要把技術(shù)帶到日常生活中,希望技術(shù)能夠融入生活的不同場(chǎng)景。這句話放到今天仍不過(guò)時(shí)。