導(dǎo)讀THECAPITAL
AI大模型深度分析報(bào)告,展示AI在內(nèi)容獲取、創(chuàng)作、交互及行業(yè)場(chǎng)景的應(yīng)用前景。本文4689字,約5.4分鐘作者 | 融中咨詢來(lái)源 | 融中咨詢(ID:gh_fdc07527ac52)
人工智能大模型定義及分類(lèi)
人工智能大模型是指利用深度學(xué)習(xí)算法讓計(jì)算機(jī)從復(fù)雜數(shù)據(jù)集中自動(dòng)提取關(guān)鍵特征并做出精準(zhǔn)決策的具有龐大參數(shù)規(guī)模的模型。
人工智能大模型可以分為通用大模型及行業(yè)大模型兩種類(lèi)別,通用大模型是指使用通識(shí)類(lèi)數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,使模型具備包括多語(yǔ)言工作能力、廣泛學(xué)科的基礎(chǔ)知識(shí)及邏輯推理能力等泛化內(nèi)容任務(wù)解決的能力。行業(yè)大模型是指使用專(zhuān)項(xiàng)領(lǐng)域數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,使模型提取出該專(zhuān)項(xiàng)領(lǐng)域規(guī)律并具備專(zhuān)項(xiàng)領(lǐng)域任務(wù)解決能力。
AI大模型的“智力”來(lái)源
(1)Transformer算法奠定大模型基礎(chǔ)當(dāng)前主流大模型普遍是基于Transformer算法進(jìn)行設(shè)計(jì)的。Transformer的核心優(yōu)勢(shì)在于具有獨(dú)特的自注意力(Self-attention)機(jī)制,能夠直接建模任意距離的詞元之間的交互關(guān)系,解決了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)等傳統(tǒng)神經(jīng)網(wǎng)絡(luò)存在的長(zhǎng)序列依賴(lài)問(wèn)題。
(2)規(guī)模定律助推大模型智力涌現(xiàn)“規(guī)模定律”描述了模型的表現(xiàn)與其參數(shù)規(guī)模之間呈現(xiàn)冪律關(guān)系,即隨著模型參數(shù)規(guī)模的增加,模型在各種任務(wù)上的表現(xiàn)會(huì)隨之提升。
“涌現(xiàn)能力”是指當(dāng)模型的參數(shù)規(guī)模達(dá)到一定程度時(shí),某些任務(wù)處理的能力會(huì)出現(xiàn)爆發(fā)性的增長(zhǎng),并成為大模型性能突破的關(guān)鍵。
圖 1規(guī)模定律中大模型能力的呈現(xiàn)
信息來(lái)源:Emergent Abilities of Large Language Models,2022
AI大模型發(fā)展趨勢(shì)分析
(1)參數(shù)規(guī)模競(jìng)爭(zhēng)為頭部競(jìng)爭(zhēng)主基調(diào)近年來(lái),以O(shè)pen AI、谷歌為代表的行業(yè)頭部大模型廠商仍在發(fā)掘“規(guī)模定律”(Scaling Law)所能帶來(lái)的能力提升,通過(guò)將模型參數(shù)的持續(xù)擴(kuò)張以提升模型的任務(wù)處理能力,人工智能模型的計(jì)算使用量呈指數(shù)級(jí)增長(zhǎng)。
圖 2 AI大模型的參數(shù)量變化
信息來(lái)源:Artificial Intelligence Index Report,2024
根據(jù)圖3所示,過(guò)去大模型進(jìn)行訓(xùn)練投入的訓(xùn)練成本隨著訓(xùn)練數(shù)據(jù)的持續(xù)增長(zhǎng)而呈現(xiàn)巨幅增長(zhǎng)的態(tài)勢(shì)。
圖 3 AI大模型的訓(xùn)練成本對(duì)比
信息來(lái)源:Artificial Intelligence Index Report,2024
(2)多模態(tài)能力成為發(fā)展趨勢(shì)當(dāng)下人工智能大模型的多模態(tài)交互正逐漸成為未來(lái)的發(fā)展趨勢(shì)。表1展示了當(dāng)下多模態(tài)模型按工作原理進(jìn)行的分類(lèi),并展示了各種多模態(tài)大模型的工作原理。
表 1 多模態(tài)大模型的實(shí)現(xiàn)方式
信息來(lái)源:Multimodal Foundation Models:From Specialists to General-Purpose Assistants,2023
除了大模型朝向多模態(tài)方向發(fā)展以外,其多模態(tài)工作的能力也在不斷深化。以圖4所示, Claude 3.5 Sonnet 相比前一代在根據(jù)文字需求改進(jìn)代碼的測(cè)中可以解決26%的更多問(wèn)題。
圖 4歷代Claude 模型解決編程問(wèn)題情況對(duì)比
信息來(lái)源:Claude 3.5 Sonnet Model Card Addendum,2024
(3)人工智能向全行業(yè)滲透根據(jù)中國(guó)工業(yè)和信息化部信息,截至2024年7月30日,全國(guó)已備案的AI大模型為197個(gè);其中通用大模型、行業(yè)大模型數(shù)量分別為61、136款,占比分別為31%、69%;行業(yè)大模型為目前AI大模型的主要開(kāi)發(fā)方向。
圖 5 全國(guó)備案大模型的行業(yè)分布
信息來(lái)源:國(guó)家互聯(lián)網(wǎng)信息辦公室
根據(jù)中國(guó)工業(yè)和信息化部信息,教育及金融行業(yè)是目前行業(yè)大模型開(kāi)發(fā)中最受關(guān)注的兩個(gè)領(lǐng)域。此外在辦公、政務(wù)、醫(yī)療領(lǐng)域中,已備案的AI大模型的數(shù)量亦有著較大的比重。
人工智能大模型市場(chǎng)規(guī)模
根據(jù)中國(guó)工業(yè)和信息化部賽迪研究院數(shù)據(jù),2023年中國(guó)語(yǔ)言大模型市場(chǎng)規(guī)模為132.3億元,預(yù)計(jì)2027年中國(guó)語(yǔ)言大模型行業(yè)市場(chǎng)規(guī)模將達(dá)到600億元。
圖 6 中國(guó)大模型行業(yè)規(guī)模,2022-2027E
信息來(lái)源:中國(guó)工業(yè)和信息化部賽迪研究院,環(huán)球網(wǎng)
AI大模型發(fā)展前景分析
人工智能的發(fā)展可以看作是新一輪工業(yè)革命的開(kāi)始,本章將把人工智能與傳統(tǒng)生產(chǎn)方式中的主要工作場(chǎng)景進(jìn)行對(duì)比分析。
(1)人工智能內(nèi)容獲取場(chǎng)景前景分析在內(nèi)容獲取的服務(wù)能力上,人工智能已展現(xiàn)超越人類(lèi)專(zhuān)家的知識(shí)水平,“消費(fèi)電子+”成為行業(yè)趨勢(shì)。
在人工智能知識(shí)能力的測(cè)試方面,谷歌團(tuán)隊(duì)發(fā)布的測(cè)試顯示OpenAI o1在專(zhuān)業(yè)知識(shí)測(cè)評(píng)中對(duì)專(zhuān)業(yè)問(wèn)題的解答準(zhǔn)確率要高于相關(guān)領(lǐng)域的專(zhuān)家,展示了頂尖語(yǔ)言大模型在部分專(zhuān)業(yè)領(lǐng)域的知識(shí)已達(dá)到甚至超過(guò)人類(lèi)博士水平的現(xiàn)狀。
現(xiàn)階段,人工智能較為熱門(mén)的落地方向之一便是可穿戴電子產(chǎn)品與AI的結(jié)合,相關(guān)AI電子產(chǎn)品包括AI耳機(jī)、AI手機(jī)、AI眼鏡等。
圖 7博士水平科學(xué)問(wèn)卷完成情況(GPQA Diamond測(cè)試)
信息來(lái)源:openAI
(2)人工智能創(chuàng)作場(chǎng)景前景分析在創(chuàng)作場(chǎng)景的服務(wù)能力上,人工智能已具備略優(yōu)于人類(lèi)的創(chuàng)造性,但對(duì)人類(lèi)創(chuàng)作的替代能力仍不足。
2024年2月份,阿肯色大學(xué)團(tuán)隊(duì)對(duì)人工智能的創(chuàng)造性進(jìn)行測(cè)試,結(jié)果表明人工智能大模型在需要開(kāi)創(chuàng)性思維的創(chuàng)作類(lèi)工作中已具備匹敵甚至超越人類(lèi)工作者的基礎(chǔ)條件。
現(xiàn)階段的應(yīng)用情況,人工智能在文本創(chuàng)作上已被較多嘗試;在視頻創(chuàng)作上,AI視頻創(chuàng)作的難點(diǎn)在于大模型對(duì)物理規(guī)律的理解;在編程能力上,前沿大模型距離人類(lèi)專(zhuān)業(yè)工作者的水平仍有差距。
(3)人工智能交互場(chǎng)景前景分析
在交互場(chǎng)景上,人工智能具備多模態(tài)的擬人化交互能力,F(xiàn)階段以GPT-4o模型和谷歌的Project Astra為代表的人工智能模型都實(shí)現(xiàn)了跨模態(tài)的實(shí)時(shí)推理功能。除了多模態(tài)交互能力以外,人工智能大模型還展現(xiàn)了情感感知能力。
(4)人工智能行業(yè)場(chǎng)景前景分析在行業(yè)應(yīng)用場(chǎng)景上,人工智能可替代或輔助人類(lèi)在傳統(tǒng)工作場(chǎng)景的職能,實(shí)現(xiàn)人力成本的降低及效能的提升。
在金融應(yīng)用場(chǎng)景上,人工智能可幫助機(jī)構(gòu)搭建AI客服系統(tǒng),提供全時(shí)段的問(wèn)題解答與業(yè)務(wù)辦理等服務(wù)。在金融領(lǐng)域的中后臺(tái)及保險(xiǎn)行業(yè),人工智能亦有充分應(yīng)用場(chǎng)景。
在政務(wù)應(yīng)用場(chǎng)景上,一方面人工智能可以基于政務(wù)數(shù)據(jù)庫(kù),在政策的制定、社會(huì)數(shù)據(jù)的監(jiān)控等方面提供智能檢索、分析、決策設(shè)計(jì)等功能。在對(duì)公工作方面,人工智能亦有充分應(yīng)用場(chǎng)景。
在醫(yī)療應(yīng)用場(chǎng)景上,人工智能可以輔助醫(yī)生進(jìn)行疾病診斷工作、根據(jù)醫(yī)生的診斷決策,提供多種方案的用藥建議;在藥物研發(fā)方面,人工智能主要應(yīng)用在靶點(diǎn)發(fā)現(xiàn)、化合物的設(shè)計(jì)與篩選上亦有所為。
人工智能在其他的行業(yè)應(yīng)用場(chǎng)景還包括自動(dòng)駕駛、AI質(zhì)量檢測(cè)等對(duì)傳統(tǒng)人工環(huán)節(jié)的滲透或替代。
AI大模型行業(yè)應(yīng)用的解決方案
(1)解決方案:“提示工程”引導(dǎo)模型輸出更專(zhuān)業(yè)提示工程是使模型回答更加專(zhuān)業(yè)化的一種解決方案,其在通用大模型現(xiàn)有的數(shù)據(jù)及參數(shù)基礎(chǔ)上提供專(zhuān)業(yè)的“思維引導(dǎo)”,這些“思維引導(dǎo)”通常通過(guò)挑選出的提示語(yǔ)言來(lái)實(shí)現(xiàn),在提示語(yǔ)言的引導(dǎo)下最終使大模型輸出與專(zhuān)業(yè)領(lǐng)域要求更相關(guān)且更準(zhǔn)確的內(nèi)容。
圖 8 提示詞工程的運(yùn)行步驟
信息來(lái)源:LARGE LANGUAGE MODELS ARE HUMAN-LEVELPROMPT ENGINEERS,2023
(2)解決方案:“預(yù)訓(xùn)練”創(chuàng)造行業(yè)大模型
使大模型針對(duì)特定行業(yè)亦具備專(zhuān)業(yè)工作能力的解決方案之一便是使用包含行業(yè)數(shù)據(jù)集的語(yǔ)料庫(kù)對(duì)語(yǔ)言大模型進(jìn)行預(yù)訓(xùn)練,最后可得到專(zhuān)業(yè)處理能力遠(yuǎn)超普通基礎(chǔ)大模型的行業(yè)大模型。
預(yù)訓(xùn)練方法的應(yīng)用主體除了包括對(duì)數(shù)據(jù)保密要求較高的企業(yè),還適用于與現(xiàn)有大模型差異較大的場(chǎng)景,以更好地提升行業(yè)解決能力。
(3)解決方案:“精調(diào)”對(duì)模型進(jìn)行局部調(diào)整精調(diào)是指對(duì)已訓(xùn)練好的通用大模型參數(shù)進(jìn)行針對(duì)于目標(biāo)行業(yè)任務(wù)的調(diào)整,將行業(yè)數(shù)據(jù)集用于再次訓(xùn)練大模型,最終使通用大模型具備更豐富的行業(yè)數(shù)據(jù)積累以及專(zhuān)項(xiàng)問(wèn)題解決能力的方法。與預(yù)訓(xùn)練相比,精調(diào)方式減少了訓(xùn)練時(shí)間,通常只需要對(duì)模型做局部調(diào)整,所需的訓(xùn)練數(shù)據(jù)也相對(duì)較少,是一種更為經(jīng)濟(jì)高效的方法。
圖 11預(yù)訓(xùn)練與精調(diào)的對(duì)比
信息來(lái)源:公開(kāi)資料整理
(4)解決方案:“RAG”外掛數(shù)據(jù)庫(kù)拓寬模型行業(yè)知識(shí)
RAG通過(guò)在通用大模型原有基礎(chǔ)上外掛目標(biāo)行業(yè)知識(shí)庫(kù),能為基礎(chǔ)大模型提供海量的行業(yè)數(shù)據(jù)信息輸入,繼而將基礎(chǔ)大模型的通用任務(wù)解決能力與海量專(zhuān)業(yè)知識(shí)相結(jié)合,形成具備解決專(zhuān)業(yè)領(lǐng)域任務(wù)能力的行業(yè)大模型。RAG架構(gòu)解決方案適用于具備豐富數(shù)據(jù)資源基礎(chǔ)的企業(yè),通常應(yīng)用于特定行業(yè)的人工智能客服問(wèn)答、內(nèi)容查詢及數(shù)據(jù)處理等任務(wù)。
圖 12 RAG技術(shù)的實(shí)現(xiàn)步驟
信息來(lái)源:公開(kāi)資料整理
人工智能大模型股權(quán)
最新投資案例分析
百度最近10年,百度在深度學(xué)習(xí)、對(duì)話式人工智能操作系統(tǒng)、自動(dòng)駕駛、AI芯片等前沿領(lǐng)域投資,使得百度成為一個(gè)擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。
百度自然語(yǔ)言處理以『理解語(yǔ)言,擁有智能,改變世界』為使命,致力于研發(fā)自然語(yǔ)言處理核心技術(shù),打造領(lǐng)先的技術(shù)平臺(tái)和創(chuàng)新產(chǎn)品,服務(wù)全球用戶,讓復(fù)雜的世界更簡(jiǎn)單。產(chǎn)品方面,百度擁有NLP能力引擎、開(kāi)發(fā)平臺(tái)文心、智能對(duì)話服務(wù)與定制平臺(tái) UNIT、百度輸入法和百度智能翻譯。
騰訊
在NLP方面,騰訊云 NLP 服務(wù)深度整合了騰訊內(nèi)部的 NLP 技術(shù),提供多項(xiàng)智能文本處理和文本生成能力,包括詞法分析、相似詞召回、詞相似度、句子相似度、文本潤(rùn)色、句子糾錯(cuò)、文本補(bǔ)全、句子生成等。滿足各行業(yè)的文本智能需求。
科大訊飛
科大訊飛在自然語(yǔ)言處理領(lǐng)域的相關(guān)產(chǎn)品有訊飛聽(tīng)見(jiàn)、訊飛輸入法和訊飛星火大模型;谝哉Z(yǔ)音交互為核心的智能語(yǔ)音技術(shù),上述產(chǎn)品可以完成文本朗讀、語(yǔ)音合成、語(yǔ)音識(shí)別、中文自動(dòng)分詞、詞性標(biāo)注、句法分析、自然語(yǔ)言生成、文本分類(lèi)、信息檢索與抽取、文字校對(duì)、問(wèn)答系統(tǒng)、機(jī)器翻譯、自動(dòng)摘要等功能。
圖表 10 科大訊飛融資歷程
資料來(lái)源:企查查、融中研究整理
拓爾思(300229)在自然語(yǔ)言處理領(lǐng)域。拓爾思有智語(yǔ)自然語(yǔ)言處理引擎。該引擎提供非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化、賦能語(yǔ)義智能分析和支持構(gòu)建知識(shí)圖譜或本體知識(shí)庫(kù)三大功能,面向智慧專(zhuān)利、智慧公安、智慧政務(wù)、智慧金融、開(kāi)源情報(bào)分析等應(yīng)用場(chǎng)景,以先進(jìn)的NLP技術(shù)為用戶的業(yè)務(wù)應(yīng)用賦智賦能。
圖表 11 拓爾思融資歷程
資料來(lái)源:企查查、融中研究整理
思必馳思必馳自然語(yǔ)言處理技術(shù),專(zhuān)注于智能對(duì)話中的大規(guī)模、可定制語(yǔ)義理解解決方案和實(shí)體識(shí)別、語(yǔ)義角色分析、信息抽取等自然語(yǔ)言技術(shù)。
圖表 12 思必馳自然語(yǔ)言處理核心優(yōu)勢(shì)
資料來(lái)源:融中研究整理
圖表 13 思必馳融資歷程
資料來(lái)源:36氪、融中研究整理
追一科技自然語(yǔ)言處理(NLP)方面,追一科技在大規(guī)模預(yù)訓(xùn)練模型、自然語(yǔ)言智能交互(NL2X)、NLG(自然語(yǔ)言生成)等領(lǐng)域?qū)矣袆?chuàng)新,并將技術(shù)成果開(kāi)放給業(yè)界,持續(xù)推動(dòng)NLP技術(shù)的發(fā)展。在未來(lái)元宇宙時(shí)代,NLP技術(shù)有著極大的應(yīng)用潛力,致力于成為元宇宙對(duì)話交互技術(shù)基礎(chǔ)設(shè)施提供者。
圖表 14 追一科技融資歷程
資料來(lái)源:36氪、融中研究整理
香儂科技在自然語(yǔ)言處理方面,香儂科技以深度學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)模型,解讀億萬(wàn)文本和圖像,精準(zhǔn)呈現(xiàn)關(guān)鍵信息。采用由語(yǔ)言學(xué)家自研設(shè)計(jì)的文本標(biāo)注系統(tǒng),持續(xù)進(jìn)行大規(guī)模數(shù)據(jù)標(biāo)注和流程優(yōu)化;采用并行超算平臺(tái)和大黃蜂深度學(xué)習(xí)框架,顯著提高NLP算法開(kāi)發(fā)效率;采用BERT等深度學(xué)習(xí)最新模型,并在算法上持續(xù)優(yōu)化和突破。香儂科技深耕NLP,提供行業(yè)領(lǐng)先的信息處理的全新解決方案。
圖表 15 香儂科技融資歷程
資料來(lái)源:36氪、融中研究整理
出門(mén)問(wèn)問(wèn)(2438.HK )出門(mén)問(wèn)問(wèn)擁有行業(yè)領(lǐng)先的AI基礎(chǔ)設(shè)施能力、前沿通用大模型能力(自研大模型「序列猴子」),以及豐富的垂直領(lǐng)域軟硬結(jié)合的優(yōu)化算法技術(shù)模塊,是為數(shù)不多的同時(shí)服務(wù)于消費(fèi)者、企業(yè)、創(chuàng)作者三大類(lèi)不同群體的公司。
圖表 16 出門(mén)問(wèn)問(wèn)融資歷程
資料來(lái)源:36氪、融中研究整理
零一萬(wàn)物在自然語(yǔ)言處理技術(shù)方面,零一萬(wàn)物走的是自主研發(fā)大模型的道路,已經(jīng)完成了百億參數(shù)級(jí)別的內(nèi)部測(cè)試,并計(jì)劃在未來(lái)將模型規(guī)模提升至300到700億參數(shù)。此外,該公司還計(jì)劃推出開(kāi)源的模型版本,與社區(qū)共享技術(shù)成果。零一萬(wàn)物的愿景是不僅僅做通用大模型,還要做能夠處理圖片、視頻、3D等多種數(shù)據(jù)類(lèi)型的多模態(tài)模型。
圖表 17 零一萬(wàn)物融資歷程
資料來(lái)源:36氪、融中研究整理
月之暗面月之暗面的主要業(yè)務(wù)集中在開(kāi)發(fā)和推廣大模型技術(shù),特別是在自然語(yǔ)言處理(NLP)領(lǐng)域。公司在大模型長(zhǎng)上下文窗口技術(shù)上取得了新的突破,其自研的Kimi智能助手已支持200萬(wàn)字超長(zhǎng)無(wú)損上下文,并開(kāi)啟了產(chǎn)品內(nèi)測(cè)。
圖表 18 月之暗面融資歷程
資料來(lái)源:天眼查、融中研究整理
主線科技表 2主線科技最新輪股權(quán)投資信息
信息來(lái)源:融中數(shù)據(jù)庫(kù)
在港口無(wú)人駕駛方面,主線科技的無(wú)人駕駛方案設(shè)計(jì)出“多交通參與者混行博弈算法”,旨在解決無(wú)人駕駛車(chē)輛在港口運(yùn)輸所面臨的交通參與者復(fù)雜、道路不明晰等痛點(diǎn),在結(jié)合自身成型的無(wú)人駕駛商用車(chē)體系、物聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)后可為現(xiàn)存港口運(yùn)輸實(shí)現(xiàn)全域智聯(lián)的無(wú)人駕駛技術(shù)升級(jí)。
深勢(shì)科技表 2主線科技最新輪股權(quán)投資信息
信息來(lái)源:融中數(shù)據(jù)庫(kù)
在醫(yī)藥人工智能方面,深勢(shì)科技借助自研藥物計(jì)算設(shè)計(jì)平臺(tái),能夠提供一站式藥物設(shè)計(jì)解決方案。該平臺(tái)覆蓋了從蛋白結(jié)構(gòu)解析、靶點(diǎn)發(fā)現(xiàn)和確證、虛擬篩選、先導(dǎo)物優(yōu)化到藥代動(dòng)力學(xué)預(yù)測(cè)等臨床前藥物設(shè)計(jì)的全部階段,利用自研核心算法在精度和效率上實(shí)現(xiàn)重大突破。#線索爆料# rzcj@thecapital.com.cn