科技新聞?dòng)崜?jù)國(guó)外媒體報(bào)道,由華裔女科學(xué)家、“人工智能教母”李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所(StanfordHAI)近日發(fā)布了《2024年人工智能指數(shù)報(bào)告》(ArtificialIntelligenceIndexReport2024)。
關(guān)注科技新聞微信公眾號(hào)(qqtech),回復(fù)“李飛飛”,可獲取英文原版PDF報(bào)告下載鏈接。
這份長(zhǎng)達(dá)501頁(yè)的報(bào)告是斯坦福大學(xué)以人為本人工智能研究所發(fā)布的人工智能指數(shù)報(bào)告,追蹤了2023年全球人工智能的發(fā)展趨勢(shì)。根據(jù)官方的介紹,該報(bào)告是斯坦福大學(xué)以人為本人工智能研究所迄今為止發(fā)布的最全面的報(bào)告,出現(xiàn)在人工智能已對(duì)人類社會(huì)產(chǎn)生影響的重要時(shí)刻。今年,該研究所擴(kuò)大了研究范圍,更廣泛地涵蓋了基本趨勢(shì),如人工智能的技術(shù)進(jìn)步、公眾對(duì)該技術(shù)的看法以及圍繞其發(fā)展的地緣政治動(dòng)態(tài)。
斯坦福大學(xué)HAI介紹稱,人工智能指數(shù)報(bào)告跟蹤、整理、提取和可視化與人工智能相關(guān)的數(shù)據(jù)。該研究所的使命是提供不帶偏見的、經(jīng)過嚴(yán)格審查的、來源廣泛的數(shù)據(jù),以便政策制定者、研究人員、高管、記者和公眾對(duì)復(fù)雜的人工智能領(lǐng)域有更深入細(xì)致的了解。人工智能指數(shù)是全球公認(rèn)的最可信和最權(quán)威的人工智能數(shù)據(jù)和見解來源之一。
與往年不同,今年的版本在內(nèi)容、規(guī)模和范圍上都超過往年,反映出人工智能在人類日常生活中日益增長(zhǎng)的重要性。新報(bào)告揭示了2023年人工智能行業(yè)的十大主要趨勢(shì):
十大主要趨勢(shì)
1
人工智能在某些任務(wù)上勝過人類,但并非在所有任務(wù)上。人工智能已在多項(xiàng)基準(zhǔn)測(cè)試中超越人類,包括在圖像分類、視覺推理和英語(yǔ)理解方面。然而,它在競(jìng)賽級(jí)數(shù)學(xué)、視覺常識(shí)推理和規(guī)劃等更復(fù)雜的任務(wù)上依然落后于人類。
2
產(chǎn)業(yè)界繼續(xù)主導(dǎo)人工智能前沿研究。2023年,產(chǎn)業(yè)界產(chǎn)生了51個(gè)著名的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界只貢獻(xiàn)了15個(gè)。2023年,產(chǎn)學(xué)合作產(chǎn)生了21個(gè)著名模型,創(chuàng)下新高。此外,108個(gè)新發(fā)布的基礎(chǔ)模型來自產(chǎn)業(yè)界,28個(gè)來自學(xué)術(shù)界。
3
前沿模型變得更加昂貴。根據(jù)《人工智能指數(shù)報(bào)告》估計(jì),最先進(jìn)人工智能模型的訓(xùn)練成本已達(dá)到了前所未有的水平。例如,OpenAI的GPT-4使用了價(jià)值約7800萬(wàn)美元的算力進(jìn)行訓(xùn)練,而谷歌的GeminiUltra花費(fèi)了1.91億美元的算力。
4
美國(guó)領(lǐng)先中國(guó)、歐盟和英國(guó),成為頂級(jí)人工智能模型的主要開發(fā)國(guó)家。2023年,61款著名人工智能模型來自美國(guó)機(jī)構(gòu),數(shù)量遠(yuǎn)遠(yuǎn)超過歐盟的21款和中國(guó)的15款。
5
目前嚴(yán)重缺乏對(duì)大語(yǔ)言模型負(fù)責(zé)任的可靠和標(biāo)準(zhǔn)化評(píng)估。人工智能指數(shù)的新研究表明,負(fù)責(zé)任的人工智能報(bào)道嚴(yán)重缺乏標(biāo)準(zhǔn)化。
6
生成式人工智能投資飆升。盡管去年人工智能私人投資總額有所下降,但對(duì)生成式人工智能的投資卻大幅增長(zhǎng),從2022年起增長(zhǎng)了近八倍,達(dá)到252億美元。生成式人工智能領(lǐng)域的主要參與者,包括OpenAI、Anthropic、HuggingFace和Inflection,均進(jìn)行了融資。
7
人工智能使工人更有效率,并帶來更高質(zhì)量的工作。2023年,多項(xiàng)研究評(píng)估了人工智能對(duì)勞動(dòng)力的影響,表明人工智能使工人能夠更快地完成任務(wù),并提高他們的產(chǎn)出質(zhì)量。
8
人工智能崛起推動(dòng)科學(xué)進(jìn)步的速度愈發(fā)迅猛。2022年,人工智能才被正式用于科學(xué)發(fā)現(xiàn)領(lǐng)域。然而,短短一年后,從優(yōu)化算法排序效率的AlphaDev到革新材料發(fā)現(xiàn)流程的GNoME,我們見證了更為重要的、科學(xué)相關(guān)人工智能應(yīng)用的問世。
9
美國(guó)的人工智能法規(guī)數(shù)量呈現(xiàn)出急劇增加的趨勢(shì)。在過去的一年和五年里,人工智能相關(guān)的法規(guī)數(shù)量顯著增加。到2023年,人工智能相關(guān)法規(guī)從2016年的一項(xiàng)增加到25項(xiàng)。僅去年一年,人工智能相關(guān)法規(guī)總數(shù)就增長(zhǎng)了56.3%。
10
在全球范圍內(nèi),公眾對(duì)人工智能的潛在影響有了更為深刻的認(rèn)識(shí),同時(shí)伴隨著日益增長(zhǎng)的緊張情緒。益普索(Ipsos)的最新調(diào)查揭示,過去一年中,認(rèn)為人工智能將在未來三到五年內(nèi)深刻改變其生活的受訪者比例從60%躍升至66%。
以下為《2024年人工智能指數(shù)報(bào)告》內(nèi)容按章節(jié)內(nèi)容概要:
第一章:研究與發(fā)展
1、產(chǎn)業(yè)繼續(xù)主導(dǎo)前沿人工智能研究。2023年,人工智能產(chǎn)業(yè)開發(fā)出51個(gè)著名的的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界僅貢獻(xiàn)了15個(gè)。2023年還有21個(gè)產(chǎn)學(xué)合作的著名模型,創(chuàng)下新高。
2、更多基礎(chǔ)模型和更多開源基礎(chǔ)模型。2023年共發(fā)布了149款基礎(chǔ)款,是2022年發(fā)布數(shù)量的兩倍多。在這些新發(fā)布的模型中,65.7%是開源模型,比例高于2022年的44.4%,以及2021年的33.3%。
3、前沿模型變得更加昂貴。根據(jù)《人工智能指數(shù)報(bào)告》估計(jì),最先進(jìn)人工智能模型的訓(xùn)練成本已達(dá)到了前所未有的水平。例如,OpenAI的GPT-4使用了價(jià)值約7800萬(wàn)美元的算力進(jìn)行訓(xùn)練,而谷歌的GeminiUltra花費(fèi)了1.91億美元的算力。
4、美國(guó)領(lǐng)先中國(guó)、歐盟和英國(guó),成為頂級(jí)人工智能模型的主要開發(fā)國(guó)家。2023年,61款著名人工智能模型來自美國(guó)機(jī)構(gòu),數(shù)量遠(yuǎn)遠(yuǎn)超過歐盟的21款和中國(guó)的15款。
5、人工智能專利數(shù)量激增。從2021年到2022年,全球人工智能專利授權(quán)量大幅增長(zhǎng)了62.7%。自2010年以來,獲得授權(quán)的人工智能專利數(shù)量增長(zhǎng)了31倍以上。
圖注:2010年至2022年,全球人工智能專利授權(quán)量大幅增長(zhǎng)了31倍以上。
6、中國(guó)在人工智能專利數(shù)量上處于遙遙領(lǐng)先的地位。2022年,中國(guó)以61.1%的比例領(lǐng)跑全球人工智能專利來源國(guó),大幅超過占比為20.9%的美國(guó)。自2010年以來,美國(guó)人工智能專利的份額從54.1%一直在持續(xù)下降。
圖注:中國(guó)在人工智能專利數(shù)量上處于遙遙領(lǐng)先的地位
7、開源人工智能研究爆炸式增長(zhǎng)。自2011年以來,軟件項(xiàng)目托管平臺(tái)GitHub上與人工智能相關(guān)的項(xiàng)目數(shù)量持續(xù)增長(zhǎng),從2011年的845個(gè)增長(zhǎng)到2023年的約180萬(wàn)個(gè)。值得注意的是,僅在2023年,GitHub人工智能項(xiàng)目的數(shù)量就大幅增長(zhǎng)了59.3%。2023年,GitHub上的人工智能項(xiàng)目獲得了更多的Stars(星標(biāo),主要用于衡量項(xiàng)目的受歡迎程度),數(shù)量從2022年的400萬(wàn)增加到1220萬(wàn),增加了兩倍多。
8、人工智能刊物的數(shù)量持續(xù)上升。2010年至2022年間,人工智能刊物的總數(shù)增加了近兩倍,從2010年的約8.8萬(wàn)份增加到2022年的超過24萬(wàn)份。去年的增幅約為1.1%。
第二章:技術(shù)表現(xiàn)
圖注:2023年發(fā)布的著名大模型列表。
1、人工智能在一些任務(wù)上擊敗了人類,但還無(wú)法在所有任務(wù)中擊敗人類。
人工智能在幾項(xiàng)基準(zhǔn)測(cè)試中超過了人類的表現(xiàn),包括圖像分類、視覺推理和英語(yǔ)理解等。不過人工智能在更復(fù)雜的任務(wù)中仍落后于人類,如競(jìng)賽級(jí)數(shù)學(xué)、視覺常識(shí)推理和規(guī)劃等。
2、多模態(tài)人工智能出現(xiàn)。
傳統(tǒng)上,人工智能系統(tǒng)的功能有限,語(yǔ)言模型在文本理解方面表現(xiàn)出色,但在圖像處理方面表現(xiàn)不佳,反之亦然。然而,最近的進(jìn)步帶動(dòng)了強(qiáng)大的多模態(tài)模型的發(fā)展,如谷歌的Gemini和OpenAI的GPT-4。這些模型顯示出強(qiáng)大的靈活性,能夠處理圖像和文本,在某些情況下甚至可以處理音頻。
3、更嚴(yán)格的基準(zhǔn)開始出現(xiàn)。在ImageNet、SQuAD和SuperGLUE等既定基準(zhǔn)上,人工智能模型已經(jīng)達(dá)到性能飽和,這促使研究人員開發(fā)更具挑戰(zhàn)性的基準(zhǔn)。2023年,出現(xiàn)了幾個(gè)具有挑戰(zhàn)性的新基準(zhǔn),包括用于編碼的SWE-bench,用于圖像生成的HEIM,用于一般推理的MMMU,用于道德推理的MoCa,用于基于智能體行為的AgentBench,以及用于幻覺的HaluEval。
圖注:近年來出現(xiàn)的更嚴(yán)格的基準(zhǔn)
4、更好的人工智能意味著更好的數(shù)據(jù),這意味著……甚至更好的人工智能。Segmentation和Skoltech等新人工智能模型正被用于為圖像分割和3D重建等任務(wù)生成專門的數(shù)據(jù)。數(shù)據(jù)對(duì)于人工智能技術(shù)改進(jìn)至關(guān)重要。使用人工智能來創(chuàng)建更多數(shù)據(jù)增強(qiáng)了當(dāng)前的能力,并為未來的算法改進(jìn)鋪平了道路,特別是在更困難的任務(wù)上。
5、人類評(píng)估開始了。隨著生成式模型產(chǎn)生高質(zhì)量的文本、圖像等,基準(zhǔn)測(cè)試已慢慢開始轉(zhuǎn)向納入ChatbotArena排行榜等人工評(píng)估,而不是ImageNet或SQuAD等計(jì)算機(jī)化排名。公眾對(duì)人工智能的情緒正成為追蹤人工智能進(jìn)展的一個(gè)越來越重要的考慮因素。
6、大型語(yǔ)言模型讓機(jī)器人變得更加靈活。語(yǔ)言建模與機(jī)器人技術(shù)的融合產(chǎn)生了更靈活的機(jī)器人系統(tǒng),如PaLM-E和RT-2。除了改進(jìn)的機(jī)器人功能外,這些模型還可以提問,這標(biāo)志著機(jī)器人朝著能夠與現(xiàn)實(shí)世界更有效互動(dòng)的方向邁出了重要一步。
7、對(duì)AI智能體的更多技術(shù)研究。創(chuàng)造能夠在特定環(huán)境中自主運(yùn)行的AI智能體一直是計(jì)算機(jī)科學(xué)家面臨的挑戰(zhàn)。不過新的研究表明,自動(dòng)的人工智能智能體的性能正在提高。當(dāng)前的智能體可以掌握像Minecraft這樣的復(fù)雜游戲,并有效地處理現(xiàn)實(shí)世界的任務(wù),如在線購(gòu)物等。
8、閉源大語(yǔ)言模型明顯優(yōu)于開源大語(yǔ)言模型。在10個(gè)精選的人工智能基準(zhǔn)測(cè)試中,閉源模型的表現(xiàn)優(yōu)于開源模型,平均性能優(yōu)勢(shì)為24.2%。閉源和開源模型的性能差異對(duì)人工智能政策辯論具有重要意義。
第三章:負(fù)責(zé)任的AI
1、目前嚴(yán)重缺乏對(duì)大語(yǔ)言模型負(fù)責(zé)任的可靠和標(biāo)準(zhǔn)化評(píng)估。人工智能指數(shù)的新研究表明,負(fù)責(zé)任的人工智能(ResponsibleAI)報(bào)道嚴(yán)重缺乏標(biāo)準(zhǔn)化。包括OpenAI、谷歌和Anthropic在內(nèi)的領(lǐng)先開發(fā)公司主要根據(jù)不同的負(fù)責(zé)任的人工智能基準(zhǔn)測(cè)試其模型。這種做法使得系統(tǒng)地比較頂級(jí)人工智能模型的風(fēng)險(xiǎn)和局限性的努力變得復(fù)雜。
2、政治“深度偽造”(Politicaldeepfakes)很容易產(chǎn)生,也很難發(fā)現(xiàn)。政治“深度偽造”已在影響全球各國(guó)的選舉。最近的研究表明,現(xiàn)有人工智能“深度偽造”方法的準(zhǔn)確性各不相同。此外,像CounterCloud這樣的新項(xiàng)目展示了人工智能如何輕松地創(chuàng)建和傳播虛假內(nèi)容。
3、研究人員在大語(yǔ)言模型中發(fā)現(xiàn)了更復(fù)雜的漏洞。此前,人工智能模型紅隊(duì)的大部分努力都集中在測(cè)試對(duì)人類直觀有意義的對(duì)抗性提示上。今年,研究人員發(fā)現(xiàn)了讓大語(yǔ)言模型表現(xiàn)出有害行為的不太明顯的策略,比如要求模型無(wú)限重復(fù)隨機(jī)單詞。
4、全球企業(yè)擔(dān)憂人工智能帶來的風(fēng)險(xiǎn)。一項(xiàng)關(guān)于負(fù)責(zé)任的人工智能的全球調(diào)查強(qiáng)調(diào),企業(yè)最關(guān)心的人工智能相關(guān)問題包括隱私、數(shù)據(jù)安全和可靠性。調(diào)查顯示,各大組織已開始采取措施來降低這些風(fēng)險(xiǎn)。然而在全球范圍內(nèi),大多數(shù)公司迄今為止只降低了一小部分此類風(fēng)險(xiǎn)。
5、大語(yǔ)言模型可以輸出受版權(quán)保護(hù)的內(nèi)容。多名研究人員表明,流行大語(yǔ)言模型的生成輸出可能包含受版權(quán)保護(hù)的內(nèi)容,如《紐約時(shí)報(bào)》的摘錄或電影中的場(chǎng)景。這種輸出是否構(gòu)成侵權(quán)正成為一個(gè)核心的法律問題。
6、人工智能開發(fā)人員在透明度方面得分較低,這對(duì)研究產(chǎn)生了影響。新引入的基礎(chǔ)模型透明度指數(shù)表明,人工智能開發(fā)人員缺乏透明度,特別是在披露訓(xùn)練數(shù)據(jù)和方法方面。這種開放性的缺乏阻礙了進(jìn)一步了解人工智能系統(tǒng)的魯棒性(指系統(tǒng)或算法在面對(duì)各種隨機(jī)噪聲、異常情況和攻擊等干擾時(shí)的抗干擾能力)和安全性的努力。
7、很難分析極端的人工智能風(fēng)險(xiǎn)。在過去的一年里,人工智能學(xué)者和從業(yè)者就關(guān)注算法歧視等即時(shí)模型風(fēng)險(xiǎn)與潛在的長(zhǎng)期生存威脅展開了一場(chǎng)激烈的辯論。很難區(qū)分哪些主張是有科學(xué)依據(jù)的,哪些主張應(yīng)該為決策提供依據(jù)。與現(xiàn)實(shí)威脅的理論性相比,已存在的短期風(fēng)險(xiǎn)加劇了這一困難。
8、人工智能突發(fā)事件的數(shù)量繼續(xù)上升。根據(jù)追蹤與濫用人工智能相關(guān)突發(fā)事件的人工智能突發(fā)事件數(shù)據(jù)庫(kù),2023年報(bào)告了123起突發(fā)事件,比2022年增加了32.3個(gè)百分點(diǎn)。自2013年以來,人工智能突發(fā)事件增長(zhǎng)了20多倍。一個(gè)值得注意的例子包括人工智能生成的女明星泰勒斯威夫特(TaylorSwift)的露骨性感照片,這些照片在網(wǎng)上被廣泛分享。
圖注:近年來人工智能突發(fā)事件的數(shù)量不斷攀升
9、ChatGPT帶有政治偏見。研究人員發(fā)現(xiàn),ChatGPT明顯偏向美國(guó)民主黨和英國(guó)工黨。這一發(fā)現(xiàn)引發(fā)了人們對(duì)該工具影響用戶政治觀點(diǎn)的可能性的擔(dān)憂,尤其是考慮到今年是全球大選年。
第四章:經(jīng)濟(jì)
1、生成式人工智能投資飆升。盡管去年人工智能私人投資總額有所下降,但對(duì)生成式人工智能的投資卻大幅增長(zhǎng),從2022年起增長(zhǎng)了近八倍,達(dá)到252億美元。生成式人工智能領(lǐng)域的主要參與者,包括OpenAI、Anthropic、HuggingFace和Inflection,均進(jìn)行了融資。
2、已處于領(lǐng)先地位的美國(guó)在人工智能私人投資方面走得更遠(yuǎn)。2023年,美國(guó)的人工智能投資達(dá)到672億美元,比第二大投資國(guó)中國(guó)高出近8.7倍。而中國(guó)和歐盟(包括英國(guó))的私人人工智能投資,分別下降了44.2%和14.1%,自2022年以來,美國(guó)在同一時(shí)期經(jīng)歷了22.1%的顯著增長(zhǎng)。
圖注:2013年至2023年全球企業(yè)在AI領(lǐng)域的投資情況對(duì)比圖
3、美國(guó)和全球的人工智能工作越來越少。2022年,人工智能相關(guān)職位占美國(guó)所有職位發(fā)布的2.0%,這一數(shù)字將在2023年降至1.6%。人工智能職位列表的下降歸因于領(lǐng)先人工智能公司發(fā)布的職位減少以及這些公司內(nèi)技術(shù)職位的比例下降。
圖注:2014年至2023年全球人工智能相關(guān)招聘職位占所有職位的百分比
4、人工智能降低了成本,增加了收入。麥肯錫的一項(xiàng)新調(diào)查顯示,42%的受訪組織報(bào)告部署人工智能技術(shù)降低了成本(包括生成式人工智能),59%的組織報(bào)告收入實(shí)現(xiàn)了增加。與前一年相比,報(bào)告成本下降的受訪者增加了10個(gè)百分點(diǎn),這表明人工智能正在推動(dòng)業(yè)務(wù)效率的大幅提高。
5、人工智能私人投資總額再次下降,而新資助的人工智能公司數(shù)量增加。全球私人人工智能投資連續(xù)第二年下降,不過跌幅低于2021年和2022年。新投資的人工智能公司數(shù)量飆升至1812家,比上一年增長(zhǎng)40.6%。
6、人工智能組織采用率上升。麥肯錫在2023年的一份報(bào)告顯示,目前有55%的組織在至少一個(gè)業(yè)務(wù)部門或職能部門使用人工智能(包括生成式人工智能),高于2022年的50%和2017年的20%。
7、中國(guó)主導(dǎo)工業(yè)機(jī)器人技術(shù)。自2013年超過日本成為工業(yè)機(jī)器人主要安裝國(guó)以來,中國(guó)與最接近的競(jìng)爭(zhēng)對(duì)手之間的差距顯著擴(kuò)大。2013年,中國(guó)的安裝量占全球總量的20.8%,到2022年這一比例將升至52.4%。
8、機(jī)器人安裝更加多樣化。2017年,協(xié)作機(jī)器人僅占所有新工業(yè)機(jī)器人安裝的2.8%,到2022年這一數(shù)字將攀升至9.9%。同樣,2022年除醫(yī)療機(jī)器人外,所有應(yīng)用類別的服務(wù)機(jī)器人安裝量都有所上升。這一趨勢(shì)表明,機(jī)器人安裝數(shù)量不僅整體增加,而且越來越重視部署機(jī)器人來扮演面向人類的角色。
9、人工智能使工人更有效率,并帶來更高質(zhì)量的工作。2023年,多項(xiàng)研究評(píng)估了人工智能對(duì)勞動(dòng)力的影響,表明人工智能使工人能夠更快地完成任務(wù),并提高他們的產(chǎn)出質(zhì)量。這些研究還證明了人工智能在彌合低技能和高技能工人之間的技能差距方面的潛力。盡管如此,其他研究警告說,在沒有適當(dāng)監(jiān)督的情況下使用人工智能可能會(huì)導(dǎo)致性能下降。
10、《財(cái)富》500強(qiáng)公司開始更多的談?wù)撊斯ぶ悄,尤其是生成式人工智能?/strong>2023年,《財(cái)富》500強(qiáng)公司在394次財(cái)報(bào)電話會(huì)議中提到了人工智能(占所有公司的80%),比2022年的266次提及有了顯著增加。自2018年以來,《財(cái)富》500強(qiáng)企業(yè)財(cái)報(bào)電話會(huì)議中提到人工智能的次數(shù)幾乎翻了一番。生成式人工智能是最常被提及的主題,在19.7%的所有財(cái)報(bào)電話會(huì)議中都曾出現(xiàn)過。
第五章:科學(xué)與醫(yī)學(xué)
1、人工智能崛起推動(dòng)科學(xué)進(jìn)步的速度愈發(fā)迅猛。2022年,人工智能才被正式用于科學(xué)發(fā)現(xiàn)領(lǐng)域。然而,短短一年后,從優(yōu)化算法排序效率的AlphaDev到革新材料發(fā)現(xiàn)流程的GNoME,我們見證了更為重要的、科學(xué)相關(guān)人工智能應(yīng)用的問世。
圖注:在優(yōu)化算法長(zhǎng)度時(shí),AlphaDev與人類基準(zhǔn)對(duì)比
2、人工智能幫助醫(yī)學(xué)取得重大進(jìn)步。2023年,我們見證了多個(gè)具有里程碑意義的醫(yī)療系統(tǒng)的推出,其中EVEscape系統(tǒng)顯著增強(qiáng)了大流行病的預(yù)測(cè)能力,而AlphaMissence則協(xié)助人工智能進(jìn)行突變分類。人工智能正日益成為推動(dòng)醫(yī)學(xué)進(jìn)步不可或缺的力量。
3、知識(shí)淵博的醫(yī)療人工智能已悄然到來。在過去幾年中,人工智能系統(tǒng)在MedQA基準(zhǔn)上的表現(xiàn)令人矚目,這是評(píng)估人工智能臨床知識(shí)的關(guān)鍵測(cè)試。2023年,GPT-4Medprompt模型在MedQA基準(zhǔn)上取得了高達(dá)90.2%的準(zhǔn)確率,比2022年的最高分提升了22.6%。自2019年該基準(zhǔn)推出以來,人工智能在MedQA上的性能幾乎實(shí)現(xiàn)了兩倍的提升。
圖注:四種人工智能模型在MultiMedQA子基準(zhǔn)測(cè)試中的性能表現(xiàn)
4、FDA批準(zhǔn)的人工智能相關(guān)醫(yī)療設(shè)備越來越多。2022年,F(xiàn)DA批準(zhǔn)了139種與人工智能相關(guān)的醫(yī)療設(shè)備,相較于2021年增長(zhǎng)了12.1%。更為引人注目的是,自2012年以來,F(xiàn)DA批準(zhǔn)的人工智能相關(guān)醫(yī)療器械數(shù)量已經(jīng)增長(zhǎng)了45倍以上。人工智能越來越多地被用于現(xiàn)實(shí)世界的醫(yī)療目的。
第六章:教育
1、在美國(guó)和加拿大,計(jì)算機(jī)科學(xué)學(xué)士學(xué)位畢業(yè)生的數(shù)量正穩(wěn)步攀升,而計(jì)算機(jī)科學(xué)碩士學(xué)位畢業(yè)生則保持著相對(duì)穩(wěn)定的態(tài)勢(shì),博士學(xué)位畢業(yè)生數(shù)量略有增長(zhǎng)。盡管過去的十多年里,美國(guó)和加拿大計(jì)算機(jī)科學(xué)本科畢業(yè)生人數(shù)不斷攀升,但選擇繼續(xù)深造的研究生數(shù)量卻呈現(xiàn)出停滯的趨勢(shì)。自2018年以來,計(jì)算機(jī)科學(xué)碩士和博士畢業(yè)生的人數(shù)均出現(xiàn)了輕微下滑。
2、人工智能博士向產(chǎn)業(yè)界流動(dòng)的趨勢(shì)仍在加速。2011年,人工智能博士在產(chǎn)業(yè)界(40.9%)和學(xué)術(shù)界(41.6%)的就業(yè)比例大致持平。然而,到2022年,這一比例發(fā)生了顯著變化,畢業(yè)后進(jìn)入產(chǎn)業(yè)界的人工智能博士比例高達(dá)70.7%,遠(yuǎn)高于進(jìn)入學(xué)術(shù)界的20.0%。僅在過去一年,流向產(chǎn)業(yè)界的人工智能博士所占比例就上升了5.3個(gè)百分點(diǎn),這表明人才從大學(xué)流向產(chǎn)業(yè)界的趨勢(shì)正在加劇。
圖注:在2010年到2022年間,美國(guó)和加拿大AI博士畢業(yè)生就業(yè)趨勢(shì)
3、學(xué)術(shù)人才從產(chǎn)業(yè)界向?qū)W術(shù)界的轉(zhuǎn)移較少。2019年,美國(guó)和加拿大新入職的人工智能教師中,有13%來自產(chǎn)業(yè)界。然而,到了2021年,這一比例降至11%,至2022年更是進(jìn)一步下滑至7%。這一趨勢(shì)表明,高水平人工智能人才從產(chǎn)業(yè)界向?qū)W術(shù)界的遷移正在逐漸減少。
4、美國(guó)和加拿大的計(jì)算機(jī)科學(xué)教育正逐漸變得不那么國(guó)際化。2022年畢業(yè)的國(guó)際計(jì)算機(jī)科學(xué)學(xué)士、碩士和博士比例均低于2021年。其中,碩士課程中國(guó)際學(xué)生數(shù)量的減少尤為明顯。
5、越來越多的美國(guó)高中生學(xué)習(xí)計(jì)算機(jī)科學(xué)課程,但獲取信息的問題依然存在。在2022年,美國(guó)有20.1萬(wàn)人次參加了APCS考試。自2007年以來,參加這些考試的學(xué)生人數(shù)增加了十多倍。然而,最近的證據(jù)表明,在較大的高中和郊區(qū)的學(xué)生在獲得計(jì)算機(jī)科學(xué)課程方面更具優(yōu)勢(shì)。
圖注:美國(guó)要求所有高中提供計(jì)算機(jī)科學(xué)基礎(chǔ)課程的州
6、在國(guó)際范圍內(nèi),與人工智能相關(guān)的學(xué)位課程呈現(xiàn)出明顯的上升趨勢(shì)。自2017年以來,與人工智能相關(guān)的英語(yǔ)高等教育學(xué)位課程的數(shù)量增加了兩倍,而且在過去五年中始終保持穩(wěn)步增長(zhǎng)。同時(shí),世界各地的大學(xué)都在提供更多以人工智能為重點(diǎn)的學(xué)位課程。
圖注:教育領(lǐng)域用戶對(duì)ChatGPT的看法
7、英國(guó)和德國(guó)在歐洲信息學(xué)、計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程和信息技術(shù)研究生培養(yǎng)方面處于領(lǐng)先地位。同時(shí),這兩國(guó)在培養(yǎng)新的信息學(xué)、計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程和信息學(xué)士、碩士以及博士畢業(yè)生方面領(lǐng)先于歐洲。在人均基礎(chǔ)上,芬蘭在學(xué)士和博士畢業(yè)生的培養(yǎng)方面領(lǐng)先,而愛爾蘭在碩士畢業(yè)生培養(yǎng)方面領(lǐng)先。
第七章:政策與治理
1、美國(guó)的人工智能法規(guī)數(shù)量呈現(xiàn)出急劇增加的趨勢(shì)。在過去的一年和五年里,人工智能相關(guān)的法規(guī)數(shù)量顯著增加。到2023年,人工智能相關(guān)法規(guī)從2016年的一項(xiàng)增加到25項(xiàng)。僅去年一年,人工智能相關(guān)法規(guī)總數(shù)就增長(zhǎng)了56.3%。
2、美國(guó)和歐盟推進(jìn)具有里程碑意義的人工智能政策行動(dòng)。2023年,大西洋兩岸的政策制定者提出了推進(jìn)人工智能監(jiān)管的實(shí)質(zhì)性建議。歐盟就《人工智能法案》的條款達(dá)成了協(xié)議,這是2024年頒布的一項(xiàng)具有里程碑意義的立法。與此同時(shí),美國(guó)總統(tǒng)拜登簽署了一項(xiàng)關(guān)于人工智能的行政命令,這是美國(guó)最引人注目的人工智能政策舉措。
3、人工智能引起了美國(guó)決策者的注意。2023年,美國(guó)聯(lián)邦一級(jí)的人工智能相關(guān)立法顯著增加,立法者提出了181項(xiàng)提案,比2022年的88項(xiàng)增加了一倍多。
4、全球范圍內(nèi),政策制定者們對(duì)于人工智能的討論也愈發(fā)熱烈。在全球立法程序中提到人工智能的次數(shù)幾乎翻了一番,從2022年的1247次增加到2023年的2175次。2023年,人工智能在49個(gè)國(guó)家和地區(qū)的立法程序中被提及,每個(gè)大洲至少有一個(gè)國(guó)家在這一年討論了人工智能相關(guān)的政策議題。這凸顯了人工智能政策話題在全球的真正影響力。
5、越來越多的監(jiān)管機(jī)構(gòu)將注意力轉(zhuǎn)向人工智能。發(fā)布人工智能法規(guī)的美國(guó)監(jiān)管機(jī)構(gòu)從2022年的17個(gè)增加到2023年的21個(gè),這一增長(zhǎng)表明美國(guó)監(jiān)管機(jī)構(gòu)對(duì)于人工智能監(jiān)管的擔(dān)憂日益增加。在2023年,一些新的監(jiān)管機(jī)構(gòu)如交通部、能源部和職業(yè)安全與健康管理局也首次頒布了人工智能相關(guān)的法規(guī)。
第八章:多樣性
1、美國(guó)和加拿大的計(jì)算機(jī)科學(xué)學(xué)士、碩士和博士生的種族越來越多樣化。在所有三個(gè)教育層次的新畢業(yè)生中,盡管白人學(xué)生仍占據(jù)主要地位,但其他種族學(xué)生的比例正在穩(wěn)步上升,亞裔、西班牙裔、黑人或非裔美國(guó)人等群體的比例繼續(xù)增長(zhǎng)。例如,自2011年以來,亞裔計(jì)算機(jī)科學(xué)學(xué)士學(xué)位畢業(yè)生的比例增加了19.8個(gè)百分點(diǎn),西班牙裔學(xué)士學(xué)位畢業(yè)生的比例增加了5.2個(gè)百分點(diǎn)。
2、在所有教育水平的歐洲信息學(xué)、計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程和信息技術(shù)畢業(yè)生中,性別差距仍然顯著。每個(gè)接受調(diào)查的歐洲國(guó)家都報(bào)告說,在信息學(xué)、計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程和信息技術(shù)領(lǐng)域的學(xué)士、碩士和博士課程中,男性畢業(yè)生多于女性。雖然過去十年來大多數(shù)國(guó)家的性別差距有所縮小,但縮小的速度相對(duì)很慢。
圖注:2011年到2022年美國(guó)和加拿大計(jì)算機(jī)科學(xué)、計(jì)算機(jī)科學(xué)和信息學(xué)院學(xué)生性別(占總數(shù)的百分比)
3、美國(guó)K-12計(jì)算機(jī)科學(xué)教育正變得越來越多樣化,反映了性別和種族代表性方面的積極變化。女學(xué)生參加APCS考試的比例從2007年的16.8%上升到2022年的30.5%。同樣,亞裔、西班牙裔、拉丁裔以及非裔美國(guó)學(xué)生參加APCS考試的人數(shù)也在逐年增加。
第九章:公眾輿論
1、在全球范圍內(nèi),公眾對(duì)人工智能的潛在影響有了更為深刻的認(rèn)識(shí),同時(shí)伴隨著日益增長(zhǎng)的緊張情緒。益普索的最新調(diào)查揭示,過去一年中,認(rèn)為人工智能將在未來三到五年內(nèi)深刻改變其生活的受訪者比例從60%躍升至66%。此外,對(duì)人工智能產(chǎn)品和服務(wù)感到緊張的公眾比例也顯著上升,達(dá)到52%,較2022年增加了13個(gè)百分點(diǎn)。而在美國(guó),皮尤研究中心的報(bào)告顯示,52%的美國(guó)人對(duì)人工智能的擔(dān)憂遠(yuǎn)超過對(duì)其的期待,這一比例相較于2022年的38%有了顯著增長(zhǎng)。
圖注:2023年全球?qū)θ斯ぶ悄軐?duì)當(dāng)前工作影響的態(tài)度
2、西方國(guó)家對(duì)人工智能的看法仍然相對(duì)保守,但近年來有所改善。2022年,包括德國(guó)、荷蘭、澳大利亞、比利時(shí)、加拿大和美國(guó)在內(nèi)的幾個(gè)西方發(fā)達(dá)國(guó)家對(duì)人工智能產(chǎn)品和服務(wù)的態(tài)度普遍較為悲觀。然而,隨著時(shí)間的推移,這些國(guó)家中開始認(rèn)識(shí)到人工智能益處的受訪者比例均有所攀升,其中荷蘭的轉(zhuǎn)變最為顯著。
3、公眾對(duì)于人工智能的經(jīng)濟(jì)影響普遍持悲觀態(tài)度。益普索的調(diào)查數(shù)據(jù)顯示,僅有37%的受訪者認(rèn)為人工智能能夠改善他們的工作狀況。同時(shí),對(duì)于人工智能能否促進(jìn)經(jīng)濟(jì)發(fā)展和改善就業(yè)市場(chǎng),公眾的樂觀程度也相對(duì)較低,分別僅有34%和32%的受訪者持肯定態(tài)度。
圖注:在2021年到2023年,美國(guó)人對(duì)日常生活中增加使用人工智能的感受變化情況
4、在對(duì)人工智能的樂觀態(tài)度上,不同人群之間存在顯著差異。特別是在對(duì)人工智能改善生計(jì)潛力的看法上,年輕一代展現(xiàn)出了更為樂觀的態(tài)度。例如,高達(dá)59%的Z世代受訪者認(rèn)為人工智能將改善娛樂選擇,而嬰兒潮一代中持此觀點(diǎn)的僅占40%。此外,高收入、高教育水平的群體也更傾向于看到人工智能在娛樂、健康和經(jīng)濟(jì)等方面的積極影響。
5、ChatGPT已經(jīng)廣為人知并被廣泛使用。多倫多大學(xué)的一項(xiàng)國(guó)際調(diào)查顯示,63%的受訪者知道ChatGPT的存在。在這些人中,大約一半的人每周至少使用一次ChatGPT。
(編譯/無(wú)忌、金鹿)