10月30日,在“AI紫竹 數(shù)智賦能”2024發(fā)展論壇上,北京人工智能研究院院長王仲遠發(fā)表主題演講,介紹了智源研究院在人工智能大模型領域的最新進展,并探討了未來AI技術的應用前景。
王仲遠指出,當前人工智能正處在第三次浪潮的新拐點上,從以往的“弱人工智能”向具備通用性和泛化性的“強人工智能”邁進。2023年之后,大模型的興起標志著人工智能逐步向通用人工智能方向發(fā)展。他提到,每一輪人工智能浪潮都依賴于模型參數(shù)、訓練數(shù)據(jù)量和計算能力的大幅提升,如今大模型的參數(shù)量正在逐漸縮小與人類大腦神經元數(shù)量規(guī)模的差距,為人工智能達到類人智能水平提供了可能性。
關于智源研究院的研究成果,王仲遠表示,智源研究院是國內最早投入大模型研發(fā)的機構之一。自2020年起,智源研究院便組建了百人規(guī)模的高水平人才隊伍,專注于大模型的技術攻關,2021年發(fā)布了悟道系列2.0大模型,參數(shù)規(guī)模達1.75萬億,達到了全球領先水平。隨著大模型技術的應用普及,智源研究院的技術和人才也孵化出多個國內領先的大模型企業(yè)。
王仲遠表示,未來的人工智能應用將超越文本數(shù)據(jù),進入多模態(tài)領域。目前的多模態(tài)模型,如文生圖的Stable Diffusion、視頻生成的Sora,以及實時對音頻、視覺和文本進行推理的GPT-4o,雖然應用廣泛,但因技術架構分裂,發(fā)展受限。他認為,AI技術的最終形態(tài)將是統(tǒng)一的多模態(tài)模型,這一模型不僅能理解、生成不同模態(tài)的內容,還能進行跨模態(tài)推理。智源研究院近期發(fā)布了全球首個原生多模態(tài)世界模型Emu3,在圖像、視頻的理解和生成能力上表現(xiàn)亮眼,贏得了國際同行的高度評價。
王仲遠還談到人工智能的未來應用,指出隨著多模態(tài)大模型的成熟,人工智能將進入物理世界,促進“具身智能”技術方向的發(fā)展。在生物計算方面,智源研究院已將生成式AI應用于生命分子的建模,用于蛋白質結構預測和藥物研發(fā)。智源研究院連續(xù)30個月在全球蛋白質結構預測競賽中排名第一。
在支撐AI發(fā)展方面,王仲遠強調了高質量數(shù)據(jù)和開源技術的重要性。智源研究院在國家發(fā)改委和中央網(wǎng)信辦的指導下,牽頭建設北京市人工智能數(shù)據(jù)運營平臺,匯集了100多個數(shù)據(jù)集,數(shù)據(jù)規(guī)模達180TB,為AI研究提供強大支撐。同時,智源研究院已開源超過70個模型,總下載量超5億次,是國內AI開源下載量最多的科研機構。
此外,智源研究院還在大模型評測領域取得突破。在今年5月的評測中,智源研究院對140個大模型進行了測試,涵蓋語、數(shù)、英、物、化、史等多學科。王仲遠指出,盡管全球頂尖大模型成績優(yōu)異,但依然不及海淀區(qū)考生平均水平,顯示出AI的巨大提升空間。
作為推動AI技術發(fā)展的重要機構,智源研究院自成立以來已建立起廣泛的國際學術合作網(wǎng)絡。每年舉辦的智源大會成為全球AI領域的標志性活動,吸引了30多個國家和地區(qū)的學者參與。今年3月的北京首屆AI國際對話,更是吸引了3位圖靈獎得主,共同簽署了“北京AI安全國際共識”,進一步推動了AI技術的安全發(fā)展。
王仲遠最后表示,智源研究院將繼續(xù)專注于前沿技術突破,推動大模型在多模態(tài)和具身智能領域的進展,并不斷解決產業(yè)中的技術痛點,賦能各行各業(yè)。智源研究院的目標是引領人工智能技術的發(fā)展方向,為構建通用智能和社會進步做出貢獻。
李仕靜/文