2023年,英偉達(dá)科學(xué)家團(tuán)隊(duì)將GPT-4接入Minecraft(「我的世界」)游戲,提出了全新的AI智能體Voyager。隨著GPT-4不停歇地探索世界,Voyager逐漸掌握了挖掘、蓋房、打獵等生存技能,同時(shí)擴(kuò)充自身物品和裝備,并在沒(méi)有人為干預(yù)的情況下持續(xù)獲得新發(fā)現(xiàn)。例如,如果發(fā)現(xiàn)自己是處于沙漠而非森林中的環(huán)境,智能體就會(huì)知道學(xué)會(huì)收集沙子和仙人掌,比學(xué)會(huì)收集鐵礦更重要。
“由此展開(kāi),我們希望有個(gè)AI,通過(guò)給他設(shè)置改良、優(yōu)化城市的任務(wù),它便會(huì)根據(jù)當(dāng)前的技術(shù)水平和城市狀態(tài)提出適當(dāng)?shù)娜蝿?wù),相當(dāng)于做城市體檢和城市規(guī)劃。”騰訊研究院資深專(zhuān)家、教授級(jí)高級(jí)城市規(guī)劃師王鵬如是暢想AI在城市甚至是人居環(huán)境的應(yīng)用場(chǎng)景。
王鵬認(rèn)為,“城市大模型”需要基于環(huán)境反饋來(lái)完善策略,將掌握的策略與反饋記入記憶,并在類(lèi)似情況下重復(fù)使用,相當(dāng)于落地實(shí)施,還需要在實(shí)施過(guò)程中不斷深化對(duì)城市的認(rèn)知,動(dòng)態(tài)地修正規(guī)劃和策略;因?yàn)槌鞘械母牧,沒(méi)有最好,只有更好,所以它需要持續(xù)探索城市以自我驅(qū)動(dòng)的方式尋找新的任務(wù)。
在騰訊研究院發(fā)布的《生成式AI人居領(lǐng)域應(yīng)用趨勢(shì)調(diào)研報(bào)告》中,有資深城市規(guī)劃專(zhuān)家認(rèn)為,在AI發(fā)展的早期階段,基于規(guī)則的定量建模和專(zhuān)家系統(tǒng),對(duì)城市規(guī)劃起著關(guān)鍵的作用。雖然深度學(xué)習(xí)的出現(xiàn)帶來(lái)新的可能,但它仍然與這些傳統(tǒng)方法緊密相連。然而,并非所有任務(wù)都需要大型模型,對(duì)于特定領(lǐng)域而言,小型模型與本地知識(shí)庫(kù)的結(jié)合可能更有效。AI在城市應(yīng)用的目標(biāo),是提供針對(duì)各種場(chǎng)景的適當(dāng)解決方案,并繼續(xù)探索如何有效地結(jié)合各種工具和技術(shù),以實(shí)現(xiàn)高效、經(jīng)濟(jì)的智能服務(wù)。
有沒(méi)有可能建立一個(gè)城市大模型?城市大模型能做些什么?技術(shù)驅(qū)動(dòng)將為城市治理帶來(lái)什么變化?又將可能產(chǎn)生什么問(wèn)題?基于以上問(wèn)題,36氪與王鵬進(jìn)行一場(chǎng)深入討論。
城市大模型挑戰(zhàn):超越文本數(shù)據(jù)的復(fù)雜處理需求
2023年,隨著通用大模型的快速發(fā)展,全世界看到了AI技術(shù)在城市治理中的潛力。王鵬認(rèn)為,盡管現(xiàn)有的通用大模型在特定行業(yè)中應(yīng)用仍有限,但它們?cè)谔幚韽?fù)雜系統(tǒng)問(wèn)題上展現(xiàn)出了前所未有的能力。
因此,考慮發(fā)展更專(zhuān)業(yè)的行業(yè)大模型,如城市大模型,以支持更精細(xì)的城市管理和規(guī)劃決策。這種模型可以幫助解決城市的各種問(wèn)題,提升治理效率,再通過(guò)高質(zhì)量數(shù)據(jù)和精調(diào),實(shí)現(xiàn)真正的智能城市管理。
從具體研發(fā)角度看,截至目前,除了如生物基因蛋白質(zhì)分子結(jié)構(gòu)、時(shí)序時(shí)空這些特殊模態(tài)的大模型外,從零構(gòu)建行業(yè)大模型沒(méi)有必要,主要挑戰(zhàn)在于算力成本。
官方數(shù)據(jù)指出,GPT-3數(shù)據(jù)集的體量為753GB,LLaMA4的為828.2GB。以1000GB的數(shù)據(jù)模型為例,這相當(dāng)于需要處理超過(guò)500億份城市總規(guī)說(shuō)明書(shū)規(guī)模的文本數(shù)據(jù),每一份說(shuō)明書(shū)的字?jǐn)?shù)大概是十萬(wàn)字。這一巨大的數(shù)據(jù)量,側(cè)面反映了行業(yè)大模型構(gòu)建時(shí)所面臨的高算力成本和技術(shù)門(mén)檻。
在城市領(lǐng)域,一些關(guān)鍵的行業(yè)知識(shí),如規(guī)劃文本、政策文件、和法規(guī)規(guī)范是難以完全通過(guò)文字表達(dá)的,這些知識(shí)的復(fù)雜性超出了簡(jiǎn)單文字的范圍。此外,城市領(lǐng)域還涉及需要通過(guò)圖紙等多模態(tài)數(shù)據(jù)處理的內(nèi)容,這類(lèi)信息更是無(wú)法簡(jiǎn)單地轉(zhuǎn)化為可直接計(jì)算的格式。因此,建立城市大模型需要處理的不僅僅是文字?jǐn)?shù)據(jù),還要涵蓋多種格式和類(lèi)型的復(fù)雜信息。
在訓(xùn)練方面,達(dá)到所謂的“智能涌現(xiàn)”,仍然是一個(gè)未知數(shù)。一般而言,GPT3.5、文心一言、通義千問(wèn)、GLM達(dá)到“智能涌現(xiàn)”,背后支撐的參數(shù)規(guī)模為千億以上。這種智能涌現(xiàn)是處理復(fù)雜城市系統(tǒng)時(shí),極為重要的能力。
然而,大多數(shù)行業(yè)大模型的參數(shù)規(guī)模通常只有百億級(jí)別,為了保證調(diào)優(yōu)的效果、效率和性?xún)r(jià)比,這樣的規(guī)模是必要的。因此,這些模型雖然名為“大模型”,但在真正的智能表現(xiàn)上,可能只能達(dá)到形似而非神似,難以滿(mǎn)足通用人工智能的高級(jí)預(yù)期。
截至目前,出于經(jīng)濟(jì)性的考慮,使用LLM模型應(yīng)用,仍難以構(gòu)建商業(yè)閉環(huán),除了需求方對(duì)技術(shù)的理解參差不齊,成本也是一個(gè)無(wú)法繞過(guò)的難題。在一落地的城市相關(guān)大模型項(xiàng)目中,僅30MB的文本數(shù)據(jù),在百億參數(shù)模型上訓(xùn)練一次的成本就接近萬(wàn)元,且訓(xùn)練效果不可預(yù)知,但該成本在未來(lái)下降的可能性較大。
相比研發(fā)出一個(gè)行業(yè)通用大模型,基于基礎(chǔ)大模型的能力,進(jìn)行應(yīng)用開(kāi)發(fā),將成為行業(yè)大模型的“主流形態(tài)”。
不同于以往的通用大模型,城市大模型通過(guò)精準(zhǔn)的行業(yè)數(shù)據(jù)訓(xùn)練,致力于解決復(fù)雜的城市問(wèn)題,如公共服務(wù)優(yōu)化、城市規(guī)劃和治理效能提升。這個(gè)應(yīng)用,關(guān)注的不是模型本身,而是具體要完成的任務(wù),實(shí)現(xiàn)技術(shù)與城市需求的高度融合。
應(yīng)用場(chǎng)景:輔助決策、敏捷治理、政務(wù)服務(wù)
王鵬認(rèn)為,相比于專(zhuān)業(yè)人士對(duì)于“大模型”的認(rèn)知,如何統(tǒng)一各方參與者對(duì)于“城市”的認(rèn)知,是更難的事。他認(rèn)為,無(wú)論是面對(duì)信息技術(shù)廠(chǎng)商、人工智能技術(shù)專(zhuān)家,甚至是面對(duì)城市政府,這些角色腦子里的“城市”,都不是規(guī)劃師腦子里的“城市”。
如果以商業(yè)閉環(huán)的邏輯開(kāi)發(fā)城市大模型,較為合理地是應(yīng)用于公共服務(wù)與公共管理領(lǐng)域,其背后資助方是地方政府。王鵬坦言:“雖然大模型技術(shù)好像很高大上,但相比之下,現(xiàn)有應(yīng)用一點(diǎn)都不科幻,請(qǐng)做好心理準(zhǔn)備,現(xiàn)實(shí)就是骨感的。”
截至目前,城市大模型的應(yīng)用場(chǎng)景有幾類(lèi),包括輔助決策、敏捷治理、政務(wù)服務(wù)等。
在輔助決策方面,大模型可以通過(guò)提供數(shù)據(jù)分析、案例對(duì)比等方式,幫助決策者進(jìn)行更全面和迅速的決策。例如,通過(guò)整合城市數(shù)據(jù)庫(kù),大模型可以實(shí)時(shí)回答領(lǐng)導(dǎo)的各種查詢(xún),增強(qiáng)決策的信息支持。
近年來(lái),城市大腦、產(chǎn)業(yè)大腦等信息化項(xiàng)目,在一定程度上完成了一些城市數(shù)據(jù)的匯聚。因此,目前最易落地的應(yīng)用場(chǎng)景,就是整理匯聚數(shù)據(jù)庫(kù),用大模型能力進(jìn)行基于語(yǔ)義交互的、靈活生成的數(shù)據(jù)分析,可以實(shí)現(xiàn)領(lǐng)導(dǎo)隨心問(wèn),大模型即時(shí)答。一定程度上是對(duì)上一代“領(lǐng)導(dǎo)駕駛艙”的升級(jí)。
王鵬表示:“AI負(fù)責(zé)全面正確,人類(lèi)負(fù)責(zé)作出艱難的選擇,是決策過(guò)程中AI與人類(lèi)分工的理想界面。”
敏捷治理方面,是利用大模型快速響應(yīng)公眾需求,改進(jìn)傳統(tǒng)的政府運(yùn)作模式。這包括快速識(shí)別市民問(wèn)題,自動(dòng)化處理反饋,以及優(yōu)化政策執(zhí)行過(guò)程。
類(lèi)似紐約市政熱線(xiàn)311、北京市民服務(wù)熱線(xiàn)12345從源頭上快速回應(yīng)需求,對(duì)于這些問(wèn)題與訴求的廣泛采集與快速回應(yīng),大模型技術(shù)可以很好地提供支持,包括對(duì)問(wèn)題訴求的快速識(shí)別、總結(jié)提煉、派單分發(fā)、基于過(guò)往案例經(jīng)驗(yàn)、法規(guī)條例的處置建議。該功能同樣需要一定知識(shí)輸入,也可能涉及多模態(tài)大模型。
政務(wù)服務(wù)方面,大模型通過(guò)智能問(wèn)答系統(tǒng),提供政策咨詢(xún)和辦事指南。相比于輔助決策、敏捷治理,政府服務(wù)可以理解為G to C服務(wù)的屬性,大眾更容易感知。各級(jí)政府、各相關(guān)部門(mén)及事業(yè)單位,根據(jù)法律法規(guī),為社會(huì)團(tuán)體、企事業(yè)單位和個(gè)人提供的許可、確認(rèn)、裁決、獎(jiǎng)勵(lì)、處罰等行政服務(wù)。政務(wù)服務(wù)線(xiàn)上平臺(tái),通過(guò)打通不同部門(mén)的信息系統(tǒng),打通線(xiàn)上線(xiàn)下服務(wù),減少煩瑣的手續(xù)和流程,讓群眾、企業(yè)更快速地辦理各種事務(wù),提高行政服務(wù)效率。
以上各場(chǎng)景均顯示了大模型在城市管理中的潛力,但同時(shí)也需要大量的數(shù)據(jù)輸入、高水平的技術(shù)支持和持續(xù)的優(yōu)化才能實(shí)現(xiàn)最佳效果。
城市大模型的構(gòu)建和應(yīng)用,雖然面臨諸多挑戰(zhàn),如數(shù)據(jù)整合、模型訓(xùn)練的高成本和技術(shù)門(mén)檻,但其潛在的優(yōu)勢(shì)和長(zhǎng)遠(yuǎn)的應(yīng)用前景是顯而易見(jiàn)的。在未來(lái),這些模型不僅可能在單一城市中發(fā)揮作用,更有可能在全球范圍內(nèi)被復(fù)制和推廣,成為城市發(fā)展和管理的新常態(tài)。
通過(guò)深化行業(yè)知識(shí)的應(yīng)用和技術(shù)的不斷優(yōu)化,城市大模型預(yù)計(jì)將引領(lǐng)一個(gè)更加智能和高效的城市治理新時(shí)代。
當(dāng)然,相對(duì)于建立完整城市大模型的長(zhǎng)遠(yuǎn)目標(biāo),生成式 AI近期在人居領(lǐng)域已經(jīng)有很多的應(yīng)用。《生成式AI人居領(lǐng)域應(yīng)用趨勢(shì)調(diào)研報(bào)告》中就涉及了關(guān)于規(guī)劃、建設(shè)、運(yùn)營(yíng)等環(huán)節(jié)的多個(gè)應(yīng)用。
在騰訊正在建設(shè)的前?偛浚蛟煲粋(gè)“人、機(jī)、環(huán)境全面友好的未來(lái)城市原型,這里將集聚一系列數(shù)字科技領(lǐng)域的創(chuàng)新實(shí)驗(yàn)室群及相關(guān)設(shè)施,包括以機(jī)器人、人工智能、音視頻、未來(lái)網(wǎng)絡(luò)、未來(lái)出行、碳中和等為主題的多座建筑,為企業(yè)的科學(xué)家和工程師提供集辦公、研發(fā)、測(cè)試、發(fā)布、交流為一體的創(chuàng)新空間。同時(shí)也發(fā)起了未來(lái)城市AI創(chuàng)意設(shè)計(jì)大賽,面向公眾征集更富想象力的設(shè)計(jì)。用生成式 AI,幫助所有普通人表達(dá)對(duì)未來(lái)的想象。
36氪作者 | 宋虹姍