封面新聞?dòng)浾邉€∩?br/>
“嗒嗒嗒、嗒嗒嗒……”11月18日,在一片寬敞明亮的辦公區(qū)內(nèi),隨著鍵盤的敲擊聲,幾十名騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地的數(shù)據(jù)標(biāo)注員,正聚精會(huì)神地在做同一件事:運(yùn)用數(shù)據(jù)標(biāo)注平臺(tái),對(duì)采集自全國(guó)的道路圖片進(jìn)行數(shù)據(jù)標(biāo)注,給人工智能大模型投喂數(shù)據(jù)。
自貢基地,是騰訊云、自貢市政府、百嘉數(shù)字三方聯(lián)合打造的一個(gè)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地。近年來(lái),騰訊、百度、抖音等人工智能頭部企業(yè),相繼落戶自貢大安,打造人工智能產(chǎn)業(yè),開(kāi)展產(chǎn)業(yè)人才培育,進(jìn)行企業(yè)孵化。
預(yù)計(jì)到2027年,自貢將打造超200個(gè)人工智能行業(yè)應(yīng)用場(chǎng)景,建成創(chuàng)新平臺(tái)50個(gè),培養(yǎng)專業(yè)人才1萬(wàn)人,規(guī)上企業(yè)達(dá)到150戶,高企達(dá)到30戶。
“吞下”超2萬(wàn)億次數(shù)據(jù)
人工智能大模型每天的學(xué)習(xí)量驚人
在大安區(qū)的騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地,這里有一間很“神秘”的封閉式房間:?jiǎn)T工進(jìn)入須實(shí)名登記、嚴(yán)禁攜帶電子產(chǎn)品,每人一臺(tái)電腦,大家的工作就是對(duì)著電腦輸入各種指令。
騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地內(nèi),通過(guò)3D建模進(jìn)行數(shù)據(jù)可視化呈現(xiàn)
他們?cè)诟墒裁?這個(gè)“神秘”的工作場(chǎng)景,是數(shù)據(jù)整理及數(shù)據(jù)標(biāo)注的工作日常,為模型訓(xùn)練提供充足的數(shù)據(jù)支撐。“模型訓(xùn)練分兩個(gè)步驟,第一個(gè)步驟是預(yù)訓(xùn)練,在預(yù)訓(xùn)練階段,大模型使用大規(guī)模的無(wú)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)!
基地負(fù)責(zé)人、四川百嘉數(shù)字科技有限公司副總經(jīng)理譚建介紹,這一階段,通過(guò)不斷地調(diào)整模型參數(shù),使模型能夠捕捉到文本中的統(tǒng)計(jì)規(guī)律和語(yǔ)義信息。目標(biāo)是讓模型具備強(qiáng)大的語(yǔ)言表示能力,為后續(xù)的任務(wù)提供基礎(chǔ)。
他說(shuō),第二步驟是微調(diào),在預(yù)訓(xùn)練完成后,大模型會(huì)根據(jù)特定的業(yè)務(wù)需求進(jìn)行微調(diào)。微調(diào)階段使用有標(biāo)注的數(shù)據(jù)對(duì)模型進(jìn)行進(jìn)一步訓(xùn)練,使模型在特定任務(wù)上的表現(xiàn)更加精準(zhǔn)。例如,在智能客服系統(tǒng)中,可以針對(duì)常見(jiàn)問(wèn)題進(jìn)行微調(diào),提高模型的回答準(zhǔn)確率。
據(jù)了解,騰訊公司的大模型叫“混元大模型”,是騰訊自主研發(fā)的大語(yǔ)言模型,具有強(qiáng)大的中文創(chuàng)作能力、復(fù)雜語(yǔ)境下的邏輯推理能力以及可靠的任務(wù)執(zhí)行能力,在技術(shù)架構(gòu)上,采用基于Transformer的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),支持多輪對(duì)話、長(zhǎng)文記憶,文生文,文生圖,圖生視頻等。
騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地的數(shù)據(jù)標(biāo)注員正對(duì)道路采集圖片進(jìn)行數(shù)據(jù)標(biāo)注
在訓(xùn)練數(shù)據(jù)上,主要利用騰訊豐富的互聯(lián)網(wǎng)數(shù)據(jù)資源進(jìn)行訓(xùn)練,包括社交媒體、新聞資訊等,確保了模型對(duì)中文語(yǔ)境的深度理解。“混元大模型”每天的學(xué)習(xí)量驚人,據(jù)介紹,為“混元大模型”輸送的數(shù)據(jù),將總共超過(guò)2萬(wàn)億次!
在運(yùn)營(yíng)場(chǎng)景上,“混元大模型”將廣泛應(yīng)用于智能客服、智能助手、內(nèi)容創(chuàng)作等多個(gè)場(chǎng)景,特別是在企業(yè)服務(wù)和個(gè)性化推薦系統(tǒng)方面顯示出強(qiáng)大的應(yīng)用潛力。
自貢成為四川省首批人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)
AI將成新質(zhì)生產(chǎn)力“主角”
自貢人工智能產(chǎn)值將超500億元
不僅如此,基地基于人工智能的業(yè)務(wù)還有兩大板塊:無(wú)人駕駛訓(xùn)練和平臺(tái)內(nèi)容審核。這些核心業(yè)務(wù),都離不開(kāi)人工智能這個(gè)核心技術(shù)。
“無(wú)人駕駛訓(xùn)練是基于模型、算法等支持,對(duì)無(wú)人駕駛技術(shù)進(jìn)行數(shù)據(jù)采集后,開(kāi)展人工智能化的訓(xùn)練,使其在車主使用時(shí)具有現(xiàn)實(shí)的指引意義!弊T建說(shuō),比如,行駛在道路上,人工智能要學(xué)會(huì)判斷錐形桶、行人等障礙物,以及復(fù)雜路況的精確判定等。
第三項(xiàng)業(yè)務(wù),是平臺(tái)內(nèi)容審核,也離不開(kāi)人工智能技術(shù)的支撐!肮娞(hào)、視頻號(hào)等,有許多關(guān)鍵詞需要識(shí)別,我們會(huì)讓人工智能進(jìn)行第一輪審核,之后還會(huì)有人工審核等流程!彼f(shuō),如果全部使用人工審核,就會(huì)造成效率低下、成本劇增等問(wèn)題。
這只是自貢人工智能產(chǎn)業(yè)的冰山一角,在10月29日舉行的2024自貢新質(zhì)生產(chǎn)力創(chuàng)新發(fā)展大會(huì)上,自貢市科技局的業(yè)務(wù)骨干描繪了自貢人工智能制造發(fā)展的美好場(chǎng)景:智能駕駛汽車產(chǎn)業(yè)、無(wú)人機(jī)及通航產(chǎn)業(yè)、以智能仿真恐龍為特色的娛樂(lè)機(jī)器人、醫(yī)療康復(fù)機(jī)器人,以及兩個(gè)人工智能產(chǎn)業(yè)基礎(chǔ)方向,人工智能零售算力零售服務(wù)、人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)。
最終,自貢的人工智能產(chǎn)業(yè)將涵蓋制造、文旅、醫(yī)養(yǎng)、應(yīng)急安全、社會(huì)治理等方方面面,形成自貢特色“6+1”產(chǎn)業(yè)體系,計(jì)劃2027年實(shí)現(xiàn)人工智能產(chǎn)業(yè)產(chǎn)值超過(guò)500億元。
當(dāng)自貢彩燈插上人工智能的“翅膀”,會(huì)發(fā)生什么?
人工智能有望與自貢文旅發(fā)展相融合
人工智能有望與自貢文旅發(fā)展相融合
頭部企業(yè)相繼落戶
獲批四川省首批人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)
為何選擇落戶自貢?譚建認(rèn)為,自貢地處成渝地區(qū)雙城經(jīng)濟(jì)圈南翼,其地理位置是一個(gè)重要支點(diǎn)!耙宰载暈橹c(diǎn),周邊有很多產(chǎn)業(yè)可以和人工智能相融合。比如自貢的文旅,未來(lái)就可以和人工智能相結(jié)合,生產(chǎn)出更令人驚艷的作品,這里面的想象空間其實(shí)還挺大的。”
他介紹,其次是營(yíng)商環(huán)境,當(dāng)?shù)卣谑掷m(xù)辦理、稅收減免、住宿交通等方面,提供了非常好的服務(wù)!斑有高校資源,政府在周邊為我們對(duì)接了大量高校合作資源,取得了很好的效果,讓企業(yè)能專注發(fā)展!
大安區(qū),是近年來(lái)自貢打造人工智能產(chǎn)業(yè)的“橋頭堡”。該區(qū)加速布局人工智能未來(lái)產(chǎn)業(yè),推動(dòng)人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)聚集成勢(shì),吸引百度、騰訊、字節(jié)跳動(dòng)(抖音)三大互聯(lián)網(wǎng)巨頭相繼簽約落戶。
其中,百度阿波羅基地主要業(yè)務(wù)為高精地圖、車道級(jí)地圖、俯視圖、AOI、POI等業(yè)務(wù),企業(yè)用戶包括吉利、特斯拉等,力爭(zhēng)實(shí)現(xiàn)車道級(jí)導(dǎo)航產(chǎn)品“自貢造、全國(guó)用”。騰訊云基地主要業(yè)務(wù)為地圖標(biāo)注、混元大模型訓(xùn)練等,將打造騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地、人才培育中心、企業(yè)孵化中心和數(shù)據(jù)交付中心。火山引擎基地預(yù)計(jì)11月實(shí)現(xiàn)投產(chǎn)運(yùn)營(yíng)。
百度阿波羅基地外景
目前,基地已聚集相關(guān)企業(yè)20戶,員工940人(百度670人、騰訊270人),累計(jì)實(shí)現(xiàn)產(chǎn)值6917萬(wàn)元(百度2617萬(wàn)元、騰訊4300萬(wàn)元),繳納稅收210萬(wàn)元(百度196萬(wàn)元、騰訊14萬(wàn)元)。入駐企業(yè)中,四川百嘉數(shù)字科技有限公司8月成功升規(guī)入統(tǒng),成為全市首家規(guī)模以上互聯(lián)網(wǎng)和相關(guān)服務(wù)業(yè)企業(yè),成功填補(bǔ)軟件信息技術(shù)行業(yè)空白。
“近年來(lái),以數(shù)據(jù)標(biāo)注為突破口,自貢成功切入人工智能‘?dāng)?shù)據(jù)、算法、算力’三大產(chǎn)業(yè)的數(shù)據(jù)產(chǎn)業(yè)。重點(diǎn)引進(jìn)百度、騰訊、抖音等人工智能頭部企業(yè),以龍頭帶動(dòng)生態(tài)的方式,聚集數(shù)據(jù)標(biāo)注相關(guān)企業(yè)20戶,員工1000余人!
自貢市經(jīng)信局相關(guān)負(fù)責(zé)人介紹,同時(shí),還成立人工智能協(xié)會(huì),培育省級(jí)“智改數(shù)轉(zhuǎn)”供應(yīng)商1戶(滕洋智能)、市級(jí)“智改數(shù)轉(zhuǎn)”服務(wù)商12戶,引進(jìn)華為云、騰訊云等外地優(yōu)秀服務(wù)商11戶。依托優(yōu)質(zhì)服務(wù)商資源積極為企業(yè)搭建供需交流平臺(tái),推介專業(yè)服務(wù)商通過(guò)培訓(xùn)、咨詢、診斷等方式,緊緊圍繞技術(shù)支撐服務(wù)、技術(shù)項(xiàng)目轉(zhuǎn)化等方面助力企業(yè)智能制造水平能力提升;推薦優(yōu)秀服務(wù)產(chǎn)品,助力自貢企業(yè)轉(zhuǎn)型發(fā)展。
近年來(lái),自貢緊扣發(fā)展培育新質(zhì)生產(chǎn)力決策部署,貫徹落實(shí)人工智能全省“1號(hào)創(chuàng)新工程”要求,堅(jiān)持小切口、快節(jié)奏前瞻布局人工智能未來(lái)產(chǎn)業(yè),超常規(guī)推進(jìn)“一區(qū)三園”產(chǎn)業(yè)體系建設(shè),引進(jìn)落地一批龍頭企業(yè),全力推動(dòng)“6+1”產(chǎn)業(yè)初步起勢(shì)見(jiàn)效。2024年,自貢已獲批四川省首批人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū),取得了顯著的成效。