【環(huán)球時報記者 劉揚 歐陽子涵 環(huán)球時報特約記者 武彥】編者按:人工智能(AI)技術(shù)在經(jīng)歷幾年的高速發(fā)展后,終于在2024年開始取得井噴式爆發(fā)的成果應(yīng)用。無論是今年年初文生視頻大模型Sora帶來的巨大沖擊,還是全球多地自動駕駛汽車的普及、AI機器人開始在各行各業(yè)投入使用,或者是今年年底“美眾議院提交1547頁預算被AI精簡到116頁”的牛刀小試,都展現(xiàn)出AI技術(shù)正在深入我們的日常生活。但與此同時,AI發(fā)展可能帶來的一系列問題,從加深全球范圍的技術(shù)鴻溝、挑戰(zhàn)傳統(tǒng)社會的倫理價值觀、泄露個人隱私和構(gòu)成新的網(wǎng)絡(luò)安全,以及AI對于能源的巨大消耗、全球可用訓練數(shù)據(jù)的“緊缺”等,也日益引起各國的高度關(guān)注,成為AI未來進一步發(fā)展面臨的挑戰(zhàn)。
AI應(yīng)用落地元年,介入生活方方面面
2024年被稱為是AI應(yīng)用落地的元年,各種AI應(yīng)用開始深入到我們?nèi)粘I畹姆椒矫婷妗@?2月12日美國著名AI企業(yè)OpenAI公司旗下的ChatGPT聊天助手突然斷網(wǎng)數(shù)小時,竟引發(fā)大范圍混亂,許多依賴OpenAI API開展項目的公司也受到影響,“ChatGPT崩了”直接沖上微博熱搜,足以證明AI對于現(xiàn)代生活的介入有多廣泛。
文生視頻大模型Sora生成的猛犸象視頻截屏。(圖源:OpenAI公司)
北京郵電大學人機交互與認知工程實驗室主任劉偉接受《環(huán)球時報》記者采訪時表示,2024年之所以被認為是AI應(yīng)用落地的元年,大都源于這一年AI技術(shù)在多個領(lǐng)域取得了顯著的進展,許多創(chuàng)新型應(yīng)用開始向?qū)嶋H場景擴展并產(chǎn)生影響。其中一些在2024年表現(xiàn)突出的AI應(yīng)用,不僅展示了技術(shù)的成熟,也代表了行業(yè)發(fā)展的重要趨勢。
首先值得一提的是生成式AI的廣泛應(yīng)用。例如2024年2月,OpenAI公司發(fā)布的文生視頻大模型Sora通過對內(nèi)容對齊的文本句子和圖像/視頻數(shù)據(jù)之間關(guān)聯(lián)關(guān)系學習,具備模擬和重建物理世界視頻所刻畫復雜現(xiàn)象的能力,將人工智能內(nèi)容生成從文本內(nèi)容生成躍升到多模態(tài)內(nèi)容生成,被喻為“視頻世界模擬器”。Sora帶來的巨大沖擊,使它被中國工程院列為“2024全球十大工程成就”之一。同時生成式AI在文本、圖像、音頻和視頻等內(nèi)容創(chuàng)作方面繼續(xù)取得突破。AI寫作工具不僅可以生成新聞報道,還能創(chuàng)作小說、詩歌等復雜的文學作品;AI圖像生成工具如DALLE能夠根據(jù)簡短的文字描述生成復雜的圖像,廣泛應(yīng)用于設(shè)計、廣告、娛樂等行業(yè),提升了品牌和客戶之間的互動質(zhì)量,AI助手也在客戶支持領(lǐng)域變得更加智能,能夠處理復雜的查詢和任務(wù),未來可能在創(chuàng)意產(chǎn)業(yè)、教育、科研等多個領(lǐng)域大規(guī)模應(yīng)用,推動知識生產(chǎn)和娛樂內(nèi)容創(chuàng)作的效率提升。
第二是自動駕駛與智能交通的廣泛落地。2024年,自動駕駛技術(shù)在城市公共交通、長途貨運以及消費者汽車等領(lǐng)域迎來了新的發(fā)展里程碑。各大自動駕駛公司(如Waymo、百度Apollo、特斯拉等)已在多個城市開展自動駕駛出租車服務(wù),且技術(shù)的成熟度不斷提高。自動駕駛的感知、決策、規(guī)劃能力得到了進一步優(yōu)化,尤其是在復雜城市環(huán)境中的表現(xiàn)更為突出。AI被廣泛應(yīng)用于城市交通管理,自動化調(diào)度、交通流量優(yōu)化、事故預警等系統(tǒng)的部署,使得交通更加智能和高效。AI算法還能夠?qū)煌ㄊ鹿屎蛽矶逻M行快速預測與響應(yīng)。自動駕駛和智能交通代表了AI與物聯(lián)網(wǎng)(IoT)結(jié)合的趨勢,推動了智慧城市的建設(shè)。隨著技術(shù)的成熟,自動駕駛和智慧交通將成為解決城市交通擁堵和能源消耗等問題的關(guān)鍵手段。
第三是醫(yī)療AI的加速普及,特別是在診斷支持和個性化治療方面的進展。AI被用于圖像識別,幫助醫(yī)生更快速地診斷疾病,尤其是在腫瘤檢測、眼科、皮膚病等方面的表現(xiàn)顯著。AI診斷系統(tǒng)的準確性不斷提高,有助于提升醫(yī)療效率和診療質(zhì)量。另外,AI在藥物研發(fā)、基因組學分析以及個性化治療方案的制定中發(fā)揮了重要作用,AI模型可以通過對大量醫(yī)學文獻、臨床數(shù)據(jù)以及基因信息的分析,發(fā)現(xiàn)潛在的新藥物靶點或預見疾病發(fā)展的模式。
第四是工業(yè)AI與制造業(yè)智能化。2024年,AI技術(shù)在工業(yè)自動化和智能制造領(lǐng)域的應(yīng)用取得了顯著進展。AI通過實時監(jiān)控和數(shù)據(jù)分析,能夠預測設(shè)備故障并提前進行維護,減少了停機時間和維護成本。在制造業(yè)中,AI被應(yīng)用于生產(chǎn)過程的優(yōu)化,能夠自動調(diào)整生產(chǎn)參數(shù),提升生產(chǎn)效率和產(chǎn)品質(zhì)量,AI還與機器人、物聯(lián)網(wǎng)技術(shù)結(jié)合,形成了高度自動化的生產(chǎn)系統(tǒng)。工業(yè)AI的普及代表了制造業(yè)智能化轉(zhuǎn)型的趨勢,企業(yè)通過AI的引入,可以實現(xiàn)更高效、更靈活的生產(chǎn)流程,同時提高產(chǎn)品質(zhì)量和降低生產(chǎn)成本。
第五是語言理解與跨語言AI技術(shù)不斷取得突破,尤其是在自然語言處理和跨語言翻譯方面。AI在實時翻譯和語言理解上的能力有了大幅提升,尤其是在多語言支持的場景下,幫助不同語言和文化背景的用戶之間消除了溝通障礙。AI的情感分析能力進一步增強,能夠精準識別用戶的情緒狀態(tài),為客戶提供更具人性化的服務(wù)體驗。自然語言處理的進展代表了跨語言溝通與全球化的趨勢,將極大促進全球信息交流與合作。
總而言之,2024年,AI技術(shù)的快速落地不僅展示了其強大潛力,也表明AI將在未來幾年深刻影響各行各業(yè)。
擁抱AI時代,全球南北方態(tài)度有差異
《環(huán)球時報》記者注意到,盡管AI在全球范圍內(nèi)掀起熱潮,但受限于工業(yè)化能力、數(shù)字化能力、人工智能技術(shù)等稀缺能力的分布不均,導致了國家間、地區(qū)間的能力鴻溝,且鴻溝有持續(xù)擴大的趨勢。
環(huán)球時報研究院2024年發(fā)布的《中國AI經(jīng)驗在全球南方的應(yīng)用機遇》研究報告顯示,發(fā)展AI的數(shù)字鴻溝首先體現(xiàn)在全球數(shù)字資源分布不均上。當前,如OpenAI等主流平臺主要基于英語數(shù)據(jù)資源構(gòu)建。對于包括中國在內(nèi)的全球南方國家而言,數(shù)字資源特別是語料數(shù)據(jù)的開發(fā)利用與保護程度,相較于英語類數(shù)據(jù)資源,在數(shù)據(jù)規(guī)模和質(zhì)量上仍存在明顯差距。
其次,算力與算法差異也構(gòu)成顯著挑戰(zhàn)。全球數(shù)字資源分布不均,形成數(shù)據(jù)能力差距。數(shù)字鴻溝不僅體現(xiàn)于技術(shù)可獲得性,還包括數(shù)據(jù)使用能力、效率及最終收獲效果的不均。長期以來,全球南方國家享受到的數(shù)字發(fā)展紅利有限,一定程度上被排斥在發(fā)達國家及科技巨頭構(gòu)筑的信息壁壘之外。這導致南北差距的進一步擴大,并加劇了發(fā)展中國家在全球數(shù)字秩序中的邊緣化地位。非洲地區(qū)的54個國家中近半數(shù)缺乏本土數(shù)據(jù)中心,其數(shù)據(jù)被迫存儲于國外,核心數(shù)據(jù)資源受控于他國領(lǐng)土內(nèi)。算力與技術(shù)落后又會進一步加劇數(shù)據(jù)偏差與算法偏差,最終影響到應(yīng)用層面的準確性和完整性,甚至可能產(chǎn)生歧視性結(jié)果或無法有效回應(yīng)宗教文化語言差別較大地區(qū)的應(yīng)用需求。
再次,能源成本及供應(yīng)穩(wěn)定性問題,在一定程度上限制了全球南方國家本土人工智能的發(fā)展能效。人工智能發(fā)展對資源與能源的需求呈現(xiàn)出指數(shù)級增長態(tài)勢,對電力供應(yīng)成本與穩(wěn)定性也有極高的要求。在電力成本高昂或供電不穩(wěn)的國家,AI產(chǎn)業(yè)的部署與擴展面臨顯著挑戰(zhàn)。同時,全球南方國家正處于能源轉(zhuǎn)型的關(guān)鍵時期,其從傳統(tǒng)煤電向新能源的轉(zhuǎn)變進程尚存在不確定性。轉(zhuǎn)型速度若未能與AI產(chǎn)業(yè)發(fā)展的能源需求相匹配,將導致算力提升遭遇能源供應(yīng)瓶頸,拉大這些國家或地區(qū)數(shù)字鴻溝。
2024年諾貝爾物理學獎被授予兩名AI領(lǐng)域?qū)<,表彰他們在人工神?jīng)網(wǎng)絡(luò)和機器學習領(lǐng)域的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。(視覺中國)
此外,大模型具備的問答功能,雖然促進了全球知識與文化的交流融合,但不同國家和地區(qū)的民眾向大模型提問時,回答的數(shù)據(jù)來源都掌握在同樣的機構(gòu)手里,其結(jié)果有很大可能消弭了文化的多元性,以及一些國家和社會獨特的社情民意與價值體系。
這種數(shù)字鴻溝也體現(xiàn)在全球南北方媒體對于AI報道的態(tài)度差異。環(huán)球時報研究院從全球北方和全球南方各選取50家媒體,對這些媒體2024年(截至12月17日)提到人工智能的英文報道進行系統(tǒng)化分析(如圖)。從報道內(nèi)容來看,“安全”成為上述媒體共同關(guān)注的議題,近兩成報道提到相關(guān)詞匯!皠(chuàng)新”的提及率也接近兩成,但相關(guān)詞匯明顯更受來自全球南方的媒體關(guān)注,從提到該詞的報道比例來看,“南北分歧”達到19.9個百分點。此外,全球南方媒體更關(guān)注“合作”,14.3%的報道提到該關(guān)鍵詞,比全球北方媒體高8.6個百分點。
全球北方的媒體更關(guān)注AI帶來的風險和挑戰(zhàn),“錯誤信息”“仇恨”“深度偽造”等關(guān)鍵詞出現(xiàn)頻率比全球南方偏高。以美國《紐約時報》為例,該媒體提到“仇恨”和“錯誤信息”的報道均超過5%,對“道德”和“種族歧視”的關(guān)注度也高于平均水平!缎l(wèi)報》和《泰晤士報》兩家英國媒體對“仇恨”的關(guān)注度較高,其中,《衛(wèi)報》提及該詞的報道比例達到7.8%,較平均水平高5.3個百分點。
全球南方對AI前沿科技領(lǐng)域的發(fā)展普遍展現(xiàn)出較樂觀的態(tài)度。環(huán)球時報研究院在亞非拉等地區(qū)開展的民意調(diào)查顯示,68.4%的受訪者相信全球南方在推動AI等科技創(chuàng)新方面有潛力或潛力巨大。這種樂觀情緒在肯尼亞尤為顯著,81.7%的受訪者對此表示認同。印度、南非、埃及、馬來西亞等國的認同率也超過70%,顯示出全球南方民眾對于科技突破的廣泛期待和信心。
面臨“黑箱”決策挑戰(zhàn)
盡管外界普遍看好AI的下一步發(fā)展,但它同時也面臨諸多挑戰(zhàn)。清華大學新聞學院、人工智能學院教授沈陽接受《環(huán)球時報》記者采訪時表示,AI大模型的“幻覺”與可信度問題成為其大規(guī)模應(yīng)用的主要障礙之一。這種“幻覺”問題源自于多方面因素:基于大規(guī)模文本數(shù)據(jù)的概率預測方法,使得模型缺乏真正的語義理解與常識推理,一旦知識盲區(qū)出現(xiàn),就可能憑經(jīng)驗“自由發(fā)揮”;大部分大模型在生成時未必對信息進行嚴格校驗,容易導致前后矛盾、錯誤引用或邏輯混亂;大模型常被設(shè)計為提供多樣化、創(chuàng)新性回答,但在未建立約束機制的情況下,這種“創(chuàng)造性”會帶來失真與虛假內(nèi)容。
劉偉也表示,盡管今年諾貝爾物理學獎和化學獎都與AI領(lǐng)域有關(guān),凸顯AI對于科技研發(fā)的重要性,但應(yīng)用層面的實際問題依然不可忽視,尤其是在那些對精度要求極高、決策需要完全可靠和透明的場景中!盎糜X”問題在很多情況下影響了AI的可靠性,特別是在醫(yī)療、法律、金融、科學研究等領(lǐng)域,這些領(lǐng)域都要求數(shù)據(jù)的高度準確性和可靠性。
全球南北方媒體對AI態(tài)度不一
沈陽認為,想要解決“幻覺”問題,有不同的思路,包括外部檢索與事實核對(在生成前后,與權(quán)威數(shù)據(jù)庫或知識庫進行匹配與驗證);多模態(tài)融合(借助圖像、語音、視頻等多模態(tài)信息進行交叉驗證,提高回答可靠性);模型可解釋性(在生成過程中或結(jié)果輸出后,為用戶提供來源及推理依據(jù),幫助甄別“幻覺”)。
其次,AI發(fā)展還面臨數(shù)據(jù)偏見與倫理問題。沈陽介紹說,不平衡或偏頗的數(shù)據(jù)源,可能導致模型在性別、種族、地域等方面的偏見,而一旦模型學到帶偏見的特征,在大規(guī)模應(yīng)用中會進一步放大這些問題,帶來社會不公;而大規(guī)模數(shù)據(jù)收集、標注和訓練都可能涉及個人隱私和數(shù)據(jù)濫用。
劉偉也表示,AI系統(tǒng)的高效性依賴于大量數(shù)據(jù)的收集與分析。然而,這帶來了關(guān)于數(shù)據(jù)隱私和安全的嚴重擔憂。AI系統(tǒng)需要獲取和處理大量用戶數(shù)據(jù),特別是在醫(yī)療、金融、社交等領(lǐng)域。如果這些數(shù)據(jù)遭到未經(jīng)授權(quán)的訪問或濫用,可能導致嚴重的隱私泄露和經(jīng)濟損失。
同時,AI的“黑箱”性質(zhì)使得其決策過程常常難以被人類理解和追溯。這對那些需要高度透明和解釋性的領(lǐng)域(如法律、醫(yī)學、公共安全等)構(gòu)成了挑戰(zhàn)。醫(yī)生需要了解AI給出的診斷建議背后的原因,以便做出最終判斷。如果AI模型不透明,醫(yī)生和患者將無法信任其輸出,從而限制了AI的應(yīng)用范圍。法律要求判決必須具有透明性和可追溯性,如果AI在司法決策中起到了輔助作用,但無法清地解釋其推理過程,這將導致無法追究決策的責任,也可能帶來不公正的結(jié)果。
此外,沈陽介紹說,當前AI的進步與發(fā)展,還面臨高昂的訓練與推理成本問題。因為模型參數(shù)規(guī)模越大,算力、帶寬、存儲等成本指數(shù)級攀升,資源門檻顯著提高。對于初創(chuàng)企業(yè)、科研機構(gòu)而言,動輒數(shù)百萬美元的硬件投入形成了技術(shù)壁壘,可能加劇行業(yè)集中化。而大規(guī)模算力供給與訓練過程導致的能源消耗及碳排放問題也日益嚴重,特別是訓練大模型要消耗海量的電能,美國科技巨頭甚至為此計劃修建新的發(fā)電站,號稱“硅谷鋼鐵俠”的美國億萬富豪馬斯克由此宣稱“AI的盡頭是電!”
2024年AI領(lǐng)域出現(xiàn)的新挑戰(zhàn)還有大模型對海量高質(zhì)量文本“饑渴”嚴重,但互聯(lián)網(wǎng)優(yōu)質(zhì)文本資源有限,重復和噪聲數(shù)據(jù)大量存在。新的增量優(yōu)質(zhì)數(shù)據(jù)獲取難度與成本越來越高,形成數(shù)據(jù)瓶頸。
總之,雖然AI已經(jīng)在許多領(lǐng)域取得了顯著進展,仍有進一步深化的空間。特別是在那些對高精度、低容錯、高透明度的工作中,AI的現(xiàn)有技術(shù)路線還無法完全勝任。它在數(shù)據(jù)豐富、規(guī)則清晰、風險較低的場景(如圖像識別、語音識別、推薦系統(tǒng)等)有著顯著的優(yōu)勢,但在需要高度準確性、倫理考量和透明性的場景中,AI的應(yīng)用仍需要更多改進。