展會信息港展會大全

AI將爆發(fā)哪些超級應(yīng)用?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-03 06:59:57   瀏覽:65次  

導(dǎo)讀:文:任澤平團隊2023年ChatGPT橫空出世,人工智能上半場開啟近兩年,海量企業(yè)加入AI賽道,卻鮮有成功的、實現(xiàn)盈利的商業(yè)模式。本質(zhì)是缺乏超級應(yīng)用,沒有新的需求創(chuàng)造,在終端消費沒有引爆點。互聯(lián)網(wǎng)時代上半場,集成電路技術(shù)為手機、PC鋪路;下半場“iPhone時刻”對傳統(tǒng)手機、軟件服務(wù)進行革命,全球掀起智能消費電子浪潮,是歷史上著名的超級應(yīng)用。人工智能下半場,全球也在等 ......

AI將爆發(fā)哪些超級應(yīng)用?

文:任澤平團隊

2023年ChatGPT橫空出世,人工智能上半場開啟近兩年,海量企業(yè)加入AI賽道,卻鮮有成功的、實現(xiàn)盈利的商業(yè)模式。

本質(zhì)是缺乏超級應(yīng)用,沒有新的需求創(chuàng)造,在終端消費沒有引爆點。

互聯(lián)網(wǎng)時代上半場,集成電路技術(shù)為手機、PC鋪路;下半場“iPhone時刻”對傳統(tǒng)手機、軟件服務(wù)進行革命,全球掀起智能消費電子浪潮,是歷史上著名的超級應(yīng)用。

人工智能下半場,全球也在等待AI超級應(yīng)用。AI超級應(yīng)用才是大多數(shù)人的機會。

第一類是具身智能體路線,如自動駕駛、人形機器人:AI像人一樣、擁有一個物理的軀體,能感知、能互動,能主動地進入到“真實世界”。

第二類是超級AI軟件,在輔助辦公、作圖、視頻生成、教育等領(lǐng)域潛力巨大;诖竽P瓦M行定制化擴展升級,將“超能力”帶給各行各業(yè)。

第三類是AI消費電子,如AI PC、AI 手機、XR設(shè)備和腦機接口技術(shù),對傳統(tǒng)設(shè)備進行AI升級,或在新技術(shù)上開發(fā)新的需求,和元宇宙結(jié)合。

擁抱超級應(yīng)用,也要重視AI對社會的影響。人類的道德倫理能被AI“理解”嗎?什么樣的數(shù)據(jù)是“基本”事實?哪些算法是衡量“公平”的指標?大模型由現(xiàn)實世界訓練而來,因此AI也是社會的鏡子。這些問題還需要更深層的審視和技術(shù)規(guī)范來解決。

正文

1AI上半場,大模型和芯片大突破

1.1 上半場大模型算法誕生“思維”

人工智能上半場,算法進步鋪墊了半個多世紀,催生出“百模大戰(zhàn)”,人工智能概念始于1955年籌辦達特茅斯會議,先后經(jīng)歷了統(tǒng)計語言模型、專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、深度學習等階段。

AI將爆發(fā)哪些超級應(yīng)用?

2019至2022年,預(yù)訓練模型(Pre-trained Model)井噴式出現(xiàn);2023年,首個真正意義上的大語言模型(Large Language Model)ChatGPT落地,開啟全球人工智能元年,谷歌、Meta、亞馬遜、百度、阿里、騰訊等科技巨頭先后加入,AI初創(chuàng)企業(yè)如雨后春筍,大模型開啟“煉丹”時代。

AI將爆發(fā)哪些超級應(yīng)用?

大模型與其他模型最大的區(qū)別在于“涌現(xiàn)”能力,出現(xiàn)類人的“思維方式”。在預(yù)訓練階段,隨著模型規(guī)模的擴大和參數(shù)量提升,在超過某一閾值后,模型準確度突然大幅提升,例如GPT-3、PaLM、LaMDA等模型在參數(shù)量達到百億級別時表現(xiàn)出涌現(xiàn)。

AI將爆發(fā)哪些超級應(yīng)用?

1.2 上半場,芯片算力爆發(fā)、一“芯”難求

GPU取代CPU成為AI算力載體。早期AI訓練任務(wù)由CPU來完成,但效率較低。轉(zhuǎn)折點在2012年10月,佛羅倫薩計算機視覺會議上,只用了4顆英偉達GPU的AlexNet擊敗了用了16000顆CPU的谷歌貓,成為了“冠軍算法”,轟動AI界,此后GPU訓練開始被廣泛認可。AlexNet研發(fā)主導(dǎo)人辛頓也因?qū)θ斯ど窠?jīng)網(wǎng)絡(luò)貢獻獲得2024年諾貝爾物理學獎。

對比看,CPU擅長于少量的復(fù)雜邏輯運算,相當于計算機的“大腦”。而GPU擅長于大量的簡單相似計算,用于圖形處理,相當于“視覺神經(jīng)”。由于AI模型需要大量的并行乘法、加法運算,GPU的優(yōu)勢更明顯。

AI發(fā)展遇上GPU迭代的“算力及時雨”,芯片需求大幅擴張,上游成為最大受益者。根據(jù)英偉達數(shù)據(jù),GPU的性能在過去20年提升達到1000萬倍,截止2023年底,英偉達的GPU產(chǎn)品已占據(jù)全球92%數(shù)據(jù)中心市場份額。2024年Q2,英偉達實現(xiàn)營收300億美元,同比增長122%,凈利潤達到166億美元,同比上升168.24%。

AI將爆發(fā)哪些超級應(yīng)用?

AI企業(yè)將2024-25視作布局的關(guān)鍵兩年,英偉達加速GPU擴產(chǎn),供不應(yīng)求。谷歌2024年在芯片、設(shè)備及資產(chǎn)上的投入已攀升至約500億美元,同比增幅超過50%。為布局2025年AI賽道,Meta已向英偉達下單價值約100億美元芯片;微軟正籌備在2025年Q1前為OpenAI配置5.5萬至6.5萬顆GB200芯片,價值約30億美元。

AI將爆發(fā)哪些超級應(yīng)用?

2 AI下半場,機遇就看AI超級應(yīng)用

什么是超級應(yīng)用?

一是將前沿技術(shù)應(yīng)用在人們可以廣范接受的消費領(lǐng)域。比如硬件領(lǐng)域的“iPhone時刻”,觸控屏并非蘋果首創(chuàng),但蘋果設(shè)計師發(fā)掘了消費者的使用偏好,改變了手機使用習慣,讓人們廣泛接受了觸控移動設(shè)備。

再比如,軟件領(lǐng)域谷歌、百度搜索引擎網(wǎng)站的出現(xiàn)。在早期互聯(lián)網(wǎng)還是直接輸入網(wǎng)址的時代,搜索引擎極大程度提升了上網(wǎng)的便捷性,拓寬了互聯(lián)網(wǎng)的潛在用途和可探索邊界。

二是能制造需求引爆點,形成創(chuàng)造新增長、新應(yīng)用的“鏈式反應(yīng)”。例如,智能手機的硬件革命,將互聯(lián)網(wǎng)時代的核心用戶場景從PC轉(zhuǎn)移到了手機,科技企業(yè)在軟件開發(fā)上競爭,掀起了多輪App應(yīng)用開拓和迭代,逐漸將個人生活需求與移動互聯(lián)網(wǎng)形成深度綁定。開辟了移動出行、電子商務(wù)等新應(yīng)用領(lǐng)域,創(chuàng)造了新的用戶需求和消費趨勢。

從龍頭AI公司戰(zhàn)略布局出發(fā),可推測超級應(yīng)用的發(fā)展走向。

大模型龍頭公司:OpenAI當前聚焦于解決盈利難題,業(yè)務(wù)重心轉(zhuǎn)向擴大商業(yè)化場景。由于模型算力和訓練成本高昂,OpenAI至今未盈利。ChatGPT在2023年底有1.8億用戶和1億付費月活。最新預(yù)測2024年營收也將達到50億美元,即便如此,管理層對今年實現(xiàn)盈利仍沒有做出期待。另一方面,OpenAI已經(jīng)調(diào)整治理和經(jīng)營架構(gòu),將目標從實現(xiàn)可控AGI轉(zhuǎn)向了AI商業(yè)化和市場拓展方面投入:推出了Sora、GPT-4o等差異化模型來探索應(yīng)用場景和訂閱增長空間。Appfigures數(shù)據(jù)顯示,2024年5月GPT-4o的發(fā)布推動了其APP端收入增長高達40%。

算力龍頭公司:英偉達的新增長曲線全部聚焦于AI軟硬件應(yīng)用和服務(wù),主要在人形機器人、自動駕駛汽車、AR/VR設(shè)備領(lǐng)域。①英偉達主導(dǎo)了OpenUSD項目和Isaac系列,前者用于創(chuàng)建和模擬復(fù)雜3D數(shù)據(jù),后者服務(wù)于加速機器人應(yīng)用的開發(fā)工程,兩者都專注于機器人領(lǐng)域的算法和工程實現(xiàn)、驗證。②發(fā)布Jetson Thor專用芯片,為高階自動駕駛、人形機器人等需要高性能推理的邊緣計算領(lǐng)域而設(shè)計。③開發(fā)了Isaac Sim和MimicGen NIM兩種工具包,主要用于AR/VR穿戴設(shè)備的實時動作捕捉,并進行數(shù)據(jù)生成。

AI將爆發(fā)哪些超級應(yīng)用?

3 AI超級應(yīng)用,先看具身智能與AI軟件

3.1 AI具身智能:人形機器人

英偉達創(chuàng)始人黃仁勛認為,下一波的人工智能浪潮是“具身智能(embodied AI)”,人工智能可以真正理解、推理并與物理世界互動。人形機器人結(jié)合AI算法與控制、感知硬件,讓AI擁有人類形態(tài),是“具身智能”的集大成者。

人形機器人不同于以往的機器人。AI超級應(yīng)用的人形機器人指的是“具備高度自動化、智能化、集成化的通用機器人”。類比AI就像是“通用智能與機械智能”的區(qū)別。傳統(tǒng)機器人如工業(yè)機器人、服務(wù)機器人和特種機器人技術(shù)已經(jīng)較為成熟:在工業(yè)領(lǐng)域的移動搬運、自動物流、工業(yè)制造、電網(wǎng)自動巡檢等;服務(wù)領(lǐng)域的家用掃地、酒店自動配送等已經(jīng)有大量的商用案例。而以特斯拉Optimus為代表的通用機器人不限于特定應(yīng)用領(lǐng)域,在設(shè)計上可以像人一樣從事各種復(fù)雜的、高難度任務(wù),因此對大模型的算法和算力水平要求更高。

從設(shè)計理念上看,通用人形機器人的設(shè)計理念是為了模擬人類的一些關(guān)鍵特性,例如直立行走、雙手操作工具的靈巧性,以及最重要的智能。為了實現(xiàn)這些功能,人形機器人的關(guān)鍵要素包括人機交互算法、先進機械結(jié)構(gòu)、運動控制算法、環(huán)境感知、機器臂與靈巧手等,從而形成能夠模擬人類步伐的雙腿、能夠執(zhí)行類似人類動作的雙臂和雙手,以及能夠感知、理解并響應(yīng)外部環(huán)境的“大腦”。

人形機器人的核心技術(shù)還是人機交互算法和運動控制算法:①人機交互算法,即從通用類大模型上移植的核心“思維方式”,決定了機器人理解人類指示、理解周圍環(huán)境、做出相應(yīng)的反饋或智能化的交互能力。②運動控制算法決定了機器人的運動能力,通過計算所需力和力矩來驅(qū)動關(guān)節(jié)來運動,尤其是在復(fù)雜地形、和存在外部干擾的場景,如何確保機器人的行走、操作、平衡和穩(wěn)定性。③此外,突破機器人的機械結(jié)構(gòu)、傳感裝置的技術(shù)難點,降低綜合成本、提高運行的可靠性和穩(wěn)定性也是業(yè)內(nèi)努力的方向。

特斯拉作為該領(lǐng)域先行者,于2021年8月AI Day首次發(fā)布Tesla Bot計劃,2022年2月推出Optimus人形機器人。初代Optimus能完成招手、擰螺絲等簡單動作,但行動不算流暢。2024年5月的第二代Optimus搭載了視覺神經(jīng)網(wǎng)絡(luò)和FSD芯片,技術(shù)源于電動車自動駕駛的成熟方案,不僅能實現(xiàn)流暢行走,還能精準地完成復(fù)雜的分揀工作(動力電池單元),離完全實現(xiàn)自動化邁進了一大步。2024年1月12日,“Tesla:We Bot”發(fā)布會上的Optimus更上一層樓,在行走、抓取、握持等能力上有了突破性改變,并且通用智能水平更高,可以與人自由交流。

馬斯克預(yù)計2026能實現(xiàn)人形機器人大規(guī)模上市。當前Optimus已經(jīng)有兩臺部署在特斯拉工廠工作,制造成本能控制到1萬美元/臺。特斯拉在短短兩年半時間里將Optimus快速迭代,讓社會看到了人形機器人量產(chǎn)、落地、大規(guī)模應(yīng)用的可能性。同時,多模態(tài)大模型的蓬勃發(fā)展又為機器人技術(shù)成型注入新的血液,通用機器人極有可能成為功能最完備的“具身智能體”。

有實力的人形機器人公司尚集中在美國:除特斯拉外,OpenAI、英特爾、英偉達、三星等多家頭部企業(yè)投資的Figure AI也在2023年發(fā)布了首款機器人,并與寶馬達成合作,未來陸續(xù)將人形機器人部署于汽車總裝車間崗位。由得克薩斯大學實驗室孵化、和NASA共同開發(fā)人形機器人的Apptronik也在2024年與奔馳達成合作,讓其發(fā)布的人形機器人參與產(chǎn)線流程作業(yè)。中國的優(yōu)必選是國內(nèi)較早研發(fā)人形機器人的企業(yè),成立于2012年,其工業(yè)版人形機器人Walker S已部署于蔚來汽車總裝車間,并陸續(xù)與東風、一汽大眾達成合作,預(yù)計2026年將在工廠端放量。

AI將爆發(fā)哪些超級應(yīng)用?

3.2 AI具身智能:自動駕駛汽車

自動駕駛汽車可能是最早實現(xiàn)大規(guī)模落地的“具身AI”超級應(yīng)用。

一是因為汽車的復(fù)雜性和普及程度適合與AI技術(shù)結(jié)合。汽車是復(fù)雜度僅次于飛機的現(xiàn)代工業(yè)品,也是附加價值最高的可選消費品,擁有上萬個電子零部件。同時,汽車的架構(gòu)也在向“中央集中式”和云計算變革,與AI技術(shù)可以實現(xiàn)“1+1>2”。

二是智能汽車相當于“帶輪子的機器人”,由于兩者的技術(shù)難點(算法)和核心零部件(傳感器、算力芯片)相似,智能汽車肩負著給人形機器人研發(fā)開路的使命。高度智能化的汽車也能在不同場景中學習,模型在迭代中不斷提升自身駕駛決策的準確度。

智能駕駛就是最好的“用硬件跑AI”。全球不少企業(yè)都有技術(shù)積淀:國內(nèi)的百度Apollo已經(jīng)能實現(xiàn)L4級自動駕駛,蘿卜快跑截止2024年7月完成自動駕駛訂單約82.6萬單。海外的自動駕駛綜合服務(wù)商Waymo也在2024年擴大了服務(wù)區(qū),在8月初周單量翻了一倍,服務(wù)人數(shù)超過10萬人。車企方面,塞力斯、小鵬、理想處于國內(nèi)第一梯隊,優(yōu)勢主要在高速和城市領(lǐng)航方面。特斯拉在海外的優(yōu)勢是FSD的數(shù)據(jù)驅(qū)動能力和“BEV+Transformer”算法框架。

從實踐情況看,各車企和智能駕駛解決方案供應(yīng)商都在競相打造智算中心。特斯拉的DOJO智算中心,預(yù)計到2024年10月,總算力將達到100,000PFLOPS,相當于約30萬塊英偉達A100的算力總和。國內(nèi),商湯位于上海臨港的上海人工智能計算中心(AIDC)算力已達到14,000 PFLOPS(截至今年8月);華為車Bu的ADS訓練算力達3,500PFLOPS(截至今年7月);理想訓練算力達5,390 PFLOPS(截至今年8月)。

特斯拉掀起“端到端”的自動駕駛變革。2023年馬斯克直播試駕,展示了FSD Beta V12有史以來第一個端到端AI自動駕駛系統(tǒng)(Full AI End-to-End),從智算量級來看,V12比上一代高出幾個數(shù)量級:V12的C++代碼只有2000行,而V11有30萬行。

傳統(tǒng)智能駕駛解決方案是模塊化的,包含許多人為設(shè)定的規(guī)則(hand-crafted、rule-based)部分。一套模塊化智駕方案以感知模塊規(guī)劃模塊控制模塊為主脈絡(luò),模塊間聯(lián)系緊密,每個模塊都有輸入端與輸出端;前一個模塊的輸出是后一個模塊的輸入。程序?qū)崿F(xiàn)上效率低、成本高,需要提前通過代碼告知計算機制訂行車方案。

AI將爆發(fā)哪些超級應(yīng)用?

端到端(end-to-end)更接近于人的駕駛實踐。只需要一個神經(jīng)網(wǎng)絡(luò)模型,模型輸入端輸入攝像頭、激光雷達、毫米波雷達等傳感器所搜集到的信息,輸出端便可以直接輸出控制車輛方向和速度的操作指令。中間不需要任何人為設(shè)定的規(guī)則。與模塊化相比,從感知環(huán)境到執(zhí)行駕駛操作只需依靠直覺和經(jīng)驗。程序?qū)崿F(xiàn)上更高效,由于模型不是由表征規(guī)則的代碼驅(qū)動的,而是全部依靠基于海量數(shù)據(jù)的機器學習。

從智能駕駛解決方案的上限來看,端到端的上限空間更大。第一,模塊化方案的環(huán)節(jié)間存在信息遺失問題;而端到端則不存在這個問題,因此端到端的最優(yōu)化是全局最優(yōu)化。第二,模塊化方案中的規(guī)劃模塊具有許多基于規(guī)則的代碼,然而規(guī)則是無法窮舉的,模塊化方案無法應(yīng)對長尾場景;而端到端模型是基于數(shù)據(jù)而非規(guī)則的,經(jīng)過深度學習,模型會習得類人的處理方式且具備相當?shù)呐e一反三能力,從而具備更優(yōu)秀的長尾場景應(yīng)對能力。

端到端已經(jīng)成為行業(yè)共識,但該技術(shù)的發(fā)展也必然伴隨著掣肘因素,訓練模型(神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu))、訓練數(shù)據(jù)、訓練方法(參數(shù)優(yōu)化方法)、算力(云端、車端)等都是端到端技術(shù)成熟度的決定因素,其中數(shù)據(jù)又是最重要的一個。端到端模型的實現(xiàn)本質(zhì)是一個機器學習的過程,前提是提供給計算機足夠多的、覆蓋面廣的、優(yōu)秀的學習案例。少量訓練數(shù)據(jù)最多只能支撐完成demo,而端到端技術(shù)的成熟必然需要海量優(yōu)質(zhì)訓練數(shù)據(jù)的支撐,如馬斯克所說:“用100萬個視頻case訓練,勉強夠用;200萬個,稍好一些;到了1000萬個,就變得難以置信了。”

在解決數(shù)據(jù)掣肘方面,有兩個渠道:一是來源于真實世界的優(yōu)質(zhì)駕駛案例,如馬斯克通過FSD影子模式創(chuàng)建的數(shù)據(jù)閉環(huán);二則是源自虛擬世界的虛擬真實案例,如利用世界模型(World Model)生成的駕駛場景、駕駛案例。未來各車企與智能駕駛解決方案商如何攻克數(shù)據(jù)難關(guān)值得關(guān)注。數(shù)據(jù)之外,端到端技術(shù)的成熟要求配備足夠的訓練算力。支持端到端模型的訓練需要海量算力支持,但目前還難以支持方案到達量產(chǎn)階段。

AI將爆發(fā)哪些超級應(yīng)用?

中國智能駕駛產(chǎn)業(yè)的發(fā)展以“車路云一體化”為設(shè)計理念,是“單車智能”+“車路協(xié)同”雙線發(fā)展。2024年上半年我國L2級的新乘用車滲透率超過50%,保守估計,到2030年,L2級以上車型的滲透率將超過80%。

我國推進車路云一體化研發(fā)及應(yīng)用目前存在兩大主要問題:當前“車路云一體化”研發(fā)以及示范仍為初級階段,車端系統(tǒng)仍然以單車智能為主,車企數(shù)據(jù)尚未接入云控基礎(chǔ)平臺;絕大部分“車路云一體化”系統(tǒng)仍然為煙囪型架構(gòu),未實現(xiàn)分層解耦、跨域共用。這也是網(wǎng)聯(lián)式智能駕駛迄今為止尚未形成商業(yè)閉環(huán)的兩大原因。未來,路側(cè)、云側(cè)基礎(chǔ)設(shè)施建設(shè)任重道遠。下一步發(fā)展重點在于智能網(wǎng)聯(lián)基礎(chǔ)設(shè)施改造,這對未來智能駕駛實現(xiàn),AI超級應(yīng)用率先落地的意義重大。

3.3 AI助手:AI超級應(yīng)用軟件

AI助手是當前最快落地的AI超級應(yīng)用軟件,也是“百模大戰(zhàn)”的直接產(chǎn)物。對個人消費者,用AI升級辦公、生活體驗已經(jīng)迅速成為潮流。

AI助手不僅是簡單的查詢工具,還是能夠理解復(fù)雜的用戶需求,并提供個性化服務(wù)的成熟應(yīng)用:可以完成文本創(chuàng)作、會議記錄、實時翻譯、頭腦風暴、PPT創(chuàng)作、快捷搜索、文件與圖片識別、信息處理等日常工作任務(wù)。在生活中,也可以委托AI助手處理制定旅行計劃、安排行程、在線購物、管理郵件、遠程操控智能家居等。

微軟在2023年9月推出Copilot,將傳統(tǒng)辦公軟件升級為Office+AI,減輕工作負擔、提高工作效率,開啟了新一輪辦公室生產(chǎn)力革命。截止2024年8月,用戶已用Copilot進行聊天超130億次,服務(wù)企業(yè)超5萬家。驗證了“AI+辦公”商業(yè)模式的可行性。

AI助手的技術(shù)實現(xiàn)源自大模型的技術(shù)衍生。比如Copilot采用的是微軟投資的OpenAI開發(fā)的GPT4模型,此外還利用了DALL-E 3技術(shù),使得AI助手不僅能回答文字問題,還能根據(jù)文本描述生成相對應(yīng)的圖片。這也是微軟能搶先占據(jù)AI辦公的核心優(yōu)勢。

國內(nèi)的主要AI助手有字節(jié)跳動的豆包、百度Comate、騰訊元寶、訊飛星火、月之暗面的KimiChat等,各自具備差異化優(yōu)勢。

百度Comate是專注開發(fā)者群體的智能代碼助手,擅長專業(yè)代碼領(lǐng)域、有助于推動AI原生應(yīng)用落地。騰訊元寶信息覆蓋全面,依托騰訊的生態(tài)系統(tǒng),有微信公眾號的豐富內(nèi)容和原創(chuàng)資源。訊飛星火在語音識別和語音合成方面表現(xiàn)出色。KimiChat的超長文本處理功能較強,支持處理和輸出達20萬字的文本。豆包的優(yōu)勢是功能豐富、操作便捷,且在推出瀏覽器插件后可以隨時調(diào)用AI功能,極大提升工作效率。

AI將爆發(fā)哪些超級應(yīng)用?

3.4AI作圖、視頻生成

AI進行圖片、視頻創(chuàng)作的主要原理是對抗學習(GAN):通過訓練兩個模型,一個生成與真實數(shù)據(jù)相似的“假圖像”,另一個負責判斷圖像的真?zhèn),并反饋學習成果。在兩個模型的對抗任務(wù)下,逐漸生成逼真的圖像作品,并根據(jù)需要切換為不同的藝術(shù)風格。

AI圖片生成在to C和to B端都有海量應(yīng)用潛力。個人應(yīng)用的創(chuàng)意繪畫、AI寫真、修圖;商業(yè)領(lǐng)域,從新興的平面設(shè)計、電商設(shè)計、肖像設(shè)計、到傳統(tǒng)的服裝、包裝、工業(yè)領(lǐng)域都能實現(xiàn)極大的成本節(jié)省和效率提升。比如妙鴨相機在AI寫真領(lǐng)域有一席之地,由阿里云提供算力支持,能實現(xiàn)照片的快速合成和調(diào)整。再比如Midjourney、Stable Diffusion在AI繪圖領(lǐng)域也十分熱門,建筑、插畫、動漫、裝修到線稿、商業(yè)設(shè)計等都實現(xiàn)了場景覆蓋。

在AI視頻創(chuàng)作領(lǐng)域,2024年初橫空出世的Sora有望極大降低短劇制作的綜合成本,解決“重制作而輕創(chuàng)作”的共性問題,短劇制作的重心未來有望回歸高質(zhì)量的劇本內(nèi)容創(chuàng)作。Sora或許能真正為傳媒、文化、游戲等相關(guān)行業(yè)的企業(yè)降本增效,廣告制作公司通過Sora模型生成符合品牌的廣告視頻,顯著減少拍攝和后期制作成本;游戲與動畫公司使用Sora直接生成游戲場景和角色動畫,減少了3D建模和動畫制作成本。企業(yè)節(jié)省下來的成本可以用于提高產(chǎn)品、服務(wù)質(zhì)量或者技術(shù)創(chuàng)新,推動生產(chǎn)力進一步提升,對現(xiàn)實的影響與改變,不可不謂之巨大。

AI將爆發(fā)哪些超級應(yīng)用?

3.5 AI教育

教育是科技和社會進步的根基,在AI教育領(lǐng)域美國已經(jīng)提前布局,中國需加快追趕。根據(jù)Sensor Tower數(shù)據(jù),美國AI應(yīng)用市場下載量前三分別是ChatGPT、Copilot,以及AI教育軟件Question AI。

教學支持上,AI能幫助教師備課、作業(yè)批改、考試出題、智能閱卷、虛擬實驗等。比如科大訊飛的星火教師助手,可以設(shè)計完整的教學方案,包含單元主題、教學目標等模塊化內(nèi)容,智能匹配大綱所要求的學習任務(wù)。為老師節(jié)省大量時間經(jīng)歷,同時附帶了精準、貼切的教學素材。

學生輔導(dǎo)面,AI應(yīng)用可以實現(xiàn)個性化精準學習,讓學生獲得和人類老師輔學相等的互動式體驗。比如Question AI最核心的功能拍照答題。AI也能充當外語口語陪練,進行電子家教輔導(dǎo)、作業(yè)查漏補缺等,對于學齡前教育也能起到益智和興趣開發(fā)作用。

AI對現(xiàn)代教育體系也會產(chǎn)生變革性影響。根據(jù)美國高等教育信息化協(xié)會發(fā)布的《2024年人工智能圖景研究》,比起AI帶來的潛在隱患,落后于時代是教育最大的擔憂。

AI有消除教育不平等的潛力,讓每個學生都獲得世界一流的教育。過去的教育系統(tǒng)是以教師為核心,基于上課時間安排去塑造學生。AI教育或?qū)⑥D(zhuǎn)向以學生為核心,基于不同能力、個性化的學習來產(chǎn)生改變。2023年,全球最大的免費教育的非盈利組織可汗學院(Khan Academy)推出了基于GPT4的AI機器人Khanmigo,對學生能提供一對一私人導(dǎo)師服務(wù),對老師也能成為超級助教,目前已有超過65000名用戶。2024年4月17日,我國教育部也公布了首批18個“人工智能+高等教育”典型應(yīng)用場景案例,包括北京航空航天大學、北京師范大學、哈爾濱工業(yè)大學等高校成為首批試點高校,在教育教學模式創(chuàng)新方面探索AI應(yīng)用。

3.6 AI具身智能體+軟件:AI PC、AI 手機

PC、手機的芯片隨著過去十年的發(fā)展已經(jīng)達到相當高算力水準,與AI模型部署天然適配,是第一批可以快速落地的端側(cè)運行AI的硬件載體。

AI PC和AI手機最大的優(yōu)勢在于,一方面可借助生成式AI進一步拓展能力上限,不僅響應(yīng)更即時,其定制化程度也更貼近用戶習慣;另一方面,內(nèi)嵌AI可以實行本地化模型部署,確保了個人數(shù)據(jù)和隱私安全。

無論是芯片企業(yè)、電腦廠商還是手機企業(yè)都將“產(chǎn)品AI化布局”提上日程。英偉達和AMD分別推出了AI-Ready RTX筆記本、Ryzen AI架構(gòu)。聯(lián)想一口氣推出AI PC ThinkPad X1 Carbon AI等十余款A(yù)I PC,華碩2024年推出Zenbook S16,戴爾推出XPS 14。華為HarmonyOS 4系統(tǒng)全面接入盤古大模型,蘋果最新iPhone16也全系搭載AI大模型。

以AI PC為例,初步功能有:①輔助辦公、會議紀要;②輔助創(chuàng)作繪畫、文案生成;③個人知識庫、知識問答、本地搜索。2024年Q2全球PC出貨量升至6280萬臺,同比增長3.4%,結(jié)束了七個季度的同比下滑;其中AI PC出貨量達到880萬臺,占總出貨量的14%。

對比來看,由于PC端搭載芯片性能優(yōu)于手機,AI PC滲透速度將快過AI手機。IDC預(yù)測,2024年全年AI PC的市占率或達到55%,2027年將達到85%;生成式AI智能手機2024將增長344%,占18%市場份額。

AI將爆發(fā)哪些超級應(yīng)用?

4 下半場,更要重視AI的價值對齊問題

AI進步最緊迫的挑戰(zhàn)是盡可能地在不同情形和復(fù)雜環(huán)境中做出符合人類價值觀的判斷,即人機對齊問題(Alignment Problem)。

算法和人類學習的方式相似,但并不清楚人類對公平性、安全性、道德性的認知。所以特定領(lǐng)域需要人為篩選、標記數(shù)據(jù)、在監(jiān)督學習中應(yīng)對具體的問題。

第一類是算法搭建謬誤:訓練用的數(shù)據(jù)樣本是準確的,但訓練規(guī)則沒有考慮到統(tǒng)計學偏差。例如,微軟計算機專家Rich Caruana在上世紀90年代使用機器學習模型幫助肺炎患者就診時,就曾錯誤地將哮喘病史歸類為低風險因子,原因是機器學習的樣本中哮喘患者死于肺炎的可能性很低。實際上有哮喘病史的肺炎患者有嚴重健康風險,但他們通常會受到重點護理,所以樣本中的死亡率低,數(shù)據(jù)表現(xiàn)上哮喘病史和肺炎死亡的關(guān)聯(lián)度也會降低。

第二類是數(shù)據(jù)來源偏見。例如,麻省大學匯集的公共人物圖片庫在用于機器學習時,被發(fā)現(xiàn)存在偏見問題:男性占比超過77%,白人占比超83%,一些少數(shù)族裔甚至沒有樣本,因此訓練的模型就會生成性別和種族其實內(nèi)容。搭建團隊隨后解釋稱:數(shù)據(jù)全部來源于在線新聞中收集的圖像,并無主觀調(diào)整。該結(jié)果反應(yīng)了公共新聞報道本身就存在偏見,數(shù)據(jù)背后的動機和目標并非純粹理性。因此,當數(shù)據(jù)已盡可能的具有包容性時,AI的非監(jiān)督訓練會直接產(chǎn)生道德問題。

第三類是道德兩難困境(Moral Dilemma)。比如,自動駕駛決策的擔憂:算法如何在道路兩難情景中去做決策?設(shè)想汽車前方突發(fā)事故,必須在短時間內(nèi)緊急換道,但左側(cè)是載有孕婦的車輛而右側(cè)是懸崖,兩種決策的后果都是致命的,此時算法該如何去權(quán)衡后果?并沒有正確的答案。因為人類社會的道德框架并非完全一致,不同的價值觀、文化、認知背景存在著道德差異,以用一種達成共識的行為準則來建設(shè)“AI的道德性”還難以具備客觀條件。

為解決人機對齊問題進行嘗試,AI前沿企業(yè)除了發(fā)布各自的AI倫理準則,也通過收集用戶反饋進行算法改進。OpenAI提出過超級對齊要求準則(但隨著業(yè)務(wù)重心轉(zhuǎn)變和管理層變動已不是主要目標),微軟通過可視化工具和解釋性算法來揭示模型工作機制。各主權(quán)政府也相繼出臺文件監(jiān)管,中國注重安全評估標準和生成內(nèi)容標識,美國提出算法歧視保護和數(shù)據(jù)隱私要求,歐洲強調(diào)AI的自主性、預(yù)防傷害、公平性和可解釋性。

澤平宏觀人工智能系列研究報告:

13.《用AI新質(zhì)生產(chǎn)力破局經(jīng)濟》,2024年8月22日

12.《中國智能駕駛報告2024:未來已來》,2024年7月25日

11.《AI賣鏟人“英偉達”,為何業(yè)績再度爆發(fā)》,2024年5月25日

10.《特斯拉推低價車型與無人駕駛翻盤》,2024年4月25日

9.《人工智能進入“開箱即用”時代》,2024年4月19日

8.《Sora 橫空出世,會顛覆哪些行業(yè)?》,2024年2月20日

7.《人工智能的機會可能在這些領(lǐng)域率先爆發(fā)》,2024年2月3日

6.《中國人工智能研究報告:大模型和全民AI》,2023年8月18日

5.《模型即服務(wù),好云新生態(tài)》,2023年4月10日

4.《文心一言開啟國產(chǎn)大模型時代,應(yīng)用新機遇》,2023年3月23日

3.《中國智能駕駛報告2023:車聯(lián)萬物,暢想智行》,2023年2月9日

2.《任澤平:中國經(jīng)濟的AI加速度》,2022年9月24日

1.《都來上云!產(chǎn)業(yè)智能化,下一個爆發(fā)點》,2022年9月7日

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港