每經(jīng)編輯:畢陸名
在OpenAI宣布連發(fā)12天更新后,Google選擇12月11日深夜(在OpenAI發(fā)布更新之前),發(fā)布新模型Gemini 2.0。
圖片來(lái)源:Google官網(wǎng)截圖
在多次發(fā)布被OpenAI精準(zhǔn)狙擊后,Google扳回一局,發(fā)布了Gemini 2.0,直指Agent使用。Agent功能,也稱為智能體功能,通常指的是AI能夠感知環(huán)境、執(zhí)行任務(wù)并在一定程度上獨(dú)立做出決策的能力,也就是能更自動(dòng)化完成任務(wù)的功能。
此次Google似乎賭對(duì)了。OpenAI凌晨?jī)牲c(diǎn)的發(fā)布,主要宣布了和Apple Intelligence的合作,一個(gè)普遍被期待能與Agent能力強(qiáng)相關(guān)的合作。
Google,則一次性發(fā)布了四個(gè)Agent相關(guān)的功能:
Project Astra,能夠在Gemini應(yīng)用中直接調(diào)用Google Lens和地圖功能幫用戶解決問(wèn)題;
Project Mariner(海員項(xiàng)目),Chrome瀏覽器的實(shí)驗(yàn)性功能,可以通過(guò)提示詞直接幫用戶瀏覽網(wǎng)頁(yè)做任務(wù);
Jules,可以嵌入GitHub的編程Agent,使用自然語(yǔ)言描述問(wèn)題,就能直接生成可以合并到GitHub項(xiàng)目中的代碼;
游戲Agent,能夠?qū)崟r(shí)解讀屏幕畫(huà)面,直接在你打游戲的時(shí)候通過(guò)和你語(yǔ)音交流,給你AI打法提示。
據(jù)悉,Gemini 2.0 Flash及API免費(fèi)可用!可以通過(guò)Google AI Studio和Vertex AI中的Gemini API使用,基本不要錢,每分鐘最多15個(gè)提問(wèn),每天最多1500個(gè)提問(wèn)。明年初全面開(kāi)放。
谷歌Gemini 2.0炸裂功能Gemini 2.0 Flash是2.0家族第一個(gè)模型,主推原生多模態(tài)輸入輸出+Agent,速度比1.5 Pro快兩倍,關(guān)鍵性能指標(biāo)甚至超過(guò)了1.5 Pro!支持原生工具調(diào)用、以及實(shí)時(shí)音視頻流輸入等新功能。
速度更快,多模態(tài)、文本、代碼、視頻、空間理解和推理能力全面提升!新能力比如空間理解,視頻理解等可以通過(guò)Googele AI Studio的Starter Apps來(lái)體驗(yàn);
例如1,Gemini 2.0對(duì)空間的理解,利用Spatial Understanding,上傳一張圖片,Gemini快速進(jìn)行圖像中的物體檢測(cè)和標(biāo)注,并生成結(jié)構(gòu)化的數(shù)據(jù)(JSON格式)。它的設(shè)計(jì)直觀,用戶可以通過(guò)簡(jiǎn)單的交互操作快速獲得檢測(cè)結(jié)果。這種工具可能用于機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)準(zhǔn)備、圖像分析或計(jì)算機(jī)視覺(jué)研究等場(chǎng)景;
例如2,Gemini 2.0地圖交互,利用Map explorer,show一下世界上最有意思的大城市;
全新輸出模態(tài):支持文本、音頻和圖像的集成響應(yīng),多語(yǔ)言原生音頻輸出,8種高品質(zhì)語(yǔ)音,多種語(yǔ)言和口音!原生圖像輸出,還能進(jìn)行多輪編輯迭代直到生成滿意的圖像;
原生工具使用:Gemini 2.0可以直接調(diào)用Google搜索、代碼執(zhí)行等工具,還能通過(guò)函數(shù)調(diào)用使用自定義的第三方函數(shù)!
多模態(tài)實(shí)時(shí)API:支持實(shí)時(shí)音視頻流輸入,還能進(jìn)行語(yǔ)音活動(dòng)檢測(cè),甚至可以集成多個(gè)工具完成復(fù)雜任務(wù)!現(xiàn)在通過(guò)Stream Realtime就可以體驗(yàn);
例如,把電腦屏幕交給Gemini 2.0接管,它可以在你與模型實(shí)時(shí)交互的同時(shí)進(jìn)行搜索和編碼。
谷歌正在積極探索AI“代理”的應(yīng)用,目標(biāo)是打造能夠自主理解、規(guī)劃和執(zhí)行任務(wù)的智能助手。他們已經(jīng)推出了一系列Agent原型(目前僅供測(cè)試人員使用),展示了AI代理在不同領(lǐng)域的巨大潛力:
Jules,你的AI編程伙伴:想象一下,你的團(tuán)隊(duì)剛完成了一輪bug排查,一堆bug亟待修復(fù)。現(xiàn)在,你可以把Python和JavaScript的編碼任務(wù)交給Jules。它與你的GitHub工作流無(wú)縫集成,可以異步處理bug修復(fù)和其他耗時(shí)的任務(wù),讓你專注于核心開(kāi)發(fā)工作。Jules會(huì)創(chuàng)建全面的、多步驟的計(jì)劃來(lái)解決問(wèn)題,高效地修改多個(gè)文件,甚至能準(zhǔn)備pull requests,直接將修復(fù)提交到GitHub!更重要的是,Jules賦予開(kāi)發(fā)者更多自主權(quán):你可以隨時(shí)查看Jules創(chuàng)建的計(jì)劃,提供反饋或要求調(diào)整,并輕松審查和合并Jules編寫(xiě)的代碼。
Colab數(shù)據(jù)科學(xué)代理,你的AI分析師:繁瑣的數(shù)據(jù)分析Colab數(shù)據(jù)科學(xué)代理幫你搞定!只需用自然語(yǔ)言描述你的分析目標(biāo),Colab就能自動(dòng)生成一個(gè)完整的notebook,并在幾分鐘內(nèi)提供洞察。所有分析都基于一個(gè)可運(yùn)行的Colab notebook,保證結(jié)果的可靠性和可重復(fù)性。這將極大地加速你的研究和數(shù)據(jù)分析進(jìn)程。
Project Mariner,重新定義人機(jī)交互:Project Mariner旨在探索人機(jī)交互的未來(lái),從瀏覽器開(kāi)始。它是一個(gè)實(shí)驗(yàn)性的Chrome擴(kuò)展程序,可以讓AI代理在你的瀏覽器中執(zhí)行各種任務(wù),例如查找信息、填寫(xiě)表格、甚至與網(wǎng)站進(jìn)行交互。
Gemini Advance模式:谷歌在高級(jí)版中推出一項(xiàng)名為"深度研究"的新代理功能,這是一個(gè)研究助手,可以深入研究復(fù)雜的主題,并為你創(chuàng)建帶有相關(guān)來(lái)源鏈接的報(bào)告,感覺(jué)這是直接寫(xiě)科研論文的節(jié)奏。
游戲和其他領(lǐng)域的AI代理:DeepMind在游戲AI領(lǐng)域積累了豐富的經(jīng)驗(yàn),現(xiàn)在他們將Gemini 2.0應(yīng)用于游戲代理的開(kāi)發(fā)。例如,一個(gè)AI伙伴陪你一起玩游戲,還能提供專業(yè)的指導(dǎo),游戲體驗(yàn)將提升到一個(gè)全新的層次!更牛的是,這些代理還能連接到Google搜索,獲取海量的游戲知識(shí),成為你真正的游戲?qū)<遥∧壳,他們正與Supercell等游戲開(kāi)發(fā)商合作,在“部落沖突”和“卡通農(nóng)場(chǎng)”等游戲中測(cè)試這些代理。
谷歌推出突破性量子芯片谷歌9日宣布推出最新量子芯片Willow。谷歌首席執(zhí)行官孫達(dá)爾皮柴稱其為邁向打造實(shí)用量子計(jì)算機(jī)的重要一步。
谷歌在官方博客刊文說(shuō),Willow取得了兩項(xiàng)重大成就:首先,使用更多量子比特進(jìn)行擴(kuò)展,可大幅度減少錯(cuò)誤,解決了量子糾錯(cuò)領(lǐng)域近30年來(lái)一直試圖攻克的關(guān)鍵難題。另外,在標(biāo)準(zhǔn)基準(zhǔn)計(jì)算測(cè)試中,Willow展示了非常高的性能。
量子比特利用疊加態(tài)來(lái)進(jìn)行計(jì)算,對(duì)環(huán)境擾動(dòng)極其敏感。通常量子比特越多,發(fā)生的錯(cuò)誤就越多,而新研究有助解決這一難題。這一已發(fā)布在《自然》雜志上的研究顯示,在Willow芯片中使用的量子比特越多,系統(tǒng)的錯(cuò)誤率越低,“取得了‘低于閾值’的歷史性成就,即在增加量子比特?cái)?shù)量的同時(shí)降低錯(cuò)誤率”。
谷歌量子人工智能實(shí)驗(yàn)室創(chuàng)始人和領(lǐng)導(dǎo)者哈特穆特內(nèi)文說(shuō),作為第一個(gè)低于閾值的系統(tǒng),這是迄今為止最可信的可擴(kuò)展邏輯量子比特原型。Willow芯片的推出讓量子計(jì)算向商業(yè)應(yīng)用方向邁進(jìn)了一大步。下一步挑戰(zhàn)是展示量子芯片超越經(jīng)典計(jì)算機(jī),又能解決現(xiàn)實(shí)問(wèn)題的能力。
內(nèi)文還表示,谷歌首創(chuàng)的隨機(jī)電路采樣(RCS)基準(zhǔn),已被廣泛用于量子計(jì)算領(lǐng)域,是當(dāng)今量子計(jì)算機(jī)可完成的難度最高的經(jīng)典基準(zhǔn)。Willow基于該基準(zhǔn)取得了驚人表現(xiàn),在不到五分鐘的時(shí)間完成了當(dāng)今領(lǐng)先的超級(jí)計(jì)算機(jī)需要10的25次方年才能完成的計(jì)算,“這一令人難以置信的數(shù)字超出了物理學(xué)中已知的時(shí)間尺度,遠(yuǎn)遠(yuǎn)超過(guò)了宇宙年齡”。
內(nèi)文說(shuō),人工智能和量子計(jì)算將被證明是當(dāng)代最具變革性的兩項(xiàng)技術(shù),先進(jìn)的人工智能將從量子計(jì)算中受益匪淺。這也是他將實(shí)驗(yàn)室命名為量子人工智能的原因。
每日經(jīng)濟(jì)新聞綜合Google官網(wǎng)、公開(kāi)消息
每日經(jīng)濟(jì)新聞