當(dāng)前位置：人工智能實(shí)驗(yàn)室> 企業(yè)新聞 > Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-12 08:00:01 瀏覽：191次

導(dǎo)讀：每經(jīng)編輯：畢陸名在OpenAI宣布連發(fā)12天更新后，Google選擇12月11日深夜（在OpenAI發(fā)布更新之前），發(fā)布新模型Gemini 2.0。圖片來(lái)源：Google官網(wǎng)截圖在多次發(fā)布被OpenAI精準(zhǔn)狙擊后，Google扳回一局，發(fā)布了Gemini 2.0，直指Agent使用。Agent功能，也稱為智能體功能，通常指的是AI能夠感知環(huán)境、執(zhí)行任務(wù)并在一定程度上獨(dú)立做出決策的能力，也就是能更自動(dòng)化完成任務(wù)的功能。此次 ......

每經(jīng)編輯：畢陸名

在OpenAI宣布連發(fā)12天更新后，Google選擇12月11日深夜（在OpenAI發(fā)布更新之前），發(fā)布新模型Gemini 2.0。

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩

圖片來(lái)源：Google官網(wǎng)截圖

在多次發(fā)布被OpenAI精準(zhǔn)狙擊后，Google扳回一局，發(fā)布了Gemini 2.0，直指Agent使用。Agent功能，也稱為智能體功能，通常指的是AI能夠感知環(huán)境、執(zhí)行任務(wù)并在一定程度上獨(dú)立做出決策的能力，也就是能更自動(dòng)化完成任務(wù)的功能。

此次Google似乎賭對(duì)了。OpenAI凌晨?jī)牲c(diǎn)的發(fā)布，主要宣布了和Apple Intelligence的合作，一個(gè)普遍被期待能與Agent能力強(qiáng)相關(guān)的合作。

Google，則一次性發(fā)布了四個(gè)Agent相關(guān)的功能：

Project Astra，能夠在Gemini應(yīng)用中直接調(diào)用Google Lens和地圖功能幫用戶解決問(wèn)題；

Project Mariner（海員項(xiàng)目），Chrome瀏覽器的實(shí)驗(yàn)性功能，可以通過(guò)提示詞直接幫用戶瀏覽網(wǎng)頁(yè)做任務(wù)；

Jules，可以嵌入GitHub的編程Agent，使用自然語(yǔ)言描述問(wèn)題，就能直接生成可以合并到GitHub項(xiàng)目中的代碼；

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩

游戲Agent，能夠?qū)崟r(shí)解讀屏幕畫(huà)面，直接在你打游戲的時(shí)候通過(guò)和你語(yǔ)音交流，給你AI打法提示。

據(jù)悉，Gemini 2.0 Flash及API免費(fèi)可用！可以通過(guò)Google AI Studio和Vertex AI中的Gemini API使用，基本不要錢，每分鐘最多15個(gè)提問(wèn)，每天最多1500個(gè)提問(wèn)。明年初全面開(kāi)放。

谷歌Gemini 2.0炸裂功能Gemini 2.0 Flash是2.0家族第一個(gè)模型，主推原生多模態(tài)輸入輸出+Agent，速度比1.5 Pro快兩倍，關(guān)鍵性能指標(biāo)甚至超過(guò)了1.5 Pro！支持原生工具調(diào)用、以及實(shí)時(shí)音視頻流輸入等新功能。

速度更快，多模態(tài)、文本、代碼、視頻、空間理解和推理能力全面提升！新能力比如空間理解，視頻理解等可以通過(guò)Googele AI Studio的Starter Apps來(lái)體驗(yàn)；

例如1，Gemini 2.0對(duì)空間的理解，利用Spatial Understanding，上傳一張圖片，Gemini快速進(jìn)行圖像中的物體檢測(cè)和標(biāo)注，并生成結(jié)構(gòu)化的數(shù)據(jù)（JSON格式）。它的設(shè)計(jì)直觀，用戶可以通過(guò)簡(jiǎn)單的交互操作快速獲得檢測(cè)結(jié)果。這種工具可能用于機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)準(zhǔn)備、圖像分析或計(jì)算機(jī)視覺(jué)研究等場(chǎng)景；

例如2，Gemini 2.0地圖交互，利用Map explorer，show一下世界上最有意思的大城市；

全新輸出模態(tài)：支持文本、音頻和圖像的集成響應(yīng)，多語(yǔ)言原生音頻輸出，8種高品質(zhì)語(yǔ)音，多種語(yǔ)言和口音！原生圖像輸出，還能進(jìn)行多輪編輯迭代直到生成滿意的圖像；

原生工具使用：Gemini 2.0可以直接調(diào)用Google搜索、代碼執(zhí)行等工具，還能通過(guò)函數(shù)調(diào)用使用自定義的第三方函數(shù)！

多模態(tài)實(shí)時(shí)API：支持實(shí)時(shí)音視頻流輸入，還能進(jìn)行語(yǔ)音活動(dòng)檢測(cè)，甚至可以集成多個(gè)工具完成復(fù)雜任務(wù)！現(xiàn)在通過(guò)Stream Realtime就可以體驗(yàn)；

例如，把電腦屏幕交給Gemini 2.0接管，它可以在你與模型實(shí)時(shí)交互的同時(shí)進(jìn)行搜索和編碼。

谷歌正在積極探索AI“代理”的應(yīng)用，目標(biāo)是打造能夠自主理解、規(guī)劃和執(zhí)行任務(wù)的智能助手。他們已經(jīng)推出了一系列Agent原型（目前僅供測(cè)試人員使用），展示了AI代理在不同領(lǐng)域的巨大潛力：

Jules，你的AI編程伙伴：想象一下，你的團(tuán)隊(duì)剛完成了一輪bug排查，一堆bug亟待修復(fù)。現(xiàn)在，你可以把Python和JavaScript的編碼任務(wù)交給Jules。它與你的GitHub工作流無(wú)縫集成，可以異步處理bug修復(fù)和其他耗時(shí)的任務(wù)，讓你專注于核心開(kāi)發(fā)工作。Jules會(huì)創(chuàng)建全面的、多步驟的計(jì)劃來(lái)解決問(wèn)題，高效地修改多個(gè)文件，甚至能準(zhǔn)備pull requests，直接將修復(fù)提交到GitHub！更重要的是，Jules賦予開(kāi)發(fā)者更多自主權(quán)：你可以隨時(shí)查看Jules創(chuàng)建的計(jì)劃，提供反饋或要求調(diào)整，并輕松審查和合并Jules編寫(xiě)的代碼。

Colab數(shù)據(jù)科學(xué)代理，你的AI分析師：繁瑣的數(shù)據(jù)分析Colab數(shù)據(jù)科學(xué)代理幫你搞定！只需用自然語(yǔ)言描述你的分析目標(biāo)，Colab就能自動(dòng)生成一個(gè)完整的notebook，并在幾分鐘內(nèi)提供洞察。所有分析都基于一個(gè)可運(yùn)行的Colab notebook，保證結(jié)果的可靠性和可重復(fù)性。這將極大地加速你的研究和數(shù)據(jù)分析進(jìn)程。

Project Mariner，重新定義人機(jī)交互：Project Mariner旨在探索人機(jī)交互的未來(lái)，從瀏覽器開(kāi)始。它是一個(gè)實(shí)驗(yàn)性的Chrome擴(kuò)展程序，可以讓AI代理在你的瀏覽器中執(zhí)行各種任務(wù)，例如查找信息、填寫(xiě)表格、甚至與網(wǎng)站進(jìn)行交互。

Gemini Advance模式：谷歌在高級(jí)版中推出一項(xiàng)名為"深度研究"的新代理功能，這是一個(gè)研究助手，可以深入研究復(fù)雜的主題，并為你創(chuàng)建帶有相關(guān)來(lái)源鏈接的報(bào)告，感覺(jué)這是直接寫(xiě)科研論文的節(jié)奏。

游戲和其他領(lǐng)域的AI代理：DeepMind在游戲AI領(lǐng)域積累了豐富的經(jīng)驗(yàn)，現(xiàn)在他們將Gemini 2.0應(yīng)用于游戲代理的開(kāi)發(fā)。例如，一個(gè)AI伙伴陪你一起玩游戲，還能提供專業(yè)的指導(dǎo)，游戲體驗(yàn)將提升到一個(gè)全新的層次！更牛的是，這些代理還能連接到Google搜索，獲取海量的游戲知識(shí)，成為你真正的游戲?qū)＜遥∧壳�，他們正與Supercell等游戲開(kāi)發(fā)商合作，在“部落沖突”和“卡通農(nóng)場(chǎng)”等游戲中測(cè)試這些代理。

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩

谷歌推出突破性量子芯片谷歌9日宣布推出最新量子芯片Willow。谷歌首席執(zhí)行官孫達(dá)爾皮柴稱其為邁向打造實(shí)用量子計(jì)算機(jī)的重要一步。

谷歌在官方博客刊文說(shuō)，Willow取得了兩項(xiàng)重大成就：首先，使用更多量子比特進(jìn)行擴(kuò)展，可大幅度減少錯(cuò)誤，解決了量子糾錯(cuò)領(lǐng)域近30年來(lái)一直試圖攻克的關(guān)鍵難題。另外，在標(biāo)準(zhǔn)基準(zhǔn)計(jì)算測(cè)試中，Willow展示了非常高的性能。

量子比特利用疊加態(tài)來(lái)進(jìn)行計(jì)算，對(duì)環(huán)境擾動(dòng)極其敏感。通常量子比特越多，發(fā)生的錯(cuò)誤就越多，而新研究有助解決這一難題。這一已發(fā)布在《自然》雜志上的研究顯示，在Willow芯片中使用的量子比特越多，系統(tǒng)的錯(cuò)誤率越低，“取得了‘低于閾值’的歷史性成就，即在增加量子比特?cái)?shù)量的同時(shí)降低錯(cuò)誤率”。

谷歌量子人工智能實(shí)驗(yàn)室創(chuàng)始人和領(lǐng)導(dǎo)者哈特穆特內(nèi)文說(shuō)，作為第一個(gè)低于閾值的系統(tǒng)，這是迄今為止最可信的可擴(kuò)展邏輯量子比特原型。Willow芯片的推出讓量子計(jì)算向商業(yè)應(yīng)用方向邁進(jìn)了一大步。下一步挑戰(zhàn)是展示量子芯片超越經(jīng)典計(jì)算機(jī)，又能解決現(xiàn)實(shí)問(wèn)題的能力。

內(nèi)文還表示，谷歌首創(chuàng)的隨機(jī)電路采樣(RCS)基準(zhǔn)，已被廣泛用于量子計(jì)算領(lǐng)域，是當(dāng)今量子計(jì)算機(jī)可完成的難度最高的經(jīng)典基準(zhǔn)。Willow基于該基準(zhǔn)取得了驚人表現(xiàn)，在不到五分鐘的時(shí)間完成了當(dāng)今領(lǐng)先的超級(jí)計(jì)算機(jī)需要10的25次方年才能完成的計(jì)算，“這一令人難以置信的數(shù)字超出了物理學(xué)中已知的時(shí)間尺度，遠(yuǎn)遠(yuǎn)超過(guò)了宇宙年齡”。

內(nèi)文說(shuō)，人工智能和量子計(jì)算將被證明是當(dāng)代最具變革性的兩項(xiàng)技術(shù)，先進(jìn)的人工智能將從量子計(jì)算中受益匪淺。這也是他將實(shí)驗(yàn)室命名為量子人工智能的原因。

每日經(jīng)濟(jì)新聞綜合Google官網(wǎng)、公開(kāi)消息

每日經(jīng)濟(jì)新聞

相關(guān)熱詞： openai google 雙子座

上一篇：最長(zhǎng)還需7年！微軟AI CEO反駁奧特曼：當(dāng)前硬件不給力，AGI沒(méi)那么快

下一篇：Google深夜狙擊OpenAI：新Agent功能可以自己打開(kāi)瀏覽器查資料了

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-12 08:00:01 瀏覽：191次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門(mén)排行

推薦內(nèi)容

在線客服

熱門(mén)欄目HotCates

關(guān)于我們

版權(quán)聲明

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-12 08:00:01 瀏覽：191次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門(mén)排行

推薦內(nèi)容

在線客服

熱門(mén)欄目HotCates

關(guān)于我們

版權(quán)聲明

Google深夜狙擊OpenAI，Gemini 2.0登場(chǎng)！全面轉(zhuǎn)向Agent，多模態(tài)輸入輸出，免費(fèi)隨便玩
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-12 08:00:01 瀏覽：191次