網(wǎng)景公司創(chuàng)始人 Marc Andreessen 曾說過:瀏覽器可以說是有史以來對人們生活影響最大的一個(gè)軟件。
無論桌面 PC 世代還是智能手機(jī)世代的用戶,都離不開瀏覽器這個(gè)工具它太過重要,甚至可以說是互聯(lián)網(wǎng)迄今為止最重要的發(fā)明。在互聯(lián)網(wǎng)過去三十年的數(shù)次時(shí)代變遷中屹立不倒。
但這不意味著瀏覽器在 AI 時(shí)代中不會發(fā)生改變:據(jù) The Information 報(bào)道,OpenAI 正在打造一款與 ChatGPT 深度整合的網(wǎng)絡(luò)瀏覽器工具,并且已經(jīng)就 ChatGPT 在網(wǎng)頁交互上的功能整合,與旅游、食品、房地產(chǎn)以及零售等主要網(wǎng)站服務(wù)商進(jìn)行了溝通。
OpenAI 已經(jīng)組建相關(guān)團(tuán)隊(duì)計(jì)劃開發(fā)「AI 瀏覽器」|圖片來源:The Information
除此之外,OpenAI 在近幾個(gè)月已經(jīng)挖來了 Google Chrome 創(chuàng)始團(tuán)隊(duì)成員 Ben Goodger:他同時(shí)也是 Firefox 的首席工程師,這意味著 OpenAI 可能已經(jīng)為 AI 瀏覽器項(xiàng)目可組建了相關(guān)的團(tuán)隊(duì)。
關(guān)于 AI 瀏覽器這個(gè)概念,其實(shí)我們已經(jīng)不陌生:如果你是一個(gè) Mac 用戶,又恰好是一個(gè)效率工具愛好者,那你肯定聽說過 Arc 瀏覽器這款產(chǎn)品:這是一款基于 chromium 內(nèi)核打造的第三方瀏覽器。它將瀏覽器的平臺化應(yīng)用做到了極致,旨在幫助用戶「靈活調(diào)度所有網(wǎng)頁內(nèi)容」,并由此衍生出了自己獨(dú)特的標(biāo)簽頁管理與交互邏輯。
這套如同效率工具一般的邏輯經(jīng)過瀏覽器的功能整合,迅速收獲眾多擁躉,開發(fā)團(tuán)隊(duì) The Browser Company 也在 2024 年以 5.5 億美元的估值,融資 5000 萬美元。
但在似乎一切都在向好的方向前進(jìn)時(shí),開發(fā)團(tuán)隊(duì)卻自己選擇按下了終止鍵,選擇另起爐灶,原因無他,只是開發(fā)團(tuán)隊(duì)認(rèn)為「能在 AI 時(shí)代用戶喜愛的瀏覽器應(yīng)該是別的樣子」。
無獨(dú)有偶,從 2024 年秋開始,諸如 Claude 3.5 發(fā)布的 computer use、Google 泄露了下一代瀏覽器工具 Project Jarvis 這樣基于瀏覽器人機(jī)交互流程優(yōu)化的產(chǎn)品相繼誕生。
似乎在近兩年的生成式 AI 浪潮后,終于輪到我們最熟悉的瀏覽器被 AI 來「升級」了。但 AI 瀏覽器,究竟會以一種怎樣的面貌出現(xiàn)在我們的設(shè)備中?
01
Arc 走過的彎路
2024 年 10 月底,按照 The Browser Company 聯(lián)合創(chuàng)始人的 Josh Miller 在公告視頻中公布的信息,盡管 Arc 在過去一年中用戶數(shù)量增長了四倍,但其復(fù)雜性和獨(dú)特性使其難以成為主流產(chǎn)品。
因此,團(tuán)隊(duì)決定不再在現(xiàn)有產(chǎn)品上進(jìn)行改進(jìn),而是著手開發(fā)一款全新的瀏覽器,旨在從根本上改變用戶與網(wǎng)絡(luò)的互動方式,成為一個(gè)更具主動性和智能化的平臺。
我用 ChatGPT 翻譯了一下,Josh Miller 說的話意思大概就是「Arc 瀏覽器現(xiàn)在挺好的,但我們覺得這不是我們想要的未來,因此我們不會繼續(xù)更新它了」。
這種「棄坑聲明」一般的內(nèi)容即使被包裝的像是「新產(chǎn)品發(fā)布預(yù)告」,不出意外還是被網(wǎng)友普遍理解成了:
「給 Arc 瀏覽器出殯」。
即使創(chuàng)始人將這個(gè)「下一步」吹的天花亂墜,但不難想象這樣一通騷操作肯定犯了眾怒尤其是那些伴隨著 Arc 瀏覽器一路走來的老用戶們。
在 Josh Miller 發(fā)布的視頻評論區(qū),高贊評論幾乎全是關(guān)于吐槽這份宣言,因?yàn)樗韧趯?Arc 瀏覽器宣判死刑:即使是當(dāng)下,Arc 也并沒有做到真正意義上的完美,它還有著眾多的問題需要修補(bǔ)。
視頻下評論區(qū)用戶對于「棄坑聲明」的吐槽 | 圖片來源:YouTube 評論區(qū)
能讓開發(fā)團(tuán)隊(duì)冒著如此風(fēng)險(xiǎn)去開發(fā)的新產(chǎn)品,足見這次「轉(zhuǎn)向」在 The Browser Company 眼中的重要性:按照 Josh 在視頻中的說法:他們認(rèn)為 AI 能力「即將徹底改變?yōu)g覽器」,因此他們要做的新產(chǎn)品也將會是再一次顛覆瀏覽器使用體驗(yàn)的一款產(chǎn)品。
雖然罵聲一片,但對于打造了 Arc 瀏覽器這樣明星產(chǎn)品的團(tuán)隊(duì)來講,在光環(huán)圍繞的情況下保持清醒激流勇退,尤其是從創(chuàng)業(yè)公司的角度,確實(shí)稱得上是做「難但正確的事」。
站在此時(shí)反思,其實(shí) Arc 瀏覽器雖然一開始標(biāo)榜「讓每一個(gè)用戶都能高效使用瀏覽器」,但實(shí)際上在誕生后兩年多的迭代中,Arc 瀏覽器逐漸偏離了這個(gè)目標(biāo):過多的新元素同時(shí)也意味著高昂的工具學(xué)習(xí)成本,Arc 被很多用戶詬病的「上手困難」,很多習(xí)慣了 Chrome 的用戶對于切換到這樣一款新產(chǎn)品的興趣并不強(qiáng)。
或許也是因?yàn)榭吹搅?Arc 瀏覽器現(xiàn)在存在的這種問題,開發(fā)團(tuán)隊(duì)在預(yù)告他們的下一款瀏覽器產(chǎn)品時(shí),表示「讓(上手的)前 90 秒變得毫不費(fèi)力」將會是全新瀏覽器的重要特征。
這幾乎已經(jīng)是在明示在這款全新的瀏覽器中「用AI能力幫你快速上手」將會是主要賣點(diǎn):Arc 瀏覽器至今存在的「評價(jià)兩極分化」,也是在一定程度上解釋了用戶并非不需要效率工具,而是在不希望在這個(gè)過程中本末倒置,為了學(xué)習(xí)使用效率工具花費(fèi)更多的成本。
不只是 Arc 瀏覽器,實(shí)際上在 2024 年,包括 Google Apple 這樣的系統(tǒng)大廠都在做相應(yīng)的功能跟進(jìn),「用 AI 幫你接管繁瑣的初步設(shè)置」這個(gè)概念已經(jīng)初具規(guī)模:這些功能如同一個(gè)帶你參觀房子的向?qū)В粌H能替你解答其中的具體問題,更能在背景中,自動根據(jù)用戶的個(gè)人喜好,將眾多設(shè)置選項(xiàng)調(diào)整至完美的狀態(tài)。
iOS18.1 中,Apple intelligence 能力可以自動幫助用戶完成部分手機(jī)設(shè)置 | 圖源:Apple 官網(wǎng)
02
「在信息的海洋中滑行」
回顧互聯(lián)網(wǎng)歷史,幾乎每一個(gè)十年的互聯(lián)網(wǎng)操作體驗(yàn)變革,背后都有瀏覽器產(chǎn)品之王易主的影子。
瀏覽器在很多時(shí)候是構(gòu)成互聯(lián)網(wǎng)體驗(yàn)的重要窗口,因此瀏覽器的操作變革一直走在互聯(lián)網(wǎng)工具更新的最前沿:從 1994 年網(wǎng)景打造的 Mosaic 瀏覽器占據(jù)當(dāng)時(shí) 80% 的市場份額,到微軟通過 Windows 預(yù)裝 IE 瀏覽器迅速成為新時(shí)代的霸主,再到新世紀(jì)初 Firefox、Chrome 為代表的操作效率與移動端革命,瀏覽器的一次次革命,都如同預(yù)言般奠定了未來數(shù)年的互聯(lián)網(wǎng)技術(shù)發(fā)展趨勢。
雖然大模型能力已經(jīng)成為所有人公認(rèn)、即將改變互聯(lián)網(wǎng)面貌的重要技術(shù)革命,但作為工具的瀏覽器似乎在這一輪演變中慢了一拍:以 OpenAI 為代表的第三方大模型廠商通過直接抓取網(wǎng)頁信息,給出用戶反饋的方式,大有取代瀏覽器成為新時(shí)代互聯(lián)網(wǎng)最主要交互工具的趨勢。
目前的 Arc 瀏覽器中,其實(shí)已經(jīng)能看到不少 AI 功能的身影:比如直接在網(wǎng)頁中提問問題,Arc 瀏覽器就能根據(jù)網(wǎng)頁中顯示的內(nèi)容給出最相關(guān)的信息整合反饋,以及瀏覽器中對于 ChatGPT 的整合,網(wǎng)頁/下載文件自動重命名等功能。
尤其是在誕生時(shí)間更短的手機(jī)版 Arc Search 上,開發(fā)團(tuán)隊(duì)還設(shè)計(jì)了「捏合總結(jié)網(wǎng)頁信息」的功能:只需要在手機(jī)屏幕上捏合網(wǎng)頁,Arc Search 就能自動調(diào)用語言模型能力,幫你匯總網(wǎng)頁中的內(nèi)容并整理一份摘要。以及 AI 搜索功能:搜索后不會返回傳統(tǒng)搜索引擎的詞條,而是參考至少六個(gè)相關(guān)網(wǎng)頁內(nèi)容,然后以總結(jié)的形式精準(zhǔn)給你一個(gè)關(guān)于你的問題的答案。
移動端 Arc Search App 的 AI 搜索功能 | 圖片來源:The Brower company
如果這些都不算開發(fā)團(tuán)隊(duì)眼中的「AI 瀏覽器」,那真正的 AI 瀏覽器應(yīng)該是什么樣,就成了新的問題:按照 The Brower company 的介紹,他們已經(jīng)花了五年的時(shí)間在這款產(chǎn)品的開發(fā)上,當(dāng)下 Arc 的平臺化能力將會繼續(xù)成為全新瀏覽器產(chǎn)品的特征之一。
雖然 LLM 如今明顯有「取代搜索引擎」的趨勢,但這并不代表瀏覽器將會在下一個(gè)時(shí)代中被淘汰。相反瀏覽器作為 AI 能力平臺的屬性將會進(jìn)一步得到強(qiáng)化:當(dāng)前 Chrome 瀏覽器的第三方插件應(yīng)用商店中,就已經(jīng)能看到不少調(diào)用第三方語言模型能力的插件。
目前已經(jīng)能在 Chrome 瀏覽器中調(diào)用 Claude 的插件|圖片來源:Chrome 應(yīng)用商店
Google 目前尚未發(fā)布的 Project Jarvis,據(jù)稱也是一款利用 Gemini 2.0 能力,改變用戶與網(wǎng)頁內(nèi)容的交互的一款插件工具。
Josh 在視頻中提到,他設(shè)想中的、屬于 AI 時(shí)代的瀏覽器應(yīng)該有的體驗(yàn),應(yīng)該是他在舊金山乘坐 Waymo 自動駕駛出租車服務(wù)時(shí),有過的那種「在物理世界中輕盈滑過」的感覺。
具體到互聯(lián)網(wǎng)世界,這顯然就是「瀏覽器應(yīng)該幫助用戶從網(wǎng)頁中高效提取有用的信息」,甚至幫助用戶完成一些必要的交互:例如填寫相關(guān)的賬號、地址等信息。
類似的概念其實(shí)不只局限于瀏覽器:Claude 3.5 發(fā)布的 Computer Use 功能,其實(shí)已經(jīng)能實(shí)現(xiàn)初步的「電腦接管」,例如你提問「幫我匯總最近的數(shù)碼新聞」,它可以自動完成「打開瀏覽器 - 輸入關(guān)鍵字 - 總結(jié)反饋內(nèi)容 - 生成一份日歷視圖的表格」這樣的流程。
但 Computer Use 目前暴露出的問題,其實(shí)也與瀏覽器有關(guān):例如當(dāng)你想要執(zhí)行一個(gè)「幫我查詢機(jī)票最低價(jià)格并預(yù)定一個(gè)旅游套餐」時(shí),不僅涉及到「搜索 - 反饋」的動作,其中還涉及到大量「輸入個(gè)人信息/銀行賬號」這樣的驗(yàn)證信息,類似 Claude 這樣的自然語言機(jī)器人,難以順暢地完成其中所有關(guān)鍵操作。
Conputer Use 自動幫你訂票時(shí),涉及到用戶信息填充的部分仍然比較繁瑣|圖片來源:Anthropic
從這一步其實(shí)已經(jīng)能看出,如果類似的功能是瀏覽器本身自帶,這樣的問題就都能迎刃而解實(shí)際上,Google Project Jarvis 目前已經(jīng)泄露的消息中,就已經(jīng)出現(xiàn)了類似的功能:作為 Google 官方發(fā)布的產(chǎn)品,Project Jarvis 的官方介紹是「您上網(wǎng)沖浪時(shí)的有用伴侶」。不僅有可能完全基于端側(cè)運(yùn)行,而且能在確保用戶數(shù)據(jù)安全的情況下,幫助用戶處理更多涉及到諸如賬號密碼、相冊分類,內(nèi)容查找等基于瀏覽器實(shí)現(xiàn)、包含大量用戶隱私數(shù)據(jù)的操作。
在掌握了足夠的事實(shí)信息以及用戶數(shù)據(jù)后,如今還不具備多少可行性的「直接幫我買某某產(chǎn)品」,實(shí)現(xiàn)的可能性就急劇提升:由于不少人依賴瀏覽器訂閱服務(wù)以及訂購各種數(shù)字產(chǎn)品,瀏覽器已經(jīng)事實(shí)上成為很多人的信用卡與密碼管理工具。
此外,由于有了瀏覽器本身的支持,讀取各種網(wǎng)頁內(nèi)容,就再也不用像 Claude 3.5 那樣,需要依賴多模態(tài)識別屏幕截圖,效率極低地完成各種操作:這個(gè)難題,包括 Apple 與微軟這樣的操作系統(tǒng)級廠商都難以解決,而瀏覽器作為訪問網(wǎng)頁內(nèi)容的「窗口」,本身就掌握著網(wǎng)頁最為豐富的原始信息,不僅能夠提升操作效率,也能大大提升操作準(zhǔn)確率。
這些操作,在開發(fā)術(shù)語中需要借助大量的瀏覽器 API 接口,才有可能獲得,而 Arc 瀏覽器此前作為遵循平臺化思想開發(fā)的一款瀏覽器產(chǎn)品,實(shí)際上就已經(jīng)初步具備了這樣「接管用戶數(shù)據(jù)」的能力,接下來能做的,顯然是讓瀏覽器「想用戶所想」,并最終進(jìn)化成為一款「替做用戶盡可能做更多想做的事」的這樣一款工具。
聽起來很美好,但實(shí)際上關(guān)于「瀏覽器在 AI 工具的浪潮中何去何從」的討論,如今才剛剛?cè)计鹦切侵穑翰粌H有 Chrome 這樣瀏覽器巨頭的早期探索,也有類似 OpenAI、Anthropic 這樣試圖完全顛覆瀏覽器操作體驗(yàn)的廠商,Arc 瀏覽器團(tuán)隊(duì)的「急轉(zhuǎn)向」,也恰恰表明了他們要第一批加入這場競爭的信心。
在 AI 能力的支持下,瀏覽器能做的,顯然不只是如同 ChatGPT 一樣,總結(jié)并返回搜索結(jié)果這樣簡單。
但目前,隨著 Arc 瀏覽器的停止更新,有一件事已經(jīng)塵埃落定:至少在今天,我們需要最新銳的團(tuán)隊(duì),投入到對下一代瀏覽器的探索,而不是再來一場「瀏覽器的文藝復(fù)興」。
但目前,隨著 Arc 瀏覽器的停止更新,以及 OpenAI、The Browser Company 這樣的團(tuán)隊(duì)全力投入「AI 瀏覽器」的開發(fā)之中,關(guān)于這個(gè)話題的結(jié)論已經(jīng)塵埃落定:
無論巨頭還是創(chuàng)業(yè)公司,其瀏覽器產(chǎn)品想要在 AI 時(shí)代中繼續(xù)生存下去,對 AI 瀏覽器的探索必不可少。