文 | 逐浪
生活中,越來越難找到打開搜索引擎的理由了。
吃飯有點評軟件,出行有導航地圖,看新聞有資訊APP,購物有網(wǎng)購平臺,聊天有社交媒體。越來越多搜索行為正從傳統(tǒng)搜索框轉移向一個個獨立的APP。
傳統(tǒng)搜索引擎的優(yōu)勢蕩然無存,處境尷尬。而AI浪潮的來臨,讓傳統(tǒng)搜索有了新的進化方向。
OpenAI正式上線ChatGPT的實時搜索功能;谷歌宣布其“雙子座”AI模型將整合谷歌搜索功能;百度的AI智能回答,對文心大模型日均調用量超6億次。
一場AI時代的搜索新“戰(zhàn)事”正在上演,但AI搜索能否在用戶生活中,提供足夠“必要”的價值,仍是一個值得商榷的問題。
被拋棄的傳統(tǒng)搜索引擎
一直以來,百度都長時間占據(jù)著中國互聯(lián)網(wǎng)搜索領域的主導者位置。但隨著用戶搜索行為的多元化,傳統(tǒng)搜索引擎的用戶正在逐漸流失。
年輕人們在微博搜明星動態(tài)、熱點新聞,在抖音和快手消耗瑣碎時間,在小紅書尋找經(jīng)驗攻略。
今年6月,釘釘總裁葉軍曾在一場企業(yè)家論壇上談到搜索變革,他表示,搜索場景已經(jīng)被變革掉了,百度也得馬上跟進,如果再不跟進,大家也不會用百度了。
搜索的前提,是平臺有足夠的內(nèi)容,滿足用戶的信息需求。PC時代,所有內(nèi)容通過網(wǎng)頁展示,傳統(tǒng)搜索引擎依賴爬蟲技術,抓取互聯(lián)網(wǎng)上的網(wǎng)頁,然后進行清洗和排序。當用戶輸入查詢的詞條后,搜索引擎會根據(jù)其算法對網(wǎng)頁進行排序,并將結果展示給用戶。爬蟲抓取的信息數(shù)量越多,質量越好,傳統(tǒng)搜索引擎的體驗就越高。
而在移動互聯(lián)網(wǎng)時代,互聯(lián)網(wǎng)入口變?yōu)槭謾C上一個個APP,各APP廠商不愿意再將左右生死的流量權,交給搜索引擎,便高筑墻,深挖溝,將爬蟲擋在門外,并加強運營機制,將優(yōu)質內(nèi)容、獨家內(nèi)容留在門內(nèi)。于是,移動互聯(lián)網(wǎng)時代,各APP內(nèi)容孤島化嚴重,信息從此不再“互聯(lián)”。
流量的走向,重塑著新的互聯(lián)網(wǎng)格局。但傳統(tǒng)搜索處境下滑的同時,各獨立APP的搜索量與日俱增。
小紅書有將近70%的月活用戶有搜索行為,1/3的月活用戶打開小紅書的第一件事就是直奔搜索;2023年,抖音生活服務搜索GMV增長254%,商品搜索GMV增長143.8%;2024年第二季度,使用快手搜索的月活躍用戶近5億,同時單日搜索次數(shù)同比增長超20%。更不用說微博的熱搜,憑借搜索,締造了一個又一個頂流話題。
就目前而言,傳統(tǒng)搜索引擎已經(jīng)落后于時代,其本質原因,在于搜索引擎并不生產(chǎn)內(nèi)容,只是內(nèi)容的搬運工,而搜索內(nèi)容的需求已經(jīng)被內(nèi)容方滿足。
生成式AI的誕生,給了傳統(tǒng)搜索引擎更沉重一擊,人們不再需要在搜索結果中,尋找所需信息,AI已可以通過自然對話方式,代替思考,提供答案。
人們直接跳過“搜索”,直達信息的彼岸。
之于搜索引擎,這是鶴頂紅,卻也是回魂丹。受威脅最大的傳統(tǒng)搜索引擎,成為生成式AI最忠誠的擁躉。
2023年初,微軟宣布與OpenAI合作,推出了由AI驅動的Bing搜索引擎和Edge瀏覽器。
同年5月,谷歌推出由生成式AI驅動的搜索引擎。谷歌稱,這是谷歌搜索引擎多年來最大規(guī)模的一次革新。
2023年8月,昆侖萬維推出了國內(nèi)第一款AI搜索引擎,2個月后,百度也將旗下的簡單搜索升級為AI互動式搜索引擎,在搜索頁面內(nèi)置文心一言大模型技術。
今年6月,360公司正式發(fā)布了“360AI搜索”和“360AI瀏覽器”;同一個月,知乎發(fā)布AI搜索產(chǎn)品“知乎直答”;7月,夸克升級了“超級搜索框”,推出以AI搜索為中心的一站式AI服務。
行業(yè)出現(xiàn)了“無AI,不搜索”的趨勢,并且各大廠商為AI搜索賦予重任。
生成式AI,正在生成傳統(tǒng)搜索的未來。
AI搜索難當大任
AI搜索引擎與傳統(tǒng)搜索引擎有著顯著的區(qū)別。
傳統(tǒng)搜索引擎像一個圖書館的目錄卡,用戶需要提供書的具體書名或作者,才能找到書的位置。AI搜索引擎更像一個圖書管理員,用戶只需要告訴它大概的信息,它就能找到相關的書,并總結書中的主要內(nèi)容。
而且,AI搜索還不局限于文字,能理解和索引視頻、圖片、語音等內(nèi)容。還能實現(xiàn)了AI寫作、AI文件總結等操作。
但AI搜索的發(fā)展似乎并不順利。以上一切全新體驗的前提,在于搜索的結果,務必精準。
谷歌 AI搜索上線不久后就鬧出了不少笑話。很多用戶都反映,AI搜索在“胡言亂語”。
一位用戶向谷歌AI搜索提問“我每天應該吃多少塊石頭”,得到的回答是“根據(jù)加州大學伯克利分校地質學家的說法,人們每天應該至少吃一塊小石頭”。
在今年的百度世界2024大會上,百度發(fā)布檢索增強的文生圖技術iRAG,可結合百度搜索的圖片資源,消除大模型,生成各種超真實的圖片,“去除了機器味兒”。
而在媒體復刻發(fā)布會所展示的“愛因斯坦與天壇合影”指令時,大模型仍然出現(xiàn)錯誤幻覺:原本三層護欄,變成了四層甚至五層。
就目前而言,AI搜索生成答案的準確性和可靠性依舊難以保證、容易出現(xiàn)事實錯誤,且生成的內(nèi)容缺乏深度、無法提供有效的溯源。
諾貝爾經(jīng)濟學獎得主保羅克魯格曼曾在社交媒體上批評了當前的人工智能,稱它比沒用還糟糕,“有很多關于谷歌和其他搜索引擎退化的消息。這是真的,讓我的工作變得困難”。
同時,AI的濫用還在加劇互聯(lián)網(wǎng)信息的混亂,產(chǎn)生很多無效信息、虛假信息,混淆了正常搜索的結果。
今年1月,江西南昌的一家MCN利用AI工具日產(chǎn)7000篇文章。文章內(nèi)容真假混雜,甚至引發(fā)了網(wǎng)傳西安有巨大爆炸聲的謠言。
溫州公安最近也抓捕了一位網(wǎng)絡作者。該作者利用AI工具批量改寫網(wǎng)絡文章,發(fā)布到信息平臺從而獲得文章收益,最終造成了諸多不良的社會影響。
伴隨著AI工具的普及,AI制造的無用、虛假信息的數(shù)量也越來越多。
清華大學新聞學院的報告稱,近一年來,經(jīng)濟與企業(yè)類AI謠言,增速高達99.91%。谷歌研究人員也發(fā)現(xiàn)生成式AI造成的虛假信息正在互聯(lián)網(wǎng)上泛濫成災。
雖然,目前AI引發(fā)的內(nèi)容風險還沒有上升到“威脅生存”的地步,但按照AI的發(fā)展趨勢來看,這種偽造或篡改的信息會越來越多。
最終導致互聯(lián)網(wǎng)的信息更加混亂,使得真實與虛假之間的界限模糊。
甚至AI自己,也將在越發(fā)低質的語料庫中停止進化與生長。
信息荒漠時代
隨著 AI 生成的錯誤和無意義的信息會不斷累積,互聯(lián)網(wǎng)的錯誤、無用信息占比會逐步增加。
清華大學新聞學院新媒體研究中心主任、跨學科知名學者沈陽說,AI生成的內(nèi)容急劇增加,大量自媒體文章的內(nèi)容由AI自動生成,而AI幻覺產(chǎn)生的錯誤就夾雜在這些文章當中,這也會造成整個互聯(lián)網(wǎng)的內(nèi)容質量進一步下降,導致數(shù)據(jù)質量的整體下降。這種現(xiàn)象被稱為“數(shù)據(jù)退化”。
AI的訓練和學習需要大量的網(wǎng)絡信息,但大量虛假和無意義的信息只會讓AI陷入混亂,產(chǎn)生錯誤觀念。
不止如此,AI除了要面臨劣質內(nèi)容的侵害,還面臨優(yōu)質底層信息的短缺。
研究公司 Epoch AI表示,到2028年,文字資料將會被消耗殆盡。而這些數(shù)據(jù)是人類在在過去幾個世紀里,創(chuàng)作的大量文字、視頻。
也有人試圖用AI生成的信息訓練AI,但結果并不美好。國外的科學家發(fā)現(xiàn),如果 AI 只學習其他 AI 生成的內(nèi)容,那么經(jīng)過幾代訓練后,AI 將輸出無意義的垃圾信息。
他們把這種現(xiàn)象稱為“模型崩潰”。
當前正處于信息大爆炸時代,我們所有人都被大量的信息所包圍,但是對于AI而言,這是一個數(shù)據(jù)匱乏的時代。
對AI而言,誰能幫助AI擺脫信息匱乏的窘相,誰就掌握了AI發(fā)展的未來。為此,OpenAI、Anthropic、百度等公司都在積極開發(fā)更優(yōu)質的合成數(shù)據(jù),以此克服挑戰(zhàn)。但大多數(shù)學者都持悲觀態(tài)度。
今年11月,有外媒報道,OpenAI下一代旗艦模型“獵戶座”(Orion)的性能提升幅度,小于GPT-4相對GPT-3的提升。
其創(chuàng)始人奧特曼曾表示,可能不會把新模型命名為GPT-5。
多位專家勸說AI公司停止訓練大模型,“如果當前趨勢持續(xù),人工智能很快就會耗盡其可用的訓練數(shù)據(jù)。面對這種情況,AI公司可以選擇停止追求規(guī)模更大、更復雜的模型。”
AI是當前互聯(lián)網(wǎng)進步的主要動力之一,尤其是對搜索引擎而言,誰能突破AI的限制,誰就掌握了搜索市場的未來。
只是,這杯慶功酒遙遙無期。