劃重點(diǎn)
01Perplexity聯(lián)合創(chuàng)始人兼CEO Aravind Srinivas在2024 Disrupt大會(huì)上回應(yīng)了AI抄襲和內(nèi)容來(lái)源爭(zhēng)議,表示公司一直標(biāo)注來(lái)源,不擁有內(nèi)容所有權(quán)。
02他解釋了AI原生搜索的本質(zhì),指出Perplexity與谷歌搜索的不同之處,以及公司在創(chuàng)作者利益保護(hù)、AI成本等方面的考慮。
03此外,Aravind Srinivas表示,盡管與一些科技巨頭有合作意向,但公司目前尚未收到他們的收購(gòu)邀約。
以上內(nèi)容由大模型生成,僅供參考
作者|Jessica郵箱|JessicaZhang@pingwest.com過(guò)去三天,美國(guó)科技媒體TechCrunch主辦的2024 Disrupt大會(huì)在舊金山Moscone中心進(jìn)行。這一硅谷原生、全球知名的老牌科技創(chuàng)投盛會(huì),今年在AI持續(xù)席卷下熱度更甚,吸引了上萬(wàn)名來(lái)自世界各地初創(chuàng)企業(yè)和投資機(jī)構(gòu)的參會(huì)者。
在總共300多個(gè)環(huán)節(jié)里,明星AI搜索獨(dú)角獸公司Perplexity聯(lián)合創(chuàng)始人兼CEOAravind Srinivas罕見(jiàn)現(xiàn)身的一場(chǎng)對(duì)話,讓最大的Disrupt Stage分會(huì)場(chǎng)觀眾席爆滿,堪稱(chēng)最受歡迎舞臺(tái)之一。
圖源:TechCrunch在Aravind接受TechCrunch高級(jí)編輯Devin Coldewey訪談的半個(gè)小時(shí)里,兩人貼臉開(kāi)大,上來(lái)就提起近期把Perplexity推到風(fēng)口浪尖的AI抄襲和內(nèi)容來(lái)源爭(zhēng)議,Aravind還對(duì)Perplexity被道瓊斯集團(tuán)起訴侵權(quán)做出正面回應(yīng);接著兩人聊到AI原生搜索本質(zhì)、Perplexity開(kāi)發(fā)新功能的理念、與谷歌的比較、創(chuàng)作者利益保護(hù)、AI成本以及公司融資。Devin甚至把能叫上名字的科技巨頭都過(guò)了一遍,挨個(gè)問(wèn)Perplexity有沒(méi)有收到他們的收購(gòu)邀約。
一邊是老媒體人的犀利敏銳,提問(wèn)基本不留余地。另一邊是新銳創(chuàng)始人的亦攻亦守,不緊不慢卻未有讓步。全程直給,涉及的話題熱點(diǎn)很多,信息量頗大。
圖源:硅星人以下是硅星人在大會(huì)現(xiàn)場(chǎng)給大家?guī)?lái)的對(duì)話實(shí)錄,敬請(qǐng)享用:
Delvin Coldewey:感謝你能參與!我想先問(wèn)一個(gè)很直接的問(wèn)題:你的公司如何定義“抄襲”?這有點(diǎn)突然,但我想要一個(gè)明確的答案。
Aravind Srinivas:其實(shí)你可以直接問(wèn)Perplexity。我們公司的定義其實(shí)和“抄襲”是什么有關(guān)。Perplexity一直都會(huì)標(biāo)注來(lái)源,我們不會(huì)聲稱(chēng)擁有任何內(nèi)容的所有權(quán)。它實(shí)際上是從網(wǎng)絡(luò)上獲取內(nèi)容,進(jìn)行總結(jié),以便用戶能夠消化這些信息,并提供信息的來(lái)源。這就像記者或?qū)W術(shù)人士的工作一樣,只要有正確的引用文獻(xiàn)部分就可以。
Delvin Coldewey:不過(guò)從學(xué)術(shù)角度來(lái)說(shuō),研究人員會(huì)創(chuàng)作一篇原創(chuàng)論文,并在文中使用引用來(lái)支持自己的觀點(diǎn),而不是簡(jiǎn)單地復(fù)制已有的內(nèi)容。
Aravind Srinivas:嗯,有時(shí)候,某個(gè)新聞媒體首先報(bào)道了一則新聞,隨后另一家媒體引用該新聞,并提到“據(jù)某某報(bào)道”,這算抄襲嗎?
Delvin Coldewey:但有些人可能會(huì)發(fā)帖子,說(shuō)“他們是這樣說(shuō)的”,然后幾天后你可以看到一篇文章,其中直接用了8到15個(gè)單詞,看起來(lái)幾乎就是從原文抄來(lái)的,有點(diǎn)像那種情況。
Aravind Srinivas:是的,我們的確不是每句話都精準(zhǔn)標(biāo)注了確切的引用。但要非常明確的是,我們?cè)?022年12月7日發(fā)布了這個(gè)產(chǎn)品,大概是兩年前。當(dāng)時(shí)大家都在用ChatGPT檢查內(nèi)容是否是最新的,我們是唯一一個(gè)能夠提供參考文獻(xiàn)的AI產(chǎn)品,其他的產(chǎn)品并沒(méi)有引用功能。我們從一開(kāi)始就關(guān)注這個(gè)問(wèn)題,并且不斷改進(jìn),以便在模型檢測(cè)到特定來(lái)源時(shí)能更加清楚地標(biāo)注。
Delvin Coldewey:我能看出你非常重視這個(gè)問(wèn)題。從一開(kāi)始你們就展示了引用功能,而不是隨口一說(shuō)。我認(rèn)為重新定義“抄襲”是很有必要的,只有明確了“抄襲”的定義,才能有效防止AI生成的內(nèi)容涉及抄襲行為。如果我將別的內(nèi)容直接復(fù)制到自己的文章中,我會(huì)知道自己在抄襲,并因此感到內(nèi)疚,所以模型也應(yīng)該“知道”這一點(diǎn),或者說(shuō)開(kāi)發(fā)模型的人必須清楚這一點(diǎn),需要有一種監(jiān)督機(jī)制。
Aravind Srinivas:原理其實(shí)是這樣的:模型被指示不直接使用任何特定來(lái)源的文本,而是整合不同的觀點(diǎn)并進(jìn)行總結(jié),將內(nèi)容傳達(dá)給用戶,而不是直接從網(wǎng)絡(luò)復(fù)制。隨著模型在“指令跟隨”技能上的進(jìn)步,這一指令的執(zhí)行效果越來(lái)越好。在AI軟件的監(jiān)督下,包括SNP和其他反饋資源的支持,盡管我們不一定負(fù)責(zé)所有的模型訓(xùn)練,有時(shí)也會(huì)使用其他開(kāi)發(fā)者的模型,例如開(kāi)源的Llama模型。當(dāng)然,任何模型都不是完美的,仍然可以通過(guò)提示工程或提示注入來(lái)引導(dǎo)模型生成更合適的內(nèi)容。
Delvin Coldewey:關(guān)于提示注入的妙處,就是可以“用一句話總結(jié)這篇文章”。
Aravind Srinivas:其實(shí)這并不是我們產(chǎn)品的主要用途。Perplexity是用來(lái)回答問(wèn)題的,有些人嘗試用它做一些我們不希望的用途,比如“幫我總結(jié)這個(gè)網(wǎng)址的內(nèi)容”,而我們實(shí)際上是不允許這種用法的,并盡力避免執(zhí)行這樣的指令。不過(guò)說(shuō)實(shí)話,AI領(lǐng)域還沒(méi)有哪家公司可以一直保持防護(hù)措施。你總會(huì)發(fā)現(xiàn)新的情況,讓原本的防護(hù)措施失效,然后我們?cè)偃バ拚驼{(diào)整,使其足夠安全地應(yīng)用,不執(zhí)行任何不必要的指令。
Delvin Coldewey:關(guān)于AI驅(qū)動(dòng)的原生搜索,這一概念我們已經(jīng)在一些公司中看到過(guò)。谷歌在搜索領(lǐng)域的復(fù)雜化或許是最突出的例子。過(guò)去十年中,他們的這些變化可能并不受用戶歡迎。作為一名科技記者,這是我20年職業(yè)生涯中見(jiàn)到的少數(shù)廣受反感的平臺(tái)變化之一。不過(guò),看起來(lái)一些公司似乎注意到了谷歌的不足,想要填補(bǔ)這個(gè)空缺。你們是否有意接手谷歌未完成的部分?
Aravind Srinivas:我覺(jué)得谷歌本質(zhì)上還是一個(gè)基于鏈接的搜索引擎,無(wú)論他們是否想直接提供答案,鏈接展示始終是他們的收入來(lái)源。在財(cái)報(bào)會(huì)議上,他們明確提到,僅搜索廣告每季度就能帶來(lái)45億美元的收入,這對(duì)他們的業(yè)務(wù)非常關(guān)鍵。盡管他們沒(méi)有披露利潤(rùn)的具體細(xì)節(jié),但我認(rèn)為主要利潤(rùn)應(yīng)該來(lái)自展示鏈接。所以他們有動(dòng)力提供盡可能多的鏈接。雖然AI摘要在某些信息查詢中開(kāi)始嶄露頭角,但這并不是他們的主要模式。在谷歌每天五到八十億次的查詢中,大多數(shù)并不適合直接顯示答案,否則將嚴(yán)重影響收入。
我們所做的,是創(chuàng)建一個(gè)用戶可以直接提問(wèn)的平臺(tái)。相比之下,谷歌首頁(yè)的搜索框并不是為了直接回答問(wèn)題而設(shè)計(jì)的。谷歌的查詢平均詞數(shù)大約在2到3個(gè)之間,而Perplexity的查詢則多在10到11個(gè)詞,顯然,Perplexity的用戶更傾向于直接提問(wèn),而谷歌用戶大多是查找一些簡(jiǎn)短的關(guān)鍵詞,比如“某位亞洲明星”或“舊金山天氣”等。
Delvin Coldewey:我很好奇你們的一些應(yīng)用場(chǎng)景。最近幾周你們?cè)谕铺厣习l(fā)布了大量的功能和用例,大約50個(gè)新功能,比如體育比賽功能。你們的數(shù)據(jù)是直接來(lái)自NFL,還是從別的地方獲取的?
Aravind Srinivas:我們通過(guò)與數(shù)據(jù)來(lái)源合作而獲得相關(guān)數(shù)據(jù),并加以處理。我們會(huì)確保數(shù)據(jù)準(zhǔn)確,嚴(yán)格保證直接性和可靠性。
Delvin Coldewey:所以這是讓人們搜索“今天海鷹隊(duì)的比分”之類(lèi)的內(nèi)容嗎?還是他們想要過(guò)去20場(chǎng)NFL比賽的比分分析?
Aravind Srinivas:更像是后者的情況。我們希望Perplexity成為一個(gè)用戶可以隨時(shí)提問(wèn)并獲得準(zhǔn)確回答的地方。起初,我們的用戶群體多是學(xué)術(shù)和研究導(dǎo)向的用戶,就像早期的Facebook主要面向?qū)W生,Amazon則以圖書(shū)起家。類(lèi)似地,Perplexity在起步時(shí)吸引了許多學(xué)術(shù)、研究和知識(shí)導(dǎo)向的用戶,但我們希望擴(kuò)展到更廣泛的用戶群體。體育信息看似與知識(shí)無(wú)關(guān),但實(shí)際上有很多體育迷喜歡深入分析數(shù)據(jù),研究比賽,了解特定球員或球隊(duì)的表現(xiàn)。如果用戶錯(cuò)過(guò)了一場(chǎng)比賽,我們可以提供比分之外的實(shí)況評(píng)論、對(duì)比分析等更有深度的內(nèi)容。
Delvin Coldewey:就像我說(shuō)的,你們發(fā)布了很多新功能,幾乎每隔一段時(shí)間就會(huì)冒出一個(gè)新功能。你們有具體的策略,還是采用“散彈槍”策略,推出十個(gè)產(chǎn)品,看哪幾個(gè)最終會(huì)被用戶接受你們是在尋找對(duì)用戶真正有價(jià)值的功能嗎?
Aravind Srinivas:我們真地會(huì)仔細(xì)查看用戶日志,了解他們?cè)谠儐?wèn)什么。實(shí)際上,在推出體育功能之前,我們優(yōu)先考慮了金融領(lǐng)域,因?yàn)樵S多用戶在進(jìn)行市場(chǎng)研究、投資組合管理、加密貨幣和投資策略等方面的研究,同時(shí)也關(guān)注股票相關(guān)新聞。我們會(huì)觀察哪些領(lǐng)域可以提供更好的服務(wù),而不僅僅滿足表面需求。體育也是類(lèi)似的情況,有很多用戶關(guān)心體育數(shù)據(jù),而有時(shí)還會(huì)出現(xiàn)“幻覺(jué)”現(xiàn)象,比如在疫情期間,確保比賽數(shù)據(jù)的準(zhǔn)確性就變得尤為重要。
我們的目標(biāo)是覆蓋用戶習(xí)慣使用的搜索引擎上已有的各類(lèi)內(nèi)容,這樣他們就沒(méi)有理由回到傳統(tǒng)的搜索界面。要改變用戶已有幾十年的使用習(xí)慣并不容易,但如果這是未來(lái)的趨勢(shì),我們就必須下功夫去滿足他們的日常搜索需求,無(wú)論是軟件開(kāi)發(fā)幫助、研究規(guī)劃,還是學(xué)術(shù)資源管理。我們還需要在本地化搜索、體育、天氣、購(gòu)物和旅行等方面繼續(xù)努力。
圖源:TechCrunchDelvin Coldewey:在那個(gè)訴訟案中,道瓊斯(《華爾街日?qǐng)?bào)》母公司)提到你們的Perplexity是“內(nèi)容抄襲王國(guó)”。你們?cè)诠_(kāi)回應(yīng)中說(shuō),媒體公司可能希望這項(xiàng)技術(shù)不存在。但我覺(jué)得這樣說(shuō)不對(duì),因?yàn)槟銈兒汀敦?cái)富》雜志、《時(shí)代》周刊都有合作,原告也和OpenAI有合作。會(huì)不會(huì)是因?yàn)樗麄儾幌矚g你們提供的合作安排?
Aravind Srinivas:他們聲稱(chēng)我們沒(méi)有回應(yīng),但事實(shí)上我們當(dāng)天就回應(yīng)了。我希望大家能理解,我們的意圖是合作、溝通,共同推進(jìn)。
Delvin Coldewey:那么,如果你們真的要與他們探討合作安排,具體會(huì)是什么樣的?我很好奇這些分享機(jī)制,你們打算如何共享內(nèi)容?
Aravind Srinivas:我們推出了一個(gè)叫“Perplexity Publisher Program”的項(xiàng)目,幾個(gè)月前已經(jīng)上線。該項(xiàng)目的核心理念是嚴(yán)格管理內(nèi)容授權(quán),分為兩種情況:第一類(lèi)公司使用全網(wǎng)數(shù)據(jù)訓(xùn)練大型模型,這些模型會(huì)內(nèi)化所有文本數(shù)據(jù),并隨著規(guī)模的擴(kuò)大不斷優(yōu)化;而第二類(lèi)公司只在特定查詢時(shí)實(shí)時(shí)使用網(wǎng)絡(luò)內(nèi)容進(jìn)行摘要,并不用于訓(xùn)練模型本身。我們向出版商解釋我們屬于第二種類(lèi)型,這與第一類(lèi)模型需要為內(nèi)容授權(quán)支付費(fèi)用不同。針對(duì)第二類(lèi)公司,我們?cè)O(shè)計(jì)了不同的合作結(jié)構(gòu)。
目前,幾乎沒(méi)有其他公司提出類(lèi)似的方案。我們的思路是通過(guò)廣告收入來(lái)支持合作,因?yàn)槲覀儽举|(zhì)上是一個(gè)搜索產(chǎn)品。雖然我們直接獲取內(nèi)容來(lái)回答用戶的問(wèn)題,但我們?nèi)詫儆诖蟊娛袌?chǎng)的搜索領(lǐng)域,廣告可以帶來(lái)可觀的收入。不同于傳統(tǒng)搜索引擎,我們承諾會(huì)在查詢層面與出版商共享廣告收入。也就是說(shuō),如果我們?cè)谀炒尾樵冎蝎@得了廣告收入,而您的內(nèi)容作為答案的一部分被引用,我們會(huì)分享相應(yīng)的收入。隨著我們業(yè)務(wù)的增長(zhǎng)和廣告盈利的增加,這種合作模式將為選擇加入我們的出版商帶來(lái)重要的收益。
Delvin Coldewey:我覺(jué)得你們應(yīng)該知道,出版商們的想法是,當(dāng)有人在Perplexity上引用了我的文章內(nèi)容時(shí),他們并沒(méi)有直接點(diǎn)擊我的文章進(jìn)行閱讀,這樣我們就失去了維持生存所需的流量和收入。說(shuō)到底,新聞出版方的回應(yīng)往往是:“你們說(shuō)自己不與我們競(jìng)爭(zhēng),但實(shí)際上你們確實(shí)是在競(jìng)爭(zhēng)! 你對(duì)此怎么回應(yīng)?
Aravind Srinivas:我們不是一個(gè)新聞產(chǎn)品。沒(méi)有人會(huì)來(lái)Perplexity獲取每日新聞。
Delvin Coldewey:那為什么你們還需要引用這些內(nèi)容呢?
Aravind Srinivas:用戶來(lái)到這里是為了理解信息的含義。比如,一條關(guān)于GPU黑市交易的新聞,可能導(dǎo)致用戶思考:“在這種情況下,我是否應(yīng)該繼續(xù)購(gòu)買(mǎi)NVIDIA的股票?”這些問(wèn)題并不是直接在新聞源上可以找到答案的,而是在Perplexity上可以進(jìn)一步分析的。同時(shí),用戶并不是來(lái)Perplexity閱讀新聞的,而是會(huì)直接去新聞源查看。這其實(shí)是兩個(gè)不同的產(chǎn)品,但我們需要花時(shí)間讓人們理解這個(gè)區(qū)別。還有一些網(wǎng)站可以直接粘貼網(wǎng)址并提取其內(nèi)容,而這并不是我們要做的事情。
Delvin Coldewey:那么對(duì)于那些內(nèi)容創(chuàng)作者,比如制作YouTube視頻、撰寫(xiě)文章、出版書(shū)籍的人,他們?nèi)绾螀⑴c進(jìn)來(lái)呢?他們?cè)撊绾螌?shí)現(xiàn)盈利?像谷歌、YouTube這種平臺(tái)已經(jīng)有成熟的盈利方式了。
Aravind Srinivas:我們的出版商計(jì)劃歡迎所有人加入。除了共享廣告收入,我們還幫助出版商在他們的平臺(tái)上建立AI助手或其他AI工具,讓用戶可以直接在網(wǎng)站上搜索內(nèi)容。例如,用戶在閱讀一篇文章時(shí),可能會(huì)有進(jìn)一步的問(wèn)題,我們會(huì)提供API積分支持,同時(shí)向所有媒體公司的員工免費(fèi)提供Perplexity的企業(yè)版訂閱服務(wù)。我們相信,我們的工具可以讓內(nèi)容創(chuàng)作更高效,特別是在做背景調(diào)查和事實(shí)核查時(shí),Perplexity已成為一個(gè)廣泛使用的研究工具,能幫助用戶更輕松地完成深度研究。
Delvin Coldewey:我很感謝你們的解答,盡管在獲取來(lái)源的方式上我們可能仍存在一些分歧。接下來(lái)我想提到版權(quán)問(wèn)題。這個(gè)領(lǐng)域相當(dāng)復(fù)雜,是一個(gè)前所未有的知識(shí)產(chǎn)權(quán)法律難題,因此幾乎沒(méi)有現(xiàn)成的先例。所以是否有可能在某些情況下,無(wú)意中觸犯到版權(quán)法?
Aravind Srinivas:我已經(jīng)在我的博客里回應(yīng)過(guò)了,在任何法律下我們都會(huì)捍衛(wèi)自己。
Delvin Coldewey:你覺(jué)得法律需要做出改變嗎,讓IP保護(hù)更寬松?
Aravind Srinivas:其實(shí)關(guān)于版權(quán)已經(jīng)有很多明確的法律程序了,現(xiàn)行的版權(quán)法很多,并且已經(jīng)有判例確立了事實(shí)本身不受版權(quán)保護(hù)。
Delvin Coldewey:當(dāng)然沒(méi)錯(cuò),但問(wèn)題不只是關(guān)于事實(shí)。
Aravind Srinivas:我們都不是律師,所以在這里無(wú)法解決這個(gè)爭(zhēng)議。我認(rèn)為事實(shí)應(yīng)該平等分發(fā)給每一個(gè)人。設(shè)想一下,如果科學(xué)家們宣稱(chēng)擁有某些事實(shí)的權(quán)利,而其他人無(wú)法傳播這些知識(shí)與真相,那將是一個(gè)什么樣的世界。(臺(tái)下一大片掌聲)
圖源:硅星人Delvin Coldewey:好,不說(shuō)事實(shí)問(wèn)題了。為什么你們要籌集那么多資金?
Aravind Srinivas:AI的成本很高。目前GPU和數(shù)據(jù)中心都很昂貴,我們希望未來(lái)能降低成本,但現(xiàn)在開(kāi)發(fā)這些模型需要大量投入,提供這些服務(wù)的公司需要通過(guò)收費(fèi)來(lái)回收成本。我們觀察到,API成本大約每4到5個(gè)月就會(huì)下降一半,如果這一趨勢(shì)能再持續(xù)一兩年,我們的模型成本將可能降低10到50倍,這對(duì)我們這樣的成長(zhǎng)型公司來(lái)說(shuō)是極大的利好。
我們可以專(zhuān)注于增長(zhǎng),同時(shí)在短期內(nèi)管理成本,因?yàn)槲覀冎莱杀緯?huì)逐步下降。在這個(gè)過(guò)程中,我們也在摸索長(zhǎng)期可持續(xù)的收入模式。我們認(rèn)為AI產(chǎn)品的變現(xiàn)方式不僅限于訂閱服務(wù),雖然訂閱模式對(duì)很多公司來(lái)說(shuō)效果很好,我們也有不錯(cuò)的表現(xiàn),但我們認(rèn)為還有其他更好的方式,比如按使用量收費(fèi),而不是僅僅靠月費(fèi)。
Delvin Coldewey:你覺(jué)得能從谷歌手里搶到一些收入嗎?
Delvin Coldewey:最后一個(gè)簡(jiǎn)短問(wèn)題,我列出幾個(gè)公司名,你來(lái)回答是否收到過(guò)這些科技公司的收購(gòu)邀約,只需要給我一個(gè)“是”或“不是”準(zhǔn)備好了嗎?OpenAI?
Aravind Srinivas:無(wú)可奉告。
Delvin Coldewey:微軟?
Aravind Srinivas:無(wú)可奉告。
Delvin Coldewey:谷歌?
Aravind Srinivas:絕對(duì)沒(méi)有!
(Delvin又問(wèn)了Notion、Amazon、Meta、Elon Musk,Aravind的回答全是“無(wú)可奉告”,即便他和馬斯克“是朋友”。)
Delvin Coldewey:好吧,算了哈哈。
你今天早些時(shí)候發(fā)推文提到你的綠卡申請(qǐng)問(wèn)題。對(duì)于那些在類(lèi)似情況下經(jīng)營(yíng)著數(shù)十億公司,但像你一樣還沒(méi)拿到綠卡的人,你有什么建議?這真得很讓人震驚。
Aravind Srinivas:我的意思不是我就應(yīng)該因此獲得所有優(yōu)待。我對(duì)此有一些基本理解,美國(guó)移民系統(tǒng)對(duì)每個(gè)國(guó)家每年有固定的移民配額,而我來(lái)自印度,很多印度人希望移民美國(guó),加上疫情造成的積壓,這是進(jìn)展緩慢的主要原因。我只是希望通過(guò)表達(dá)這個(gè)問(wèn)題,引發(fā)一些關(guān)注。
Delvin Coldewey:感謝你和我們分享。