文|于麗麗
百川智能創(chuàng)始人王小川是她的第一個(gè)老板,清華大學(xué)計(jì)算機(jī)系教授唐杰是她的項(xiàng)目老師,而她還是月之暗面幾位創(chuàng)始人的本科輔導(dǎo)員。在中國(guó)大模型的AI應(yīng)用創(chuàng)業(yè)者中,大概很少有人像許丹青一樣,如此醒目地穿梭于中國(guó)底座大模型的人物關(guān)系圖譜中。當(dāng)然,這一切都抵不過她與大模型的另一種因緣:在2022年ChatGPT誕生那天(中國(guó)時(shí)間12月1日),她也生了自己的第一個(gè)孩子。對(duì)于一名女性創(chuàng)業(yè)者來說,某種意義上,這也是一種天意般的召喚。而更理性的一種考量,則是她是當(dāng)下最適合做AI+金融這件事的人之一。早在2009年的大三,許丹青就師從清華大學(xué)人工智能實(shí)驗(yàn)室馬少平教授,基于社交與新聞數(shù)據(jù),用深度學(xué)習(xí)的方法,做金融市場(chǎng)預(yù)測(cè)相關(guān)的研究。之后,她不僅以一作身份發(fā)表2篇人工智能頂級(jí)會(huì)議論文,還在2012年獲得全球西貝爾學(xué)者獎(jiǎng)。畢業(yè)后,許丹青先在搜狗做AI助手,后轉(zhuǎn)戰(zhàn)金融科技領(lǐng)域十余年,在小米以及通聯(lián)數(shù)據(jù)等公司,一直嘗試著如何把AI技術(shù)和金融場(chǎng)景更好地結(jié)合。2024年春節(jié),許丹青創(chuàng)立金融領(lǐng)域的AI原生應(yīng)用公司智策領(lǐng)航。前不久,智策領(lǐng)航拿到百川的戰(zhàn)略投資,成為百川投資的第一家AI應(yīng)用公司。目前已推出產(chǎn)品財(cái)搭子,小程序版也已上線。關(guān)于如何給z世代投資者重新定義一個(gè)嶄新的投資工具,以及一個(gè)AI+金融的應(yīng)用公司該如何在大廠、大模型公司以及傳統(tǒng)金融公司的縫隙中突圍,許丹青有自己的思考和理解。以下是她的口述:
最早的三份TS2023年2月,還沒休完產(chǎn)假,我就返回通聯(lián)數(shù)據(jù)工作。這時(shí),唐杰老師找到我,希望我加入智譜AI。早年我在清華大學(xué)計(jì)算機(jī)系讀書時(shí),唐杰就是我的項(xiàng)目老師,當(dāng)時(shí)會(huì)一起參與很多學(xué)術(shù)會(huì)議。智譜早期創(chuàng)業(yè)時(shí),我們也有過很多交流。那天,我們聊得很深入。他和我講述了他做智譜長(zhǎng)達(dá)5-10年的愿景,他對(duì)AGI的信仰非常懇切,深深感染了我,驅(qū)使我自己去思考未來10年我的人生使命是什么;卮鸷眠@個(gè)問題,我差不多用了一年時(shí)間。過去10年金融科技領(lǐng)域的經(jīng)驗(yàn)告訴我,AI這件事一定要和場(chǎng)景結(jié)合才能發(fā)光發(fā)熱。所以我決定自己創(chuàng)業(yè)做AI+金融的第一批原生應(yīng)用。2024年春節(jié)后,我快速組建了一個(gè)5人的核心團(tuán)隊(duì)。然后我找到唐杰老師,詢問他能否支持我。他說沒問題。智譜當(dāng)時(shí)有面向初創(chuàng)公司提供投資和技術(shù)等資源支持的z計(jì)劃,由于當(dāng)時(shí)還是孵化基金,只能跟投,他就讓我去了解下市場(chǎng)情況。聊了四五家后,我拿到三份TS。先是投了很多AI公司的一家一線基金。他們的管理合伙人在移動(dòng)互聯(lián)網(wǎng)時(shí)代是非常有前瞻性的預(yù)言家。我們聊了很多關(guān)于MOE模型架構(gòu)、金融領(lǐng)域特殊性以及AI應(yīng)用生態(tài)的內(nèi)容。對(duì)標(biāo)上一代移動(dòng)互聯(lián)網(wǎng)的發(fā)展趨勢(shì),他告訴我未來需要走很長(zhǎng)的路,要儲(chǔ)備好自己的彈藥、耐心以及預(yù)期,確保自己先上場(chǎng),并一直留在場(chǎng)上。之后我?guī)熃惆盐医榻B給了清華大學(xué)創(chuàng)新科技投資平臺(tái)慕華科創(chuàng),她剛好也是百川的首輪投資者,因此,慕華科創(chuàng)和百川決定共同投資我們。其實(shí)我和川總也相識(shí)頗久。早在2012年左右,我還在清華大學(xué)讀研究生時(shí),他就在我們的人工智能實(shí)驗(yàn)室讀博。后來,2013-2015年,加入搜狗后,他是我的第一個(gè)老板。當(dāng)時(shí)我們團(tuán)隊(duì)在搜狗的創(chuàng)新項(xiàng)目心有靈犀(也就是后來的靈犀助手)做算法,連續(xù)兩年都因?yàn)樽龀隽司薮笫杖胴暙I(xiàn),獲得搜狗的CEO大獎(jiǎng)。也因此,他對(duì)我印象非常深。在基座層,我們并沒有選擇綁定任何一家基座模型,我們使用自有的業(yè)務(wù)數(shù)據(jù)微調(diào)了自己的模型。在應(yīng)用側(cè),我們搭建了一個(gè)靈活的模型路由,用不同的大模型基座完成不同任務(wù)。 我們調(diào)用Baichuan4做數(shù)據(jù)結(jié)構(gòu)化任務(wù),調(diào)用智譜的All tools完成函數(shù)調(diào)用與觀點(diǎn)打分類任務(wù),調(diào)用Kimi完成長(zhǎng)文本的專家觀點(diǎn)總結(jié)類任務(wù),調(diào)用deepseek完成長(zhǎng)鏈路推理類任務(wù)。同時(shí)我們使用自有模型進(jìn)行跨模型的協(xié)作與反思任務(wù)。階躍的與財(cái)聯(lián)社的合作場(chǎng)景,是我們對(duì)標(biāo)benchmark之一。除此外,我們也會(huì)把很多深度分析任務(wù)交給claude 3.5完成,雖然它不如國(guó)產(chǎn)模型的價(jià)格便宜。至于大廠的一些產(chǎn)品,像千問我們會(huì)把它作為重要的開源補(bǔ)充項(xiàng)目。至于豆包,因?yàn)樵缙谖覀儨y(cè)過效果不太好,后來因?yàn)槿耸稚,也沒再去研究。
定義一個(gè)好的AI時(shí)代的投資工具
我們最想做的是幫z世代的年輕投資者重新定義一個(gè)專業(yè)且簡(jiǎn)單的投資工具。洞察來自我們發(fā)現(xiàn),很多傳統(tǒng)的金融信息產(chǎn)品像同花順、東方財(cái)富基本都是面向30-49歲的成熟投資者,而20-35歲的年輕投資者,信息交互方式已發(fā)生天翻地覆的變化,需求卻沒有被很好地滿足。我們就想能否做一個(gè)AI時(shí)代的投資領(lǐng)域的小紅書,財(cái)搭子就是在這樣的思考下誕生的。前一段我們一直在內(nèi)測(cè),來了數(shù)量遠(yuǎn)超預(yù)期的年輕用戶。財(cái)搭子的交互形態(tài)類似小紅書,以圖文與輕社交為主,聚焦在投資信息和后信息的表達(dá)與交互上。所謂信息一定要客觀,不是主觀小作文。后信息是說,過去資訊只是資訊,發(fā)布后是另一群人在點(diǎn)評(píng)。AI時(shí)代可以對(duì)實(shí)時(shí)新聞做解讀,并將之和用戶的關(guān)聯(lián)統(tǒng)一表達(dá)出來。大模型帶來的很多變量,可以解決過去金融中的很多痛點(diǎn),這也是讓我最興奮的地方。一是它可以讓專業(yè)簡(jiǎn)單化。傳統(tǒng)意義上,專業(yè)的內(nèi)容往往是復(fù)雜的,比如估值模型需要excel插件來實(shí)現(xiàn),需要你懂dcf模型,需要一堆關(guān)鍵假設(shè)。而AI可以讓用戶只掌握幾個(gè)簡(jiǎn)單的核心邏輯就夠了。二是可以讓靜態(tài)知識(shí)動(dòng)態(tài)化。大模型深度推理能力與專家知識(shí)庫思維鏈(CoT)能力的結(jié)合,可以讓一個(gè)專家觀點(diǎn)實(shí)時(shí)和一個(gè)具體的問題結(jié)合起來,讓靜態(tài)知識(shí)變成動(dòng)態(tài)過程。所以你可以看到但斌或者巴菲特的歷史思維鏈,從而將用戶的持倉問題與專家的投資風(fēng)格進(jìn)行匹配與實(shí)時(shí)生產(chǎn)。 此外,AI也可以模擬專業(yè)投資者的思維方式,做可解釋、可理解的推理。過去我們?cè)谧隽眍悢?shù)據(jù)產(chǎn)品化過程中,通常只能將所有的文本數(shù)據(jù)進(jìn)行情感打分,比如利空、中性、利空等,而AI可以對(duì)連續(xù)的文本以及多模態(tài)信息進(jìn)行整體判斷,這是過去做不到的。這些變量足夠?qū)ν顿Y工具進(jìn)行重新定義,而且會(huì)是大于現(xiàn)有市場(chǎng)十倍甚至百倍的機(jī)會(huì)。這里邊很多改變是革命性的。像個(gè)人投資者,過去就是小散,支付了全市場(chǎng)的錢,卻得到最少的信息,屬于信息食物鏈的最底端。而一些大的機(jī)構(gòu),則通過支付高昂的費(fèi)用,享受到很多買方分析師、賣方分析師等專家服務(wù)。而大模型讓個(gè)人投資者用更低的價(jià)格,享受到原來封閉鏈條中的專家團(tuán)隊(duì)提供的知識(shí)服務(wù),這也是一個(gè)專家知識(shí)的普惠化和平權(quán)化的過程。
每個(gè)人每天都應(yīng)該有一個(gè)prompt(提示詞)
這一代AI2.0跟之前一個(gè)非常大的區(qū)別就是個(gè)性化表達(dá)與個(gè)性化的任務(wù)處理。上代AI帶來了推薦算法。這套算法里,就是人和信息這兩個(gè)維度不停去做協(xié)同過濾。這個(gè)過程中,它是一個(gè)平臺(tái)邏輯,為了優(yōu)化人的信息的點(diǎn)擊率和收入,提高平臺(tái)效率,一個(gè)人是被符號(hào)化的,會(huì)被無數(shù)的tag和標(biāo)簽所代替。
我們的產(chǎn)品財(cái)搭子不做推薦平臺(tái),我們都圍繞極致個(gè)性化。在傳統(tǒng)的人與信息層面增加一個(gè)新的對(duì)齊維度,就是每個(gè)人當(dāng)下的投資人設(shè)。它被具象成一個(gè)prompt,每個(gè)人都不一樣,每天更新,提供一個(gè)人與信息的可解釋性、可交互性和投資價(jià)值觀的對(duì)齊。原來的推薦,你不想看,只能點(diǎn)一個(gè)我不看了,這個(gè)過程中其實(shí)人很多時(shí)候是很無助的,但現(xiàn)在我們?cè)谌撕托畔⒅性O(shè)置了抽象一層,相當(dāng)于我能夠把人和信息的表達(dá)可視化出來,而不僅僅是原來那些符號(hào)化的東西。 當(dāng)然,極致個(gè)性化也會(huì)帶來成本。每個(gè)人、每一天都要計(jì)算的話,對(duì)應(yīng)的推理成本、能耗和時(shí)間都會(huì)巨大,就像李開復(fù)老師經(jīng)常會(huì)提到的TC-PMF,是強(qiáng)調(diào)在開發(fā)和應(yīng)用過程中必須綜合考慮技術(shù)的可行性、成本可控性以及產(chǎn)品市場(chǎng)的契合度一樣,我們也會(huì)做好平衡,在追求個(gè)性化的同時(shí),追求極致工業(yè)化。 很多人會(huì)問,市面上很多傳統(tǒng)的金融服務(wù)提供商,像同花順有問財(cái),wind有智能助理Alice,為什么還需要我們來做這件事?我們的答案是這是一件屬于顛覆的、AI原生應(yīng)用來做的事。很多傳統(tǒng)公司要考慮短期投入ROI,需要對(duì)抗組織慣性。即便孵化一個(gè)新產(chǎn)品,也需要重新調(diào)整組織架構(gòu)和客戶架構(gòu),這都是風(fēng)險(xiǎn)很高的事,何況讓用戶對(duì)過去的傳統(tǒng)產(chǎn)品改變心智,也是很難的一件事。所有的革新都需要新的組織形態(tài),這也是我選擇創(chuàng)業(yè)的原因。做AI應(yīng)用,很多人會(huì)擔(dān)心隨著模型能力的變化,很可能被大廠或者大模型公司狙擊或者吞噬。但金融行業(yè)有很大的特殊性,對(duì)高質(zhì)量的合成數(shù)據(jù)以及場(chǎng)景的獎(jiǎng)勵(lì)函數(shù)都有很高要求,這些都是底座大模型或大廠無法完成的。另外,我們對(duì)于數(shù)據(jù)的積累、對(duì)于用戶的理解都是獨(dú)特的。用戶在我們這里不斷詢問問題,或者觀看、瀏覽或者留言,隨著交互越來越多,我們會(huì)越來越了解他的個(gè)性。所以我們的壁壘是逐級(jí)構(gòu)建的,也是不可被替代的。這是未來十年我們最想做的一件事,盡管會(huì)很難,但還是希望我們構(gòu)建的信息飛輪可以給Z時(shí)代的年輕投資者,在不確定的投資市場(chǎng)帶來陪伴和確定性。
圖片來源 |IC Photo