不瞞大家說(shuō), AI 已經(jīng)全面融入差評(píng)了。
當(dāng)然,并不是說(shuō)現(xiàn)在這篇稿子,就是用 AI 生成的,而是 AI 已經(jīng)幫編輯部解決了不少那些看似簡(jiǎn)單,但卻確實(shí)有些關(guān)鍵的要緊事兒。
就比如大伙們可能想不到,雖然差評(píng)編輯部日常的工作的是拖寫稿,但在幾年前,咱們公司里其實(shí)是有專職的程序員的。
特別是在公眾號(hào)后臺(tái)排版時(shí),差評(píng)有自己專屬排版格式,但秀米這類的工具第三方其實(shí)不夠用,程序小哥就給咱順手開(kāi)發(fā)了個(gè)排版插件,能一鍵排版。
后面因?yàn)闃I(yè)務(wù)調(diào)整,插件暫時(shí)也沒(méi)啥 BUG 要修,頭發(fā)越來(lái)越茂密的程序員小哥,也選擇了離開(kāi)。
但后面的幾年,咱們的排版格式每年都在更新,微信后臺(tái)也在各種改版,隨著時(shí)間的推移,這個(gè)插件越來(lái)越難滿足大家的需求,各種小 BUG 也冒了出來(lái)。
一方面編輯部同事們的代碼水平不夠硬,另一方面相比市面上的其他產(chǎn)品,這個(gè)插件依舊是最接近差評(píng)文章格式要求的工具。
所以,就連程序員小哥自己都沒(méi)想到,自個(gè)兒已經(jīng)離職了三年,我們還在繼續(xù)用著這個(gè)插件。
而在去年的年底,在后程序員時(shí)代,我們終于給這個(gè)排版插件,來(lái)了一次遲到的更新。
當(dāng)然,編輯部并不是花錢重新請(qǐng)了個(gè)程序員,也不是編輯們的代碼水平突飛猛進(jìn),而是一位完全對(duì)代碼零基礎(chǔ)的同事,抱著試一試的心態(tài),用 AI 寫了代碼,上架了 Chrome 應(yīng)用商店,完成了這一波更新。
而現(xiàn)在,我們都稱他為差評(píng)張小龍。
只能說(shuō)誰(shuí)也沒(méi)想到,一直在 Debug the world 的我們,最后卻靠著 AI Debug 了差評(píng)自己的 Bug 。。。
另外,編輯部其實(shí)還一直有個(gè)甜蜜的煩惱,困擾了大家好多年。
大伙們都知道,公眾號(hào)自帶的搜索功能突出的,就是一個(gè)進(jìn)步空間巨大。
不僅文章不好搜索,數(shù)據(jù)閱讀量超過(guò)十萬(wàn)的文章,公眾號(hào)在前臺(tái)還只會(huì)顯示 10w+ ,具體的閱讀是十萬(wàn)加多少,就必須登錄微信的公眾號(hào)后臺(tái)查看。
但差評(píng)公眾號(hào)天天十萬(wàn)加,再加上編輯團(tuán)隊(duì)人數(shù)也越來(lái)越多,后臺(tái)權(quán)限綁定的人數(shù)其實(shí)是有限的,尋找相應(yīng)文章和閱讀量數(shù)據(jù),就變得麻煩了起來(lái)。
所以,當(dāng)某個(gè)編輯忘記某篇文章的閱讀量時(shí),一般就只好讓有后臺(tái)的權(quán)限的同事幫忙看一眼數(shù)據(jù),或者是幫忙掃個(gè)碼。
最后同樣是 AI ,解決了這個(gè)甜蜜的煩惱。
因?yàn)槲覀冎苯佑靡痪湓,用百度智能云千帆大模型平臺(tái)的 AppBuilder ,做了個(gè) “ 文章閃電搜索器 ” 。
我們只要把運(yùn)營(yíng)同事那邊匯總好的 Excel 數(shù)據(jù),加入數(shù)據(jù)庫(kù)中,這個(gè)文章閃電搜索器,就成了個(gè)差評(píng)公眾號(hào)內(nèi)部數(shù)據(jù)通。
而且方便的是,我們可以選擇把這個(gè) Agent 發(fā)布到微信小程序、網(wǎng)頁(yè)、微信訂閱號(hào)等等的平臺(tái)上。
突出得那叫一個(gè)想用即用。
世超也通過(guò)微信小程序的入口,簡(jiǎn)單試了試這個(gè)用幾分鐘就搭好的 Demo 。
在世超的提問(wèn)下,文章閃電搜索器很快就給出了正確答案,《 火了 6 年后,國(guó)潮開(kāi)始塌房了。 》這篇文章閱讀量到了 120 多萬(wàn),包括鏈接也是正確的。
并且,因?yàn)榍Х?AppBuilder 記憶能力,咱還能繼續(xù)追問(wèn) “ 該作者上一篇百萬(wàn)加的文章是哪篇 ” ?
文章閃電搜索器也是突出一個(gè)快,立馬給出了正確答案。
而同樣的 AI 故事,其實(shí)也發(fā)生在差評(píng)的 B 站視頻部門。
這么說(shuō)吧,雖然差評(píng)君的視頻看起來(lái)那叫一個(gè)靚仔,但咱們的同事在寫稿,特別是起標(biāo)題時(shí),常常那叫一個(gè)狼狽。
不夸張地說(shuō),寫文章 2 小時(shí),糾結(jié)標(biāo)題要花 3 小時(shí)的情況那是經(jīng)常的事情。
這時(shí)候,如果有個(gè)能起標(biāo)題的大模型,其實(shí)能省不少力,最起碼也能啟發(fā)我們一些起標(biāo)題的新角度。
于是乎, B 站差評(píng)君部門,就想到了用千帆大模型平臺(tái)的 Modelbuilder ,調(diào)教出一個(gè)適合 B 站這個(gè)平臺(tái)的起標(biāo)題大模型。
首先,世超準(zhǔn)備給大家講講精調(diào)大模型的必要性,就像很多行業(yè)里都有自己的黑話一樣,外行常常是聽(tīng)得一頭霧水。
AI 其實(shí)也這樣,對(duì)于外行 AI 而言,可能就不明白差評(píng)的火鍋是啥意思。
而經(jīng)過(guò)精調(diào)的大模型,則會(huì)和十年老粉一樣,理解差評(píng)的一些黑話。
同樣在很多情況下,通用的 AI 不太懂什么是好的標(biāo)題,或者說(shuō)不太清楚哪些標(biāo)題是適合 B 站,哪些標(biāo)題是適合其他平臺(tái)的。
就比如《 仿生醫(yī)療設(shè)備: 從蚊子口器到人類健康 》這標(biāo)題,我覺(jué)得比起視頻平臺(tái),更適合發(fā)知網(wǎng)。
所以,我們抓取了 B 站 1300 條熱門視頻的內(nèi)容和標(biāo)題數(shù)據(jù),通過(guò)千帆訓(xùn)練了個(gè) B 站起標(biāo)題懂哥大模型。
大伙們也可以對(duì)比一下,相比沒(méi)經(jīng)過(guò)調(diào)教的版本,新模型給出的標(biāo)題,明顯就更加對(duì)味兒了。
當(dāng)然,說(shuō)實(shí)話 1000 條左右的數(shù)據(jù),并不算多,相信隨著數(shù)據(jù)集的擴(kuò)大,效果也會(huì)越來(lái)越好。
其實(shí),通過(guò)上面幾個(gè)世超身邊實(shí)際的案例,大家也應(yīng)該會(huì)發(fā)現(xiàn),即便是差評(píng)這么一個(gè)小小的編輯部,對(duì)于 AI 也都有著各種各樣的需求,更不用說(shuō)其他無(wú)數(shù)中小企業(yè)了,并不是用一個(gè) TO C 的通用聊天機(jī)器人,就能解決一切問(wèn)題的。
但比如說(shuō)提示詞咋寫,如何精調(diào)模型,應(yīng)用的能力不給力怎么辦等等,都是行業(yè)內(nèi)在用大模型時(shí),普遍存在的問(wèn)題。
而在體驗(yàn)百度智能云千帆的 AppBuilder 和 Modelbuilder 過(guò)程中,世超也看到了百度是怎么一一解題的。
比如大伙們都擔(dān)心提示詞寫不好,影響了最終的效果,而千帆直接預(yù)置近 300 個(gè)行業(yè)場(chǎng)景的 prompt 模版。不知道咋精調(diào)模型?千帆也直接給了開(kāi)箱即用的模型精調(diào)樣板間,支持超過(guò) 3 萬(wàn)個(gè)模型的精調(diào)。
另外在傳統(tǒng)企業(yè)中,那些復(fù)雜的事兒和任務(wù),基本都得靠專家的經(jīng)驗(yàn)固定好的流程,也就是工作流。哪怕數(shù)字化已經(jīng)搞了這么多年的今天,工作流也依舊是守舊派,沒(méi)什么新突破。
另一方面大模型確實(shí)是很強(qiáng),相當(dāng)于一顆會(huì)思考的大腦,但 “ 幻覺(jué) ” 問(wèn)題卻一直讓人頭疼。相信大伙們也都想到了,把工作流和大模型整一塊兒,其實(shí)剛好能取其長(zhǎng)避其短。
這次百度世界大會(huì)上,百度智能云千帆大模型平臺(tái)搞出了個(gè) “ 工作流 Agent” 的功能。通過(guò)學(xué)習(xí)各種企業(yè)流程與規(guī)范,工作流 Agent 能迅速適應(yīng)不同崗位職責(zé),并且快速?gòu)?fù)制出一個(gè)個(gè) “ 數(shù)字員工 ” 。
拿保險(xiǎn)行業(yè)來(lái)說(shuō)吧,百度智能云正和保險(xiǎn)公司合作,弄出個(gè)車險(xiǎn)續(xù)保售前的數(shù)字員工。以前培養(yǎng)一個(gè)員工得花一兩年時(shí)間,F(xiàn)在用工作流 Agent 開(kāi)發(fā)金牌銷售數(shù)字員工,最快一個(gè)小時(shí)就能弄好上線。而且這個(gè)工作流 Agent 還能很快地集成到百度搜索、微信公眾號(hào)、企業(yè)官網(wǎng)這些業(yè)務(wù)系統(tǒng)里。
大會(huì)上百度也來(lái)了波現(xiàn)場(chǎng)演示 ,咋說(shuō)呢,要不是事先知道答案,我還真猜不出對(duì)面原來(lái)是個(gè) AI 數(shù)字員工。。。
另外說(shuō)起來(lái)你們可能不信,因?yàn)橛辛藬?shù)據(jù)飛輪和模型蒸餾的加持,這大模型還會(huì)越用越聰明,越用效率越高。
這么說(shuō)吧,模型上線后會(huì)持續(xù)從線上采樣用戶線上真實(shí)的數(shù)據(jù),模型會(huì)標(biāo)注好回答的好壞,用于繼續(xù)推進(jìn)模型的更新,數(shù)據(jù)的輪子,就這么轉(zhuǎn)了起來(lái)。
包括 ModelBuilder 還能根據(jù)優(yōu)質(zhì)的數(shù)據(jù),蒸餾出一個(gè)輕量級(jí)大模型,目前百度優(yōu)選就用上了,它提取商品屬性,新模型能達(dá)到 90% 的旗艦級(jí)模型效果,同時(shí)也能達(dá)到 3-4 倍的旗艦級(jí)模型的速度,效果和性能就這樣達(dá)成了平衡。
最后世超想說(shuō)的是,在大模型到應(yīng)用的這條路上,實(shí)際上很多中小企業(yè),都被攔在了 “ 最后一公里 ” ,而千帆們所做的,就是把這最后的路打通。
硅谷有一句經(jīng)典的 “ 老話 ” ,叫做 “ 軟件吞噬世界 ” 。
而世超覺(jué)得,世界會(huì)不會(huì)被軟件吞噬咱不好確定,但在 AI 的普及,并且從 AI 到應(yīng)用這條路越來(lái)越通暢的情況下,軟件肯定會(huì)讓咱們的生活和生產(chǎn)更便利。