本文深入探討了Re-Act與Conversational-Chat兩種會話模式的差異,并通過比較TFlow AI和Coze兩款產(chǎn)品,揭示了Re-Act模式在B端業(yè)務(wù)場景中的優(yōu)越性。文章不僅詳細(xì)解析了目標(biāo)、SOP、離散推理和環(huán)境交互等概念,還通過實例展示了不同模式下的Agent如何處理任務(wù)。對于希望了解Agent技術(shù)及其在商業(yè)應(yīng)用中的實際效果的讀者來說,這是一份寶貴的資料。
大家好,在研究Agent時,發(fā)現(xiàn)了不同的會話模式會帶來對相同的問題帶來不同的處理方式,所以研究了Re-Act 和 Conversational-Chat的區(qū)別,發(fā)現(xiàn)對于2B而言re-act才是更適配的模式。
對標(biāo)了2款產(chǎn)品,TFlow AI 和 Coze
一、先介紹一下產(chǎn)品
TFlow AI 是面向B端業(yè)務(wù)場景Agent平臺,能按流程處理任務(wù)(SOP),圍繞目標(biāo)來進(jìn)行離散推理。
允許LLM與環(huán)境進(jìn)行交互,根據(jù)環(huán)境數(shù)據(jù)的反饋不斷的調(diào)整行動計劃/策略。
且整個sop的過程是由文本來控制,不需要用到Work Flow。
產(chǎn)品基本信息如下:
使用問心一言-3.5的模型,未微調(diào)做了邏輯處理的Agent框架單條回復(fù)的消耗不到2K token,成本約0.8-2份錢。價格不貴怎么理解目標(biāo)、sop、離散推理、環(huán)境交互?我們以下列TFlow AI任務(wù)sop提示詞為例:
目標(biāo):要做一件什么事情,要達(dá)到什么目的。解答問題,引導(dǎo)留咨任務(wù)sop:處理事情流程步驟。注:模擬人的行為的任務(wù)處理流程或者說思考流程,以及標(biāo)準(zhǔn)的交互過程。離散推理/環(huán)境交互:要完成留咨任務(wù),需要多次與用戶/外部環(huán)境進(jìn)行互動。不斷的根據(jù)用戶反饋,調(diào)整執(zhí)行計劃,達(dá)成目標(biāo)。如:在上述的任務(wù)sop的流程中,任務(wù)的執(zhí)行需要多次與外界交互,借助外界補(bǔ)充的信息,持續(xù)推理完成任務(wù)的過程。比如查詢知識庫、引導(dǎo)用戶提供姓名聯(lián)系方式、調(diào)用留咨工具,將數(shù)據(jù)插入到已有的CRM中。
相同提示詞下,在Coze和TFlow Ai的表現(xiàn)如下
oze和TFlow的比較
為什么會產(chǎn)生這么個差異昵?為什么coze不能做到昵?
核心的區(qū)別就一個:Agent的模式不同
二、Agent的會話模型:Conversational-Chat VS Re-ACT
會話模式代表了處理提示詞的邏輯不同
豆包:Conversational-Chat (助手模式)要做什么事情,取決于用戶的指令TFlow Ai:Re-Act(推理+行動)要解決什么問題,初始的提示詞決定
1. Conversational-Chat:助理的模式
助理模式下的Agent的邏輯處理如下:
助理模式Agent的思考邏輯
提示詞確定后,對于用戶的每次輸入的處理步驟:
觀察:用戶輸入了什么?工具返回的數(shù)據(jù)
思考:是調(diào)用工具,還是直接回答用戶
行動:調(diào)用知識庫,搜索等
將結(jié)果重新給到大模型,繼續(xù)觀察中間過程可能重復(fù)N次
答案:模型理解用戶為你,不需要調(diào)用工具,直接給到用戶答案
特點如下:
助手。每次思考都是基于用戶的指令,理解我該去做什么事情。大模型要執(zhí)行的事情由用戶來控制,根據(jù)用戶輸入,去理解做下一步事情
關(guān)鍵點:要做什么事情,取決于用戶的指令
2. Re-ACT:Reason and Act(推理+行動)
處理邏輯如下:
e-act處理邏輯
提示詞確定后,對于用戶的每次輸入的處理步驟:
持續(xù)循環(huán):觀察用戶的最新輸入,和任務(wù)的關(guān)系,形成新的計劃、直到模擬達(dá)成任務(wù)目標(biāo)觀察:用戶輸入了什么?工具返回的數(shù)據(jù)思考:我的下一步要做做什么事情行動:我才采取什么樣的行動
……中間過程可能重復(fù)N次,直到模擬完成任務(wù)
計劃模擬完成,確定下一步的行動計劃
行動:我該去調(diào)用什么工具答案:我可以直接回復(fù)用戶
特點:
拿到用戶輸入,都會思考和用戶輸入和目標(biāo)之間的關(guān)系,然后重新制定執(zhí)行計劃,達(dá)成目標(biāo)。用戶無法決定讓模型做什么事情要解決什么問題,取決于初始的提示詞
為什么TFlow AI的Re-ACT模式,更適合B端對客場景
2B業(yè)務(wù)對客戶特征:
特征1:2B對業(yè)務(wù)有明確的思考流程和目標(biāo)。參考以真人處理為思考流程
例1:常見退貨換處理。
目標(biāo):解決用戶對到貨商品的不滿意問題。用戶提問:我要退貨處理流程:不滿意原因是什么-&訂單是否是真實(已到貨)-& 是否符合退貨政策-&引導(dǎo)退貨操作-&解答退貨流程中的問題
例2:汽車銷售過程關(guān)于汽車參數(shù)的咨詢
目標(biāo):幫助客戶找到合適的汽車用戶提問:這款車的續(xù)航軸距是多少?處理流程:收集客戶用車訴求(顯示身份等)-& 解答續(xù)航問題-&補(bǔ)充用車訴求下的產(chǎn)品價值(如續(xù)航低,但是上下班通勤足夠)
例3:saas軟件產(chǎn)品答疑
目標(biāo):引導(dǎo)客戶留咨用戶提問:軟件有什么優(yōu)勢處理流程:收集客戶場景-& 解答產(chǎn)品疑問-&引導(dǎo)留咨詢
Re-ACT模式能夠基于流程去模擬真人思考處理問題的流程
特征2:
用戶問題的解答處理,需要在B端企業(yè)提供的可控范圍內(nèi)如果是豆包的助手模式,用戶使用的產(chǎn)品的過程都無法預(yù)測。
本文由 @易俊源 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議