出品|虎嗅科技組
作者|余楊
編輯|苗正卿
頭圖|視覺中國
學生交完期末答卷,打工人寫完年終總結(jié),各自奔赴跨年現(xiàn)場,一年又過去了。
這一年,AI改變了很多行業(yè)的生態(tài),從業(yè)者的狀態(tài),尤其是在內(nèi)容創(chuàng)作領域。世界開了巨大的AI“夸夸群”,稱贊AI“偉力”的文案幾乎成為互聯(lián)網(wǎng)信息污染的一部分。
12月初,各家大模型相繼推出“數(shù)學版”,隨后的測評中,數(shù)學和物理能力也成了大模型基準性能測試的“必考題”。
但在人文社科領域,似乎石子打在浪花上,旋即消失。新聞人用AI寫新聞,怕寫出假新聞;人文人用AI寫論文,車轱轆話來話去,幾經(jīng)折騰,還得自己動筆。
今天,聚焦AI的短板,從加速學習這個維度,看看各家AI有哪些“拿手菜”,給各家大模型做個“AI畫像”。
具體思路如下:
讓AI幫我讀一份人文社科學術(shù)論文,看看各家的解讀分別有什么特點。
具體的操作是,上傳一篇pdf格式的論文附件,輸入prompt:幫我解讀一下這篇文檔。
參與測評的玩家則有:Kimi、豆包、Deepseek、ChatGPT、智譜清言。
Kimi
首先是Kimi,文檔附件是題為《短視頻創(chuàng)作中的傳統(tǒng)文化對外傳播以李子柒為例》的論文,字數(shù)約6000。輸入“幫我解讀一下這篇文檔”。
當我上傳完文檔后,Kimi先解析了幾秒鐘,發(fā)出prompt29秒后,Kimi給我總結(jié)了如下內(nèi)容。
kimi的闡釋框架和論文框架一致,根據(jù)段落內(nèi)容進行了總結(jié),大體上邏輯清晰,簡單明了,對于文檔中的敏感詞則自動規(guī)避,最后還對論文做了短評。
豆包
豆包同樣經(jīng)歷了解析程序,但解析的同時,我注意到,豆包識別出了0.9萬字。而在word里,算上參考文獻,也才6862字。
發(fā)送prompt后,同樣的程序,豆包只花了20秒。具體內(nèi)容如下:
與kimi相比,豆包在框架的基礎上做了縱深的推進,引言部分的背景與現(xiàn)象概括更加具體;二級標題下的具體例證也得到了呈現(xiàn),可以視作原論文的微縮版;與時政有關(guān)的內(nèi)容有所規(guī)避但也保留了大致面貌,整體更為翔實。不過,豆包并沒有對這篇論文作出評價。
而當我無意中把鼠標放在pdf頁面上時,出現(xiàn)了如下圖所示的功能引導。
豆包支持對文檔局部內(nèi)容進行AI搜索、解釋、翻譯和“問問豆包”。
試想一下,也就是說,第一,如果文檔是外文,可以在閱讀中讓豆包翻譯成瀏覽器系統(tǒng)語言,相當于在AI工具里加了一個buff;第二,如果文檔里有很難讀懂的段落,或許也可以直接讓豆包翻譯成“人話”。
DeepSeek
日前大熱的DeepSeek,讓我吃了閉門羹。無論是換成word格式還是文本,DeepSeek都拒絕工作。
ChatGPT
ChatGPT似乎不支持pdf格式的文件,我上傳后顯示讓我直接提供文檔內(nèi)容。換成word格式也是如此。
為了測評的順利進行,我復制了文本給ChatGPT,23秒之后,我得到了以下內(nèi)容:
可以看到,ChatGPT并不按常理出牌,它像kimi一樣有頭有尾,呈現(xiàn)出帶有“主體性”風格的敘述語言,在論文的第3部分,非常聰明地把論文框架里“結(jié)構(gòu)化的內(nèi)容傳播”解讀為通俗性的“視頻內(nèi)容分析”,對框架進行了“解讀”。第4部分的“對外傳播的風險與挑戰(zhàn)”也是智能解讀出來、并非原文框架的內(nèi)容。
讓ChatGPT讀中文,可能確實為難了點,在對話框的最下面,它也誠實寫到“ChatGPT也可能會犯錯。請核查重要信息!薄
但從結(jié)果看,ChatGPT也解讀得不錯,還添加了一些創(chuàng)造,比如“慢工出細活”的傳統(tǒng)美學,就是論文原文中沒有的內(nèi)容。
智譜清言
再看看智譜清言,23秒鐘后,我得到了以下回答。
智譜清言的總結(jié)有頭有尾,核心內(nèi)容包括主要觀點、文章結(jié)構(gòu)、文章價值幾個部分?傮w而言,智譜清言更加像一篇“解讀”,而不是文章內(nèi)容的照搬照抄。
事實上,在組織prompt語言時,我也確實有考慮到這一點,因而選用了“解讀”,而不是“總結(jié)”。
此外,在每一句話的末尾,智譜清言都加了尾注,點擊注釋,會跳轉(zhuǎn)到論文中的具體段落,即:“我從哪里得出的結(jié)論”。主打一個有憑有據(jù)。
如果文檔內(nèi)容再長一些,這個功能可能會提供更多的便利,發(fā)揮更大的價值。
但是,這種跳離常規(guī)論文框架的創(chuàng)新性“解讀”方式所產(chǎn)生的內(nèi)容是不是經(jīng)得起推敲,也是值得考慮的問題。
另外,智譜清言也具有“AI對照”的功能,點開后,支持引用、改寫、解釋、總結(jié)和翻譯。
總結(jié)
Kimi在處理《短視頻創(chuàng)作中的傳統(tǒng)文化對外傳播以李子柒為例》這篇論文時,能夠快速解析文檔并給出總結(jié),內(nèi)容簡潔,有頭有尾,能夠抓住文檔的核心要點。
豆包在字數(shù)統(tǒng)計上可能存在誤差,但其總結(jié)內(nèi)容更為詳細、豐富、具體,具備對文檔局部內(nèi)容進行AI搜索、解釋、翻譯和“問問豆包”的功能,這為用戶提供了額外的便利。
DeepSeek對敏感詞可能過于“敏感”,不一定能正常工作。
ChatGPT不支持直接處理PDF文件,需要用戶提供文檔內(nèi)容。在處理中文內(nèi)容時,也能夠給出不錯的解讀,并且添加了一些創(chuàng)造性的內(nèi)容,盡管有些內(nèi)容并非原文所有。
智譜清言在解讀論文時,提供了類似“解讀”的回答,而不僅僅是內(nèi)容的復制粘貼。回答中,每句話都附有尾注,可以直接跳轉(zhuǎn)到論文的具體段落,這一點對于需要準確引用的用戶來說非常有用。同時,智譜還具備“AI對照”功能,支持引用、改寫、解釋、總結(jié)和翻譯,未來可期。
從時間成本上看,各家大模型耗時相差不大。
從使用程序上看,都要經(jīng)歷上傳文檔-解析文檔-輸入prompt-等待解讀-核查信息的過程,豆包和智譜清言還支持對文檔內(nèi)容的精細化操作。
就AI畫像來看,Kimi更像一個“理工人”,他擅長數(shù)學和推理,對中文沒那么細心,但勝在簡潔聰明。豆包有著較為完善的AI工具集成生態(tài),靈動的邊界和強大的系統(tǒng)力。而智譜清言對中文有著精準的語言理解能力,也非常適合“輔助寫作”。
這也提示,各家大模型支持的文件格式不同,功能板塊也有差異,擅長的領域也不同。在選擇AI工具時,根據(jù)自己的具體需求,來選擇最合適的AI模型。
或有差錯,但瑕不掩瑜。因為更重要的是,“一目十行”不再是少部分天才的特權(quán),AI將打開魔盒的鑰匙,遞到了普通人手里。
本內(nèi)容為作者獨立觀點,不代表虎嗅立場。