當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-03 17:55:33 瀏覽：2764次

導(dǎo)讀：劃重點(diǎn) 01AI幻覺(jué)是指人工智能系統(tǒng)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符或偏離用戶指令的現(xiàn)象，包括事實(shí)幻覺(jué)和忠誠(chéng)度幻覺(jué)。 02事實(shí)幻覺(jué)包括事實(shí)不一致和事實(shí)捏造，如AI回答世界上最高的山峰是哪座？時(shí)，回答深圳塘朗山是世界上最高的山峰。 03忠誠(chéng)度幻覺(jué)包括指令迷失、上...

劃重點(diǎn)

01AI幻覺(jué)是指人工智能系統(tǒng)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符或偏離用戶指令的現(xiàn)象，包括事實(shí)幻覺(jué)和忠誠(chéng)度幻覺(jué)。

02事實(shí)幻覺(jué)包括事實(shí)不一致和事實(shí)捏造，如AI回答“世界上最高的山峰是哪座？”時(shí)，回答“深圳塘朗山是世界上最高的山峰。”

03忠誠(chéng)度幻覺(jué)包括指令迷失、上下文不一致和邏輯不一致，如AI回答“講解一下龍飛鳳舞”時(shí)，回答“老鐵，我給你搜了幾段舞蹈教學(xué)”。

04AI幻覺(jué)產(chǎn)生的原因包括數(shù)據(jù)里的“坑”、訓(xùn)練數(shù)據(jù)局限、缺乏實(shí)時(shí)更新、過(guò)度泛化、上下文理解不足和模型本身的“小缺陷”。

05避免AI幻覺(jué)的方法包括提示工程、模型開(kāi)發(fā)、AI Agent為模型加Buff等。

以上內(nèi)容由騰訊混元大模型生成，僅供參考

AI幻覺(jué)，簡(jiǎn)單來(lái)說(shuō)，是指人工智能系統(tǒng)（自然語(yǔ)言處理模型）生成的內(nèi)容與真實(shí)數(shù)據(jù)不符，或偏離用戶指令的現(xiàn)象，就像人類說(shuō)“夢(mèng)話”一樣~ AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

那么AI幻覺(jué)有哪些？是什么原因產(chǎn)生的？我們?cè)撊绾伪苊釧I幻覺(jué)呢？

AI會(huì)產(chǎn)生什么樣的幻覺(jué)？

可能有的小伙伴說(shuō)：“我知道了！AI‘胡說(shuō)八道’就是AI幻覺(jué)唄？”

其實(shí)也沒(méi)這么簡(jiǎn)單，AI幻覺(jué)主要有兩類。

事實(shí)幻覺(jué)：“假新聞制造機(jī)”A：事實(shí)不一致：AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

當(dāng)被問(wèn)及“世界上最高的山峰是哪座？”，如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個(gè)事實(shí)不一致的例子，因?yàn)樘晾噬阶溆趶V東省深圳市，海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米，這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。B：事實(shí)捏造：AI生成完全虛構(gòu)的內(nèi)容 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

如果AI描述說(shuō)“2024年，考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室，里面藏有古代法老的寶藏和未知的高科技裝置。”這就是完全虛構(gòu)的信息，截至目前沒(méi)有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室，更不用說(shuō)藏有古代法老的寶藏或未知的高科技裝置了。忠誠(chéng)度幻覺(jué)：“指令迷失”A：指令不一致：AI的回答偏離用戶的要求 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

如果用戶要求AI“講解一下龍飛鳳舞”，但AI回答了“老鐵，我給你搜了幾段舞蹈教學(xué)” ，這就完全偏離了原始的問(wèn)題。B：上下文不一致：AI生成的內(nèi)容與提供的背景信息不符 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

假設(shè)在一個(gè)討論中國(guó)傳統(tǒng)節(jié)日的上下文中，用戶問(wèn)：“春節(jié)是什么時(shí)候？”AI回答：“春節(jié)是中國(guó)農(nóng)歷新年，通常在每年的1月或2月慶祝。”這個(gè)回答是正確的，符合春節(jié)的基本情況。然而，如果AI接著說(shuō)：“春節(jié)是紀(jì)念屈原的節(jié)日，人們會(huì)吃粽子和賽龍舟。”這就是上下文不一致的例子，因?yàn)锳I的回答與春節(jié)的背景信息不符。C. 邏輯不一致：AI的輸出存在內(nèi)在邏輯矛盾開(kāi)頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……，AI把自己繞蒙了~ AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

AI幻覺(jué)有哪些特點(diǎn)

內(nèi)容流暢性：盡管內(nèi)容可能有誤，AI生成的文本通常仍然連貫流暢。

表面合理性：生成的內(nèi)容表面上看起來(lái)可信，給人以“這看起來(lái)很對(duì)”的第一印象，非專業(yè)人士難以辨別。

上下文相關(guān)：AI的幻覺(jué)內(nèi)容并非憑空出現(xiàn)，它們通常與特定的上下文情境緊密相關(guān)。

不可預(yù)測(cè)性：很難預(yù)測(cè)AI何時(shí)會(huì)產(chǎn)生幻覺(jué)，可能幻覺(jué)也很難復(fù)現(xiàn)，就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。

AI幻覺(jué)的“幕后黑手”

AI幻覺(jué)主要來(lái)自以下方面：

數(shù)據(jù)里的“坑”

AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

訓(xùn)練數(shù)據(jù)局限：AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見(jiàn)或過(guò)時(shí)信息。就像教小朋友學(xué)習(xí)，課本是錯(cuò)的，考試自然無(wú)法答對(duì)。

缺乏實(shí)時(shí)更新：AI通�；陟o態(tài)數(shù)據(jù)訓(xùn)練，無(wú)法及時(shí)獲取最新信息�？荚囈鶕�(jù)最新的資料復(fù)習(xí)，拿一本82年的教材是考不了24年的高考的~

訓(xùn)練過(guò)程的“小插曲” AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

過(guò)度泛化：模型可能過(guò)于依賴某些模式，導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式，卻不會(huì)靈活變通。

上下文理解不足：AI可能無(wú)法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn)，或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。

模型本身的“小缺陷” AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

模型結(jié)構(gòu)限制：AI通過(guò)統(tǒng)計(jì)模式預(yù)測(cè)，但可能無(wú)法真正理解信息。“你以為他真的懂你，其實(shí)也不過(guò)是基于復(fù)雜算法的數(shù)學(xué)而已~”4

如何避免AI幻覺(jué)？

避免AI幻覺(jué)有以下幾個(gè)“絕招”，各位少俠看“自身功力”，酌情修煉~

一. 提示工程有策略

提示工程通過(guò)優(yōu)化AI的輸入提示，使生成的內(nèi)容更準(zhǔn)確。A. 檢索增強(qiáng)生成（RAG）技術(shù) AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

RAG技術(shù)通過(guò)引入外部知識(shí)來(lái)幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括：生成前檢索：在內(nèi)容生成前，系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息，為生成過(guò)程打下堅(jiān)實(shí)的基矗

生成過(guò)程中檢索：在生成過(guò)程中，系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí)，確保內(nèi)容的時(shí)效性和深度。

生成后檢索：生成后，系統(tǒng)再次檢索，與現(xiàn)有證據(jù)進(jìn)行對(duì)比，驗(yàn)證生成內(nèi)容的準(zhǔn)確性。

例如，當(dāng)AI被問(wèn)到“2024年登月的宇航員有哪些？“時(shí)，RAG系統(tǒng)會(huì)先檢索最新的新聞信息，然后基于檢索到的準(zhǔn)確信息生成回答。B. 基于反饋和推理的自我改進(jìn)機(jī)制這種方法賦予AI自我反思的能力，使其能夠不斷優(yōu)化生成的內(nèi)容。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

AI在生成答案后，會(huì)進(jìn)行自我審視，提出疑問(wèn)：“這個(gè)答案是否全面？是否有關(guān)鍵信息被忽略？”C. 提示詞的精細(xì)化調(diào)優(yōu)通過(guò)精心設(shè)計(jì)的提示詞，引導(dǎo)AI生成更可靠、更精確的內(nèi)容。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

例如，在地圖導(dǎo)航的AI應(yīng)用中，使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況，提供明天上午九點(diǎn)到深圳灣公園的路線推薦，分別提供駕車與公共交通的路線信息，用時(shí)推薦等”具體提示，代替籠統(tǒng)的“如何去深圳灣公園”。這種方法不僅提升了信息的全面性，也增強(qiáng)了AI回答的針對(duì)性。（這不僅是我們最容易實(shí)現(xiàn)的策略，也是最直觀有效的方法，能夠顯著改善內(nèi)容生成的質(zhì)量和深度。

）二. 模型開(kāi)發(fā)不能停AI模型與訓(xùn)練過(guò)程的不斷進(jìn)化是減少幻覺(jué)產(chǎn)生的關(guān)鍵。A. 創(chuàng)新解碼技術(shù)采用新的解碼策略，以便更精準(zhǔn)地處理語(yǔ)言上下文，例如上下文感知解碼（CAD）。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

這種方法通過(guò)在解碼過(guò)程中引入上下文信息，鼓勵(lì)模型更多地關(guān)注所提供的上下文，而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。例子：在翻譯一部科幻小說(shuō)時(shí)，傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”，而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令，正確翻譯為“把我傳送上去”。B. 知識(shí)圖譜的應(yīng)用通過(guò)知識(shí)圖譜，我們能夠豐富AI的知識(shí)庫(kù)，讓生成的內(nèi)容更加準(zhǔn)確和有深度。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

想象一下，知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”，但它不是連接人，而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體，比如人、地點(diǎn)、事物或者概念。它們通過(guò)各種“關(guān)系”相互連接，就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過(guò)這種方式組織信息，就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息，并且理解不同信息之間的聯(lián)系。舉個(gè)例子，如果你在知識(shí)圖譜中查找“蘋(píng)果”，它不僅會(huì)告訴你蘋(píng)果是一種水果，還可能告訴你蘋(píng)果公司是一家科技公司，甚至還會(huì)告訴你牛頓被蘋(píng)果啟發(fā)發(fā)現(xiàn)了萬(wàn)有引力。C. 基于忠實(shí)度的損失函數(shù)引入新的損失函數(shù)，對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰，以減少不準(zhǔn)確的信息，從而把AI從幻覺(jué)中“掐醒”。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

舉個(gè)例子，AI在生成文章摘要時(shí)，如果回答中添加了原文中未提及的內(nèi)容，損失函數(shù)會(huì)提高懲罰，確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。D. 監(jiān)督微調(diào)通過(guò)特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào)，提升模型在特定任務(wù)上的準(zhǔn)確性。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

舉個(gè)例子，一個(gè)通用的語(yǔ)言模型可能對(duì)通信術(shù)語(yǔ)理解有限。通過(guò)使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào)，可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。比如，它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語(yǔ)的區(qū)別，如EBGP和IBGP。三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性，通過(guò)這種方式，AI Agent能夠更好地理解和處理復(fù)雜的任務(wù)，減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。A. PAL（Program-Aided Language Models，程序輔助語(yǔ)言模型）：PAL技術(shù)通過(guò)將程序化邏輯嵌入到語(yǔ)言模型中，使得AI能夠執(zhí)行特定的程序或算法來(lái)完成任務(wù)。PAL技術(shù)像是一個(gè)“自動(dòng)化工具”，它通過(guò)內(nèi)置的程序邏輯來(lái)指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

舉個(gè)例子，如果你告訴基于PAL技術(shù)的AI系統(tǒng)：“我需要在每天下午3點(diǎn)提醒我喝水。”系統(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒，每天按時(shí)提醒你，而不需要進(jìn)一步的交互。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

B. ReAct（Reasoning and Acting，推理與行動(dòng)）：ReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解，以及基于這種理解進(jìn)行的推理和決策。ReAct技術(shù)更像是一個(gè)“智能助手”，它不僅理解用戶的請(qǐng)求，還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理，并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些需要靈活推理和決策的任務(wù)。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？

舉個(gè)例子，如果你告訴基于ReAct算法的AI系統(tǒng)：“我明天有個(gè)會(huì)議，需要準(zhǔn)備一份報(bào)告。”ReAct系統(tǒng)會(huì)理解你的請(qǐng)求，然后推理出你需要的信息類型，可能會(huì)詢問(wèn)你報(bào)告的具體內(nèi)容和格式，然后根據(jù)這些信息來(lái)幫助你準(zhǔn)備報(bào)告。 AI也會(huì)做夢(mèng)嗎？什么是AI幻覺(jué)？