展會信息港展會大全

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-16 18:55:24   瀏覽:7910次  

導(dǎo)讀:西風(fēng) 發(fā)自 凹非寺 量子位 | 公眾號 QbitAI 如果允許學(xué)生用AI作弊,他們的成績分布會發(fā)生怎樣的變化? 針對這個問題,真有幾位 大學(xué)教授 正兒八經(jīng)研究了一番,并寫下了長達(dá)62頁的研究論文。 結(jié)果發(fā)現(xiàn),使用GPT-4后,學(xué)生的能力曲線被壓縮了,差生和優(yōu)等生的差...

西風(fēng) 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

如果允許學(xué)生用AI“作弊”,他們的成績分布會發(fā)生怎樣的變化?

針對這個問題,真有幾位大學(xué)教授正兒八經(jīng)研究了一番,并寫下了長達(dá)62頁的研究論文。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

結(jié)果發(fā)現(xiàn),使用GPT-4后,學(xué)生的“能力曲線被壓縮了”,差生和優(yōu)等生的差距縮校

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

沃頓商學(xué)院教授分享了這項(xiàng)研究后,引起不少網(wǎng)友討論。網(wǎng)友對這樣的結(jié)果也感覺很意外:

和我的預(yù)期完全不符啊,還以為所有人分?jǐn)?shù)都會提高。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

還有網(wǎng)友稱這是“真正的游戲規(guī)則改變者”:

AI正在改變教育格局,在縮小差距的同時提高標(biāo)準(zhǔn)。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

不過也有網(wǎng)友持不同觀點(diǎn):

擅長使用AI的人可能表現(xiàn)會非常出色,那種看起來差距縮小的情況可能只是因?yàn)橛袧M績點(diǎn)4.0這一上限:

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

AI會是“平衡器”嗎?

除了上面所說的,我們查看論文,發(fā)現(xiàn)研究人員還得出了這些結(jié)論:

使用GPT-4對參與者總體任務(wù)完成的質(zhì)量影響較小且不穩(wěn)定;

使用GPT-4顯著減少了參與者完成任務(wù)的時間;

平時技能水平較低的參與者在使用GPT-4后,任務(wù)完成質(zhì)量提升最為顯著,本就能獨(dú)立高質(zhì)量完成任務(wù)的參與者獲得的質(zhì)量提升較;

GPT-4能為所有學(xué)生節(jié)省相似的時間,無論他們原本完成任務(wù)的速度如何;

即便參與者不了解自己在各項(xiàng)任務(wù)上的具體成績,他們也能明確指出GPT-4最有效的應(yīng)用場景。

下面一起來看實(shí)驗(yàn)詳情。

具體來說,來自南加州大學(xué)Gould法學(xué)院、明尼蘇達(dá)大學(xué)法學(xué)院的幾位教授,以研究AI輔助對法律分析的影響為例。

給參與實(shí)驗(yàn)的60位來自明尼蘇達(dá)大學(xué)法學(xué)院的學(xué)生提出了四項(xiàng)初級律師常見的任務(wù):起訴狀起草(Complaint Drafting)、合同起草(Contract Drafting)、員工手冊起草(EE Handbook)和客戶備忘錄起草(Client Memo)。

不同的是,這些參與者隨機(jī)分為兩組(A組、B組),每組30人。A組參與者需使用GPT-4完成起訴狀起草、合同起草任務(wù),而B組使用GPT-4完成員工手冊起草和客戶備忘錄起草任務(wù)。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

實(shí)驗(yàn)前,全部學(xué)生都接受了約2小時的培訓(xùn),了解如何有效使用GPT-4進(jìn)行法律分析。完成任務(wù)過程中,參與者需記錄自己完成任務(wù)的時間。

然后,研究人員在不知道參與者身份和其他信息的情況下,匿名完成所有作品的評分。

具體實(shí)驗(yàn)結(jié)果如下。

在4.0績點(diǎn)機(jī)制上,使用GPT-4輔助后,學(xué)生在四項(xiàng)任務(wù)中的平均分?jǐn)?shù)波動幅度為+0.17、+0.24、+0.07、-0.07。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

可視化圖表更直觀:

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

總的來說,僅合同起草任務(wù)的表現(xiàn)在95%置信水平上展現(xiàn)出了統(tǒng)計(jì)學(xué)意義上的顯著提升。

再來看使用和不使用GPT-4參與者,完成任務(wù)平均花費(fèi)的時間:

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

可以直觀地看到,參與者完成任務(wù)時間大大縮減:

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

更多數(shù)據(jù)和分析內(nèi)容,感興趣的朋友可查看論文。

值得一提的是,幾位教授在論文最后,還寫下了長達(dá)12頁的啟示,針對律師、法律客戶、法官以及法學(xué)院、法學(xué)院學(xué)生提出了不同的建議。

其中指出:法學(xué)院需要重新考慮學(xué)生使用AI的時機(jī)和方法,以及在何種情況下應(yīng)限制AI的應(yīng)用,以便更好地適應(yīng)未來實(shí)踐的需求。

此外,針對不同人群的類似研究也不在少數(shù)。

職場中AI會是“平衡器”嗎?

來自哈佛商學(xué)院、沃頓商學(xué)院、MIT斯隆管理學(xué)院等的研究人員聯(lián)合波士頓咨詢公司做了一項(xiàng)研究。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

他們選取了波士頓咨詢公司中的部分高知員工,讓他們使用AI輔助完成分析、創(chuàng)意構(gòu)思和說服技巧等18項(xiàng)任務(wù)測試。

結(jié)果發(fā)現(xiàn),原本表現(xiàn)位于團(tuán)隊(duì)下半層的顧問們在AI輔助下成果質(zhì)量提升了43%;而平時表現(xiàn)在上半層的顧問僅提升了17%。

使用GPT-4之前,頂尖員工與其他員工之間的平均差距為22%;使用之后,這一差距顯著縮小至4%。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

MIT的一項(xiàng)研究同樣表明,使用ChatGPT之后,高水平寫作者和低水平寫作者的表現(xiàn)差異縮減了一半。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

創(chuàng)意寫作領(lǐng)域亦見相似現(xiàn)象,倫敦大學(xué)學(xué)院、埃克塞特大學(xué)研究人員的一項(xiàng)實(shí)驗(yàn)表明,創(chuàng)意作家技能差距縮小,GPT-4提供的五個創(chuàng)意靈感“有效地平衡了不同創(chuàng)造力水平作家的創(chuàng)造力評分”。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

不過,盡管有多項(xiàng)研究表明使用AI可以縮減人們之間的技能差距,但正如論文分享者、沃頓商學(xué)院教授Ethan Mollick所言:

技能的造王者(King Maker)、加速器(Escalator)、平衡器(Leveler),AI究竟將扮演哪一種角色,并不是總是很清楚。

使用GPT-4,學(xué)渣比學(xué)霸更有優(yōu)勢

那么,你認(rèn)為AI在你身邊正扮演著哪種角色?

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港