中新網(wǎng)北京12月19日電 (記者 孫自法)施普林格自然旗下專業(yè)學(xué)術(shù)期刊《自然-計(jì)算科學(xué)》最新發(fā)表一篇論文稱,研究人員開展的一項(xiàng)研究描述了一個(gè)機(jī)器學(xué)習(xí)方法,該方法或能從不同方面準(zhǔn)確預(yù)測(cè)人類生活,包括生命結(jié)局可能性和個(gè)性的細(xì)微差異。論文作者認(rèn)為,這一機(jī)器學(xué)習(xí)預(yù)測(cè)模型或能提供對(duì)人類行為的量化認(rèn)知。
該論文介紹,社會(huì)科學(xué)家對(duì)人類生活是否能被預(yù)測(cè)的問題看法不一,雖然人們對(duì)在人類生活中起到重要作用的社會(huì)人口學(xué)因素已有充分了解,但卻一直無(wú)法對(duì)生命結(jié)局進(jìn)行準(zhǔn)確預(yù)測(cè)。
論文通訊作者、丹麥技術(shù)大學(xué)Sune Lehmann和同事及合作者一起,利用丹麥一個(gè)國(guó)家登記處上約600萬(wàn)人的教育、健康、收入、職業(yè)和其他生活事件數(shù)據(jù),設(shè)計(jì)了一個(gè)機(jī)器學(xué)習(xí)方法,來(lái)構(gòu)建個(gè)體的人類生活軌跡。他們通過調(diào)整語(yǔ)言處理技術(shù),用類似模型中語(yǔ)言的方式表示人類生活。本次研究的這種方法能以類似語(yǔ)言模型捕捉詞語(yǔ)間復(fù)雜關(guān)系的方式生成一個(gè)生活事件的術(shù)語(yǔ)表。他們提出的模型名為life2vec,能確定健康相關(guān)診斷、居住地、收入水平等概念之間的復(fù)雜關(guān)系,并用一個(gè)壓縮向量表示來(lái)編碼個(gè)人生活,以此作為預(yù)測(cè)生活結(jié)局的基矗
論文作者指出,該模型預(yù)測(cè)生命結(jié)局的早死率具體而言是年齡組35-65歲的個(gè)體自2016年1月1日起存活4年的概率,以及捕捉細(xì)微個(gè)性差異的能力,超過了當(dāng)下先進(jìn)的模型和基線標(biāo)準(zhǔn),表現(xiàn)至少提升11%。
這項(xiàng)研究結(jié)果表明,通過表征社會(huì)結(jié)局和健康結(jié)局之間的復(fù)雜關(guān)聯(lián),準(zhǔn)確預(yù)測(cè)生活結(jié)局也許可以做到。不過,論文作者也特別強(qiáng)調(diào),他們的研究只是對(duì)可能性的探索,而且只應(yīng)在確保個(gè)人權(quán)利受到保護(hù)的監(jiān)管下才可用于現(xiàn)實(shí)世界。(完)