踩油門、急轉(zhuǎn)彎,像人類賽車手一樣精準(zhǔn)決策的AI要來(lái)了!
來(lái)源:科普中國(guó)
發(fā)布時(shí)間:2024-07-25
瀏覽次數(shù):1014

版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

前言

想象一下,在緊張刺激的賽車游戲中,人類需要迅速而精準(zhǔn)地判斷何時(shí)踩下油門、何時(shí)巧妙地轉(zhuǎn)彎。在根據(jù)路況不斷改變行駛路徑的過(guò)程中,人類大腦可以展現(xiàn)出敏捷的決策能力和反應(yīng)速度。

然而,在人類應(yīng)對(duì)自如的賽車游戲中,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型只能做出確定性的決策,尚不具備人類的感知行為能力。模擬人類大腦的決策過(guò)程,始終是人工智能(AI)領(lǐng)域的一大挑戰(zhàn)。

如今,一種新型神經(jīng)網(wǎng)絡(luò)模型,有望讓 AI 系統(tǒng)像人類賽車手一樣,權(quán)衡各種選擇,做出迅速、精準(zhǔn)的決策

近日,來(lái)自佐治亞理工學(xué)院的研究團(tuán)隊(duì)便提出了一種神經(jīng)網(wǎng)絡(luò)模型 RTNet,這一模型不僅能夠生成隨機(jī)決策,還能達(dá)到類似人類決策的響應(yīng)時(shí)間分布。

研究團(tuán)隊(duì)通過(guò)全面的測(cè)試發(fā)現(xiàn),RTNet 能夠再現(xiàn)人類在準(zhǔn)確性、響應(yīng)時(shí)間和置信度上的所有特征,而且表現(xiàn)優(yōu)于多個(gè)當(dāng)前先進(jìn)的神經(jīng)網(wǎng)絡(luò)模型。

相關(guān)研究論文以“The neural network RTNet exhibits the signatures of human perceptual decision-making”為題,發(fā)表在科學(xué)期刊 Nature Human Behaviour 上。

研究團(tuán)隊(duì)表示,即使是功能強(qiáng)大的大語(yǔ)言模型(LLM)也會(huì)因?yàn)榛糜X(jué)編造一些不切實(shí)際的回答,因此開發(fā)一種更接近真實(shí)人腦的神經(jīng)網(wǎng)絡(luò)可能會(huì)使 AI 系統(tǒng)更加可靠。

像人類一樣感知決策

近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)(CNN)在 AI 圖像處理方面取得了很大進(jìn)展,甚至在醫(yī)學(xué)圖像處理等領(lǐng)域超過(guò)了人類的水平,但在感知決策的認(rèn)知模型中與人類的表現(xiàn)仍相較甚遠(yuǎn)。

傳統(tǒng)的 CNN 面對(duì)相同的輸入信號(hào)時(shí),輸出的結(jié)果總是確定的,而且在處理復(fù)雜度不同的圖像時(shí),花費(fèi)的計(jì)算時(shí)間總是不變的。這也決定了 CNN 模型很難實(shí)現(xiàn)人類大腦的感知決策水平,無(wú)法根據(jù)任務(wù)的復(fù)雜程度調(diào)整反應(yīng)時(shí)間和準(zhǔn)確度。

此前,為了解決這些問(wèn)題,一些研究團(tuán)隊(duì)曾嘗試為神經(jīng)網(wǎng)絡(luò)引入隨機(jī)性和動(dòng)態(tài)性,開發(fā)能夠生成動(dòng)態(tài)響應(yīng)時(shí)間的神經(jīng)網(wǎng)絡(luò),但這些模型無(wú)法處理復(fù)雜的圖像輸入,結(jié)果也是確定性的,還是沒(méi)有達(dá)到人類的感知決策能力。

Google Research 和科羅拉多大學(xué)的研究團(tuán)隊(duì)曾通過(guò)在深度神經(jīng)網(wǎng)絡(luò)的前饋網(wǎng)絡(luò)中引入傳播延遲來(lái)構(gòu)建級(jí)聯(lián)網(wǎng)絡(luò),產(chǎn)生了圖像可計(jì)算的動(dòng)態(tài)網(wǎng)絡(luò),其通過(guò)決策計(jì)算資源隨時(shí)間增加的機(jī)制生成響應(yīng)時(shí)間,從而允許響應(yīng)通過(guò)每個(gè)處理步驟進(jìn)行不斷地演變。雖然模型可以模擬人類感知決策的速度和準(zhǔn)確度,但輸出結(jié)果還是確定性的,距離人類的感知決策水平還有相當(dāng)大的距離。

在這項(xiàng)研究中,F(xiàn)arshad Rafiei 等人將現(xiàn)代 CNN 與傳統(tǒng)認(rèn)知模型相結(jié)合,創(chuàng)建了一個(gè)可進(jìn)行圖像計(jì)算、隨機(jī)且動(dòng)態(tài)的模型。因?yàn)樵撃P湍軌蚰M人類的行為決策響應(yīng)時(shí)間,故將它命名為 RTNet。

圖 | 模型的架構(gòu)(來(lái)源:該論文)

他們通過(guò)對(duì)貝葉斯神經(jīng)網(wǎng)絡(luò)進(jìn)行采樣,獲得深度神經(jīng)網(wǎng)絡(luò)噪聲權(quán)重,然后在每個(gè)處理步驟,從這些有噪聲的權(quán)重分布中進(jìn)行采樣,來(lái)模擬神經(jīng)響應(yīng)的隨機(jī)性。RTNet 也會(huì)積累每個(gè)選擇對(duì)應(yīng)的輸出,直到其中一個(gè)選擇達(dá)到預(yù)定義的閾值。

為了驗(yàn)證 RTNet 能夠適用于各種感知任務(wù),并做出類似人類感知決策的一些基本特征,他們對(duì) RTNet 進(jìn)行了全面的評(píng)估測(cè)試。

他們?cè)O(shè)計(jì)了 “二選一” 的決策任務(wù),通過(guò)人為改變?nèi)蝿?wù)難度,來(lái)對(duì)比 RTNet 模型與 60名 參與者進(jìn)行決策判斷的響應(yīng)時(shí)間和準(zhǔn)確度,從而驗(yàn)證 RTNet 在模擬人類行為方面的出色表現(xiàn)。

人類行為的一個(gè)核心特征就是決策具有隨機(jī)性,面對(duì)同樣的情況可能做出不同的決策,研究人員將人類行為與 RTNet、CNet、BLNet 和 MSDNet 的行為進(jìn)行了比較。

實(shí)驗(yàn)充分考慮了人類決策的隨機(jī)性、增加響應(yīng)時(shí)間帶來(lái)的準(zhǔn)確性下降、復(fù)雜度高的決策導(dǎo)致的準(zhǔn)確性降低等干擾因素,來(lái)驗(yàn)證 RTNet 在決策上的隨機(jī)性是魯棒、可靠的。

圖 | 實(shí)驗(yàn)參與者和四個(gè)神經(jīng)網(wǎng)絡(luò)模型在決策隨機(jī)性的表現(xiàn)(來(lái)源:該論文)

研究發(fā)現(xiàn),模型表現(xiàn)出的決策隨機(jī)性隨著任務(wù)難度的增加而增加,在 20% 的試驗(yàn)中,RTNet 對(duì)兩個(gè)圖像表現(xiàn)出了不同的響應(yīng)。雖低于人類的反應(yīng)水平,隨著任務(wù)難度和速度要求的提高,RTNet 決策的隨機(jī)性也在提高。

與之相反,對(duì)于固定的任務(wù),CNet、BLNet 和 MSDNet 的決策是完全確定性的,并且沒(méi)有表現(xiàn)出任何隨機(jī)性。RTNet 在捕獲感知決策特征方面表現(xiàn)出優(yōu)于 CNet、BLNet 和 MSDNet 的特征,RTNet 也是唯一一個(gè)能夠模擬時(shí)間響應(yīng)分布形狀和偏度,以響應(yīng)任務(wù)難度進(jìn)行不同操作的模型。

不足與展望

總的來(lái)說(shuō),RTNet 表現(xiàn)出了類人感知決策的關(guān)鍵特征,具有廣泛的應(yīng)用前景。此外,RTNet 也為開發(fā)更加逼真的 AI 模型提供了新的思路,未來(lái)在醫(yī)療診斷、自動(dòng)駕駛和人機(jī)交互等領(lǐng)域?qū)l(fā)揮重要作用。

研究人員推測(cè),RTNet 能夠匹配觀察到的人類行為模式,主要是因?yàn)槠鋬?nèi)部機(jī)制更接近人類產(chǎn)生響應(yīng)時(shí)間的真實(shí)機(jī)制。RTNet 通過(guò)模仿重復(fù)呈現(xiàn)相同刺激的神經(jīng)元反應(yīng),在證據(jù)積累的過(guò)程中,自然地產(chǎn)生持久的神經(jīng)元激活,所以模型的輸出本質(zhì)上是隨機(jī)的。

但 RTNet 也存在一定的局限性,它在每次從選擇中進(jìn)行證據(jù)采樣的機(jī)制不是最佳的,且前饋路徑的每次掃描都獨(dú)立于先前的狀態(tài),但人腦一般當(dāng)前的狀態(tài)會(huì)受到其先前狀態(tài)的影響。

研究人員表示,未來(lái)的研究可以進(jìn)一步優(yōu)化 RTNet 的生物學(xué)合理性,例如引入遞歸處理機(jī)制,并使用其他方法來(lái)設(shè)置每個(gè)連接的噪聲級(jí)別,來(lái)更好地模擬人類大腦的處理方式。

歡迎掃碼關(guān)注深i科普!

我們將定期推出

公益、免費(fèi)、優(yōu)惠的科普活動(dòng)和科普好物!

聽說(shuō),打賞我的人最后都找到了真愛(ài)。
做科普,我們是認(rèn)真的!
掃描關(guān)注深i科普公眾號(hào)
加入科普活動(dòng)群
  • 參加最新科普活動(dòng)
  • 認(rèn)識(shí)科普小朋友
  • 成為科學(xué)小記者