兩種算法通過(guò)識(shí)別重復(fù)的字詞的不同使用方式,只需要50條推特就能準(zhǔn)確區(qū)分謠言和公眾人物發(fā)表的消息。來(lái)自德國(guó)耶拿的弗里德里?!は沾髮W(xué)(Friedrich Schiller University)的Sergei Monakhov于2020年8月12日在開(kāi)放期刊PLOS ONE上發(fā)表了這些發(fā)現(xiàn)。
網(wǎng)絡(luò)謠言被用于達(dá)成某個(gè)目的,但同時(shí)也隱藏了該目的。比如說(shuō),在2018年,13個(gè)俄羅斯人被指控使用虛假身份通過(guò)社交媒體干涉2016年美國(guó)總統(tǒng)選舉。雖然之前的研究已經(jīng)包含了能區(qū)分虛假消息的特征,比如說(shuō)時(shí)間、主題標(biāo)簽,還有地理位置,但很少有研究分析推特消息本身的語(yǔ)言特征。
Monakhov使用了一種社會(huì)語(yǔ)言學(xué)方法,中心思想就是造謠者想傳播的消息數(shù)量有限,但是他們會(huì)多次發(fā)消息并使用足夠多樣的措辭和主題來(lái)欺騙讀者。Monakhov使用一個(gè)含有俄羅斯造謠者推特和真正的美國(guó)國(guó)會(huì)推特的庫(kù),證明了這些專屬造謠者的特點(diǎn)最終能區(qū)分謠言和官方推特消息的重復(fù)字詞模式。
美國(guó)國(guó)會(huì)、造謠者和特朗普的50條隨機(jī)推特的貝葉斯分析結(jié)果。 (圖片來(lái)源:Monakhov, 2020)
之后Monakhov測(cè)試了這一使用不同模式區(qū)分官方消息和謠言的算法。他發(fā)現(xiàn)這種算法只需要50條推特消息就能準(zhǔn)確區(qū)分造謠者和官方。他還發(fā)現(xiàn)這種算法正確地分辨了特朗普和造謠者的推特,盡管特朗普發(fā)表的消息也被推特官方認(rèn)為是挑釁的和“可能導(dǎo)致誤解的”,但是并沒(méi)有隱藏發(fā)表意圖。
這種區(qū)分推特謠言的新方法能幫助對(duì)抗網(wǎng)絡(luò)戰(zhàn)的同時(shí)保護(hù)言論自由。更多的研究將注重于確定該方法是否能準(zhǔn)確地從不是公眾人物發(fā)表的其他類型的消息中區(qū)分謠言。
圖片來(lái)源:Pixabay
Monakhov補(bǔ)充:“雖然謠言的撰寫(xiě)被認(rèn)為是充滿反復(fù)消息的,但它們最具特點(diǎn)的特征是非常規(guī)的重復(fù)字詞分布。把這些特征字詞的比例作為量化測(cè)量標(biāo)準(zhǔn),我們只需要50條推特就能識(shí)別網(wǎng)絡(luò)謠言賬戶?!?/p>
翻譯:王嘉鈺
審校:郝豪
引進(jìn)來(lái)源:Public Library of Science
引進(jìn)鏈接:https://techxplore.com/news/2020-08-strategy-quickly-twitter-trolls.html
?
關(guān)注【深圳科普】微信公眾號(hào),在對(duì)話框:
回復(fù)【最新活動(dòng)】,了解近期科普活動(dòng)
回復(fù)【科普行】,了解最新深圳科普行活動(dòng)
回復(fù)【研學(xué)營(yíng)】,了解最新科普研學(xué)營(yíng)
回復(fù)【科普課堂】,了解最新科普課堂
回復(fù)【科普書(shū)籍】,了解最新科普書(shū)籍
回復(fù)【團(tuán)體定制】,了解最新團(tuán)體定制活動(dòng)
回復(fù)【科普基地】,了解深圳科普基地詳情
回復(fù)【觀鳥(niǎo)知識(shí)】,學(xué)習(xí)觀鳥(niǎo)相關(guān)科普知識(shí)
回復(fù)【博物學(xué)院】,了解更多博物學(xué)院活動(dòng)詳情
?