不怕太空物質(zhì)“撞地球”!AI拯救“不堪重負(fù)”的天文學(xué)家?
發(fā)布時間:2024-05-22
瀏覽次數(shù):1324

版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

日冕物質(zhì)拋射(簡稱 CME)是從太陽拋入行星際空間的大尺度等離子體團(tuán),是太陽釋放能量的一種形式,也是影響空間天氣的主要因素之一。大型日冕物質(zhì)拋射事件會影響通信、導(dǎo)航、航空活動、電網(wǎng)運(yùn)行等,為了避免安全威脅和資產(chǎn)損失,準(zhǔn)確判斷日冕物質(zhì)拋射會「撞上」還是「錯過」地球,以及預(yù)測日冕物質(zhì)拋射到達(dá)的時間,其相關(guān)研究至關(guān)重要。

根據(jù)搭載于太陽與日光層觀測臺 (SOHO) 衛(wèi)星上的 LASCO 日冕儀的數(shù)據(jù),NASA CDAW 數(shù)據(jù)中心的研究人員手工整理了 1996 年至今的 CME 觀測目錄,該目錄記載了每一次 CME 事件的時間、位置角、角寬度、速度等物理量,給 CME 的相關(guān)研究提供了重要的基礎(chǔ)數(shù)據(jù)。然而,面對海量的數(shù)據(jù),手工識別存在著耗時費(fèi)力的缺點(diǎn),CME 的自動識別成為該領(lǐng)域內(nèi)較為活躍的研究方向。

來自中國科學(xué)院國家空間科學(xué)中心太陽活動與空間天氣重點(diǎn)實(shí)驗(yàn)室的研究團(tuán)隊(duì)在《天體物理學(xué)雜志增刊系列》(The Astrophysical Journal Supplemental Series) 上發(fā)表了題為「An Algorithm for the Determination of Coronal Mass Ejection Kinematic Parameters Based on Machine Learning」 的論文。論文提出了一種基于機(jī)器學(xué)習(xí)的 CME 識別與參數(shù)獲取方法。與 CME 手工目錄以及部分經(jīng)典自動識別方法相比,該方法效率高、速度快,能夠識別較為微弱的 CME 信號,并給出準(zhǔn)確的 CME 形態(tài)信息。

研究亮點(diǎn):

基于機(jī)器學(xué)習(xí)的 CME 識別與參數(shù)自動獲取方法的效率高、速度快,能夠識別較為微弱的 CME 信號

該方法獲取的參數(shù)接近人類手工識別的結(jié)果

該方法探測到的 CME 結(jié)構(gòu)還可用于 CME 到達(dá)時間預(yù)測、CME 三維重構(gòu)等其他方面的工作中

數(shù)據(jù)集:對圖像進(jìn)行準(zhǔn)確分類

研究人員從 CDAW CME 目錄網(wǎng)站獲取了 CME 的相關(guān)事件記錄 (包括 CME 出現(xiàn)、結(jié)束的時間以及備注),并下載了 2013 年至 2018 年 LASCO C2 和 C3 日冕儀的每日運(yùn)行差分圖像。選取的時間范圍涵蓋了第 24 太陽周期的一半,可以提供從太陽活動極大期到太陽活動極小期內(nèi),具有代表性和平衡性的 CME 和非 CME 樣本。此外,第 24 太陽周期其余時間的數(shù)據(jù)被保留用于驗(yàn)證。

研究人員選擇 NASA/CDAW 網(wǎng)站作為數(shù)據(jù)來源,因?yàn)樗峁┑臄?shù)據(jù)滿足了訓(xùn)練 CNN 模型進(jìn)行圖像分類以及進(jìn)一步跟蹤 CME 特征的需要。

根據(jù)每個 CME 事件的記錄,研究人員對每張圖像執(zhí)行迭代 (iteration)——如果圖像的曝光時間介于記錄條目的出現(xiàn)時間和結(jié)束時間之間,則該圖像會標(biāo)有該條目的相應(yīng)備注;相反,如果圖像的曝光時間與任何記錄都不匹配,則將圖像標(biāo)記為「No-CME」。

研究方法:三大步驟確認(rèn)核心參數(shù)

基于機(jī)器學(xué)習(xí)的 CME 識別與參數(shù)獲取方法共分為 3 個步驟:

共定位圖和 Otsu 算法的結(jié)果

首先,在圖像被正確分類以后,研究人員從神經(jīng)網(wǎng)絡(luò)的最后一層卷積層提取卷積特征映射,并對特征圖應(yīng)用 PCA 算法 (principal component analysis) 以獲得同一對象的信息,然后使用 Otsu 算法(一種確定圖像二值化分割閾值的算法)和形態(tài)學(xué)運(yùn)算來獲得精確的 CME 像素標(biāo)記。

其次,掃描圖像序列的每一幀,使用軌跡匹配算法來跟蹤日冕儀視場中 CME 離開太陽的傳播軌跡。

確認(rèn)參數(shù)的圖示

最后,基于上一步驟得到的軌跡,推導(dǎo)出 CME 的運(yùn)動學(xué)參數(shù),例如速度、CPA (central position angle) 和 AW (angular width)。

研究結(jié)果:基于機(jī)器學(xué)習(xí)的 CME 識別與參數(shù)自動獲取方法效率高、速度快

為了評估該方法在實(shí)際觀測中的性能,研究人員選擇了 2010-2012 年間具有不同速度和 AW 的代表性事件,并按 AW 的升序進(jìn)行了分析。所選日冕物質(zhì)拋射的 AW 范圍為 78° 至 360°,速度范圍為 288—1205km s-1。同時,研究人員將其新提出方法的結(jié)果與其它經(jīng)典的 CME 自動跟蹤目錄(即 CACTus、CORIMP 和 SEEDS)進(jìn)行比較。

事件 1:2012 年 2 月 14 日發(fā)生的 CME 事件。

日冕物質(zhì)拋射事件于 2012 年 2 月 14 日從日冕儀視場西側(cè)發(fā)射。下圖從上到下分別顯示了 CACTus、CORIMP、SEEDS 和本研究提出的方法的檢測圖。

2012 年 2 月 14 日 CME 事件的檢測結(jié)果

在上圖前三行中,檢測到的 CME 區(qū)域以不同的顏色和符號顯示。在 CACTus 的檢測圖中,檢測到的 CME 區(qū)域受到白色直線的限制。在 CORIMP 的檢測圖中,紅點(diǎn)表示最強(qiáng)最外層前沿的軌跡,黃點(diǎn)表示整體檢測到的結(jié)構(gòu)。在 SEEDS 的檢測圖中,藍(lán)點(diǎn)表示前緣的位置,紅點(diǎn)表示使用分割技術(shù)創(chuàng)建的前緣的近似輪廓。在最后一行為本研究提出的方法,圖中的藍(lán)色表示不相關(guān)的背景,而較暖的顏色表示該像素更有可能是 CME 的一部分。

在西北象限,本研究的檢測結(jié)果呈現(xiàn)出較亮的線條和斑點(diǎn),這些是僅使用本研究提出的方法才能檢測到小而微弱的瞬時噴發(fā)痕跡,表明了其檢測小而微弱信號的能力。

事件 2:2012 年 1 月 15 日發(fā)生的 CME 事件。

研究人員從 CACTus、CORIMP、SEEDS 和新提出方法的檢測結(jié)果中,從上到下分別選擇并顯示幾幀進(jìn)行比較。

2012 年 1 月 15 日 CME 事件的檢測結(jié)果

所有方法都檢測到了 CME 的主體,但本研究所提出的方法發(fā)現(xiàn)了除主體之外的較弱或較小的 CME 特征,而其他方法未能檢測到它們。從上圖可以看到新提出的方法成功地將 CME 區(qū)域與背景分開。

事件 3:2011 年 3 月 8 日發(fā)生的 CME 事件。

本次 CME 事件發(fā)生于2011 年 3 月 8 日, CACTus、CORIMP、SEEDS 和本研究提出的方法的檢測圖如下所示:

2011 年 3 月 8 日 CME 事件的檢測結(jié)果

在這些方法中,本研究所提出的方法和 CORIMP 是最早檢測到 CME 的,在 04:00,而其他方法在 12 分鐘后才識別出 CME。

綜合以上結(jié)果,我們能得出結(jié)論:與 CME 手工目錄以及部分經(jīng)典自動識別方法相比,本研究提出的基于機(jī)器學(xué)習(xí)的 CME 識別與參數(shù)自動獲取方法的效率高、速度快,能夠識別較為微弱的 CME 信號,給出準(zhǔn)確的 CME 形態(tài)信息。其跟蹤方法比較貼合直觀,獲取得到的參數(shù)接近人類手工識別的結(jié)果。此外,該方法探測到的 CME 結(jié)構(gòu)還可用于 CME 到達(dá)時間預(yù)測、CME 三維重構(gòu)等其他方面的工作中。

人工智能,拯救「不堪重負(fù)」的天文學(xué)家

近年來,隨著技術(shù)日益進(jìn)步,天體物理學(xué)研究中產(chǎn)生了海量數(shù)據(jù)。例如,除了前文提及的 CME 相關(guān)研究外,著名的斯隆巡天 (The Sloan Digital Sky Survey) 開始于 2000 年,觀測到了約 300 萬個天體,數(shù)據(jù)量大約是 40 TB。而目前正在運(yùn)行的暗能量巡天 (The Dark Energy Survey),其第一批釋放的科學(xué)級光譜數(shù)據(jù)量為 80 TB,幾乎與以往完成的巡天觀測的整個項(xiàng)目數(shù)據(jù)量相當(dāng)。

天文學(xué)家要想從大型綜合巡天望遠(yuǎn)鏡或是觀測儀中獲取的海量數(shù)據(jù)中,找出有價值的信息進(jìn)行研究,無異于從宇宙中撈星星。如何高效地處理這些數(shù)據(jù),已成為現(xiàn)代天文學(xué)面臨的一項(xiàng)重要挑戰(zhàn)。由于人工智能在海量數(shù)據(jù)分析和處理方面所具有的突出優(yōu)勢,它也很自然地走入了天文學(xué)家的視野,成為幫其「減負(fù)」的得力助手。

早在 2017 年,美國宇航局 (NASA) 就宣布,谷歌公司人工智能團(tuán)隊(duì)開發(fā)的神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)現(xiàn)了兩顆新的系外行星。其中一顆行星編號為「開普勒-90i」,其所在的恒星系有 8 顆行星,該恒星系的行星數(shù)與太陽系的行星數(shù)相同。但開普勒 -90i 行星比地球大 30%,屬于超級地球。

在 2021 世界人工智能大會上,騰訊公司董事會主席馬化騰透露,騰訊將和國家天文臺聯(lián)合啟動「探星計劃」,將 AI 技術(shù)用于尋找脈沖星,探索宇宙。雙方將基于騰訊優(yōu)圖實(shí)驗(yàn)室領(lǐng)先的計算機(jī)視覺技術(shù)、騰訊云的計算能力,用「云+AI」幫助中國天眼 FAST 處理每天接收到的龐大數(shù)據(jù),并通過視覺 AI 分析找到脈沖星線索,輔助快速射電暴和近密雙星系統(tǒng)中脈沖星搜索。

2022 年 6 月,葡萄牙研究人員開發(fā)出人工智能軟件 SHEEP,來自動識別觀測目標(biāo)是恒星、星系、類星體、超新星還是星云。與其他模式識別軟件不同,SHEEP 軟件首先計算紅移數(shù)據(jù)作為分類模式的附加特征,再通過觀測圖像與坐標(biāo)數(shù)據(jù)相結(jié)合,對編目天體進(jìn)行分類。相關(guān)成果發(fā)表在《天文學(xué)與天體物理學(xué)》刊物上。

如今,越來越多的科研人員正將 AI 技術(shù)作為一種強(qiáng)大的探索工具,提供豐富而復(fù)雜的數(shù)據(jù)、分類星系、篩選數(shù)據(jù)以獲取信號、發(fā)現(xiàn)脈沖星、識別不尋常的系外行星等,從而助推天文學(xué)領(lǐng)域革新,毫無疑問 AI 將激發(fā)新活力、創(chuàng)造新可能。

參考資料:

1.https://iopscience.iop.org/article/10.3847/1538-4365/ad2dea

2.https://mp.weixin.qq.com/s/7frn8XvRJ-QWHCFwtsixzw

3.http://www.stdaily.com/index/kejixinwen/202207/d42b187caded4c7db61582566d7a6ce6.shtml

4.https://www.most.gov.cn/gnwkjdt/202206/t20220624_181299.html

歡迎掃碼關(guān)注深i科普!

我們將定期推出

公益、免費(fèi)、優(yōu)惠的科普活動和科普好物!


聽說,打賞我的人最后都找到了真愛。
做科普,我們是認(rèn)真的!
掃描關(guān)注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認(rèn)識科普小朋友
  • 成為科學(xué)小記者