「噴火を検出する!」現場にコミットする機械学習ノート【vol.17】

   
★AIDB会員限定Discordを開設いたしました! ログインの上、マイページをご覧ください。

★企業と人材のマッチングサービスを準備中です。アンケートのご協力をお願いいたします!↓

最終更新日:2022/12/05

こんにちは。エンジニアライターの小原です。

連載「現場にコミットする機械学習ノート」では、論文を詳しく読み解きながら、現場で使えるAI実装のヒントを記録していきたいと思います。


AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

前回の記事では、「稲と雑草を見分ける」を扱いました。

今回は、イタリアのIstituto Nazionale di Geofisica e Vulcanologia(INGV)のC. Corradinoらが2020年3月に発表した「噴火の検出」に関する論文を扱っていきます。

もくじ
1章 噴火検出の重要性
2章 視認性の判断と、噴火活動の開始の検出
2.1 研究目的
2.2 研究手法
2.2.1 入力データ
2.2.2 手法
2.2.3 前処理
2.2.4 決定木分類器
2.2.5 BoWベースの分類器
2.3 研究結果
2.3.1 2019年7月18日~19日の噴火における結果
2.3.2 2019年9月の噴火における結果
2.3.3 2019年12月の噴火イベント
2.3.4 DT分類器の出力の混同行列
2.3.5 BoW ベースの分類器の混同行列

■前回の記事:【vol.16】稲と雑草を見分ける

1章
噴火検出の重要性

噴火は、その段階によって溶岩流、ガス放出、爆発、テフラ落下などの様々な危険をもたらす可能性があり、これらは人や財産に対する重大な脅威となります。したがって、噴火のタイムリーな特定と信頼性の高い評価は、危険を伴う潜在的な影響を迅速に予測し、人や重要なインフラへの被災リスクを軽減するための措置を講じるうえで非常に重要です。

噴火を早急に検出できる技術は、例えば市民を守る必要がある行政機関や、あるいは活火山の近くで観光業などを営んでいる業者にとって価値あるものといえるでしょう。

そこでイタリアのC. Corradinoらは、決定木とBag of Wordsベースの分類器を用いて噴火を検出することに挑戦しました。

2章
視認性の判断と、噴火活動の開始の検出

まずはC. Corradinoらの研究におけるミッション・手法・結果をまとめます。

✔️ミッション
噴火活動の種類を認識し、分類したい。

✔️解決手法
決定木で視認レベルを、Bag of Words(BoW)で火山の状態を、それぞれ判別するシステムを提案した。

✔️結果
提案システムは、視認レベル(0.99以上)と状態(0.9)を高精度に分類した。

研究の詳細を以下で述べます。

2.1 研究目的

噴火する際には、山の周辺が厚い火山雲に覆われているため、活動の観測が制限されたり、妨げられたりする可能性があります。また、悪天候だとカメラの視認性は下がるので、結果として監視エリアで何が起こっているかがはっきりとはわからず、取得した画像の信頼性に影響を与える可能性があります。

このように情報にばらつきがある中、山頂クレーターで何が起きているのか、つまりどのような噴火活動が起きているのかを複数のカメラの情報からリアルタイムに把握します。

C. Corradinoらは、決定木とBag of Words(BoW)を用いてこの課題をクリアしようと試みました。

2.2 研究手法

C. Corradinoらは、決定木で視界レベルをBoWで火山の活動状態を判断するシステムを提案しました。

2.2.1 入力データ

・エトナ山の周辺に設置された5台の赤外線カメラから取得されたデータ


エトナ山に設置された赤外線カメラの位置。Google Earthによる5つのクレーターのある山頂付近の図。色は、赤外線カメラで撮影した画像の違いを表しています。ENT(赤)、ESR(黄)、EMOT(紫)、EBT(緑)、EMCT(青)





2.2.2 手法

3つのタスクからなる熱画像の機械学習分類器のスキーム。
(i)前処理、(ii)決定木分類器、(iii)BoWベースの分類器

2.2.3 前処理

・各カメラについて、カラーバーと、通常フレームに埋め込まれている取得時間とカメラ名の情報を除外するようにフレームをトリミングします。
・2つの分類器を訓練するために、2つの別々の訓練データセットを用意します。
 1. DT分類器のために「クリア」or 「ぼやけている」とラベル付け
2. BoWベースの分類器のために「爆発性」「噴出性」「爆発と噴出性」「ガス抜き」「活動なし」の5カテゴリーにラベル付け

2.2.4 決定木分類器

決定木分類器で視界レベルを判断します。熱画像のグレースケール強度ヒストグラムと対応する「クリア」「ぼやけている」の2クラスから適切な閾値を設定することで2クラス間の可視性条件を区別出来ます。

10レベルのグレーカラーヒストグラムは熱画像をよく表現しており、DT分類器は各強度レベルに対して適切なしきい値を導き出すことができます。このようにして、各画像に対して1×10のベクトルが作成され、対応するクラスが割り当てられます。(「クリア」の場合は0、「ぼやけている」の場合は1)

2.2.5 BoWベースの分類器

BoWベースの分類器で活動状況を判断します。抽出された画像の特徴を単語とするテキスト文書として画像を表現します。BoWを用いてモデル化された画像は、代表的な視覚的単語の集合の出現頻度のヒストグラムで表されます。BoWベースの分類器は、火山活動の特定のタイプを認識し、噴火活動の開始を検出するように設計されています。

(1)訓練とテストに使用する画像データセットを設定する。訓練データセットに含まれる各画像は、専門家の知識を用いて、事前に定義されたカテゴリ(「爆発的」、「噴出的」、「爆発的で噴出的」、「脱ガス」、「活動なし」)のいずれかに属するものとしてラベル付けされます。
(2)Speeded up Robust Features(SURF)法を用いて画像の特徴を検出、記述します。
(3)k-means クラスタリング法を用いてグループ化されコードブックが生成される。各中心は特徴、すなわち視覚的な単語を表しています。このようにして各画像は、抽出された視覚語の出現ヒストグラム(500個)で特徴づけられます。
(4)以上で生成されたBoWヒストグラムをECOCフレームワークを用いて分類します。

以上二つの分類器を使うことで、各赤外線カメラの画像に2つの属性を関連付けることが出来ます。

2.3 研究結果

提案システムは視認レベル(0.99以上)と状態(0.9)を高精度に分類しました。

2.3.1 2019年7月18日~19日の噴火における結果

この特定の時間帯の視界条件はすべての赤外線カメラで良好であり、結果の信頼性を確認することができました。すべての赤外線カメラからの結果を見ることで、溶岩流と爆発によって特徴づけられた噴火活動の包括的な記述を得ることができることは注目に値します。

(a)EMCT(b)EMOT(c)ESR(d)EBT(e)ENTによって2019年7月19日01:05 UTCに取得された生画像。
2019年7月19日に発生した噴火活動のDTとBoWベースの分類器のアルゴリズムの結果。

2.3.2 2019年9月の噴火における結果

EMOTカメラのみが爆発的な活動が行われていることを検出し、他のカメラは活動を検出しませんでした。視認性レベルを見ると、EMOT のみが良好な視認性レベルを有しており、信頼性の高い結果が得られていることがわかります。一方、他のカメラの限界視認レベルは、監視している地域の活動が不確実であることを示しています。

9月9日に撮影された生の画像。(a)EMCT、(b)EMOT、(c)ESR、(d)EBT、(e)ENT
2019年9月9日の噴火活動のDTおよびBoWベースの分類器のアルゴリズムの結果。

2.3.3 2019年12月の噴火イベント

発生している爆発的な活動はEMOTカメラとENTカメラの両方で検出されました。EBTカメラで監視していたエリアでは、DT分類器は「クリア」と判断したものの、火山活動は検出されていませんでした。

2019年12月6日に撮影された生の画像。(a)EMCT、(b)EMOT、(c)ESR、(d)EBT、(e)ENT
2019年12月6日のNSECでの噴火活動のDTおよびBoWベースの分類器のアルゴリズム結果

2.3.4 DT分類器の出力の混同行列

DT分類器は非常に高い精度を示しており、各サーマルカメラの視認条件を決定するための貴重なツールとなっていると言えます。

DT分類器の出力の混同行列

2.3.5 BoW ベースの分類器の混同行列

分類器の平均精度は0.9でした。注目すべきは、山頂エリアに近いカメラの視認性測定は信頼性が高いですが、最も遠いカメラ(EBTとENT)の視認性測定は、本質的に信頼性が低いことです。そのため、最も遠いカメラでは(人間のオペレータであっても)曖昧なケースがより頻繁に発生する可能性があります。

BoWベースの分類器のACC指数は、「爆発的」、「噴出的」、「爆発的で噴出的」、「活動なし」のカテゴリではかなり高い値(0.960から0.984)を示します。最も低い値(0.620)は「脱ガス」のカテゴリで得られました。「活動なし」に「脱ガス」が誤認識される割合(0.380)によって示されるように、「脱ガス」の様子は曇っている時の画像特徴に類似しているように見えるかもしれません。

BoW ベースの分類器の混同行列

提案手法で明らかになった二つの情報を統合することで、監視対象の現象を異なる視点から完全に記述し、より詳細な情報をリアルタイムで自動取得することが可能となります。

研究紹介は以上です。

このような技術を使うことで、火山周辺に住む住民の安全を確保できるようになるかもしれないでしょう。

今回は「噴火の検出」について解説しました。次回は「YouTubeのコメントを複数の手法で分析」を取り上げていきます。お楽しみに!

【現場にコミットする機械学習ノート・バックナンバー】


この記事で取り扱った論文:C. Corradino, G. Ganci, A. Cappello, G. Bilotta, S. Calvari and C. D. Negro,”Recognizing Eruptions of Mount Etna through Machine Learning Using Multiperspective Infrared Images”, Remote Sens. 2020, 12(6), 970 DOI


※過去の全記事を閲覧されたい方はこちらからご登録よろしくお願いします!(会員登録は無料です。)



■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






業界/カテゴリー

PAGE TOP