産業技術総合研究所 衛星画像分析コンテスト
国立研究開発法人産業技術総合研究所
  • 締切: 2018年04月26日(残り0日)
  • 応募:1103件 / 65人
  • 総額¥800,000

チュートリアル 

ディープラーニングを使ったチュートリアルを公開しました。参考にしてみてください。


概要

地球の周りを周回する地球観測衛星は、様々な情報を私たちに教えてくれます。
衛星が教えてくれる情報は、森林・海洋等のモニタリング、インフラ管理や都市計画支援、農業の活性化や災害の監視に至るまで、様々な分野で活用されています。

現在、宇宙産業の市場規模は全世界で30兆円以上と言われており、特に近年は、衛星の小型化や、大量の小型衛星群での集合的観測データによって地球の大気や地表の高精度な三次元画像の作成を可能にするコンステレーション化、衛星画像の高解像度化等の技術革新を背景とした宇宙データの質・量が飛躍的な向上に伴い、新たな宇宙産業の可能性が広がりつつあります。さらに、宇宙データを様々なデータやAI技術と組み合わせることによって、幅広い分野の課題を解決することが期待されています。

こうした中、国立研究開発法人産業技術総合研究所(以下産総研)でも、宇宙ビジネスの発展に向けた衛星データの産業利用の拡大に取り組んでいます。

産総研の保有する衛星データは、地球全体の領域を20年以上の期間に渡ってカバーし、人間の目には見えない近赤外線・熱赤外線といった、可視光線以外の波長も観測しています。将来的には、30mの分解能を50cmまで高分解能化し、さらには、光学センサでは観測できない地表の様子を観測できるマイクロ波センサへの対応、動画データへの対応など、大幅な性能向上、機能拡大を計画しています。構造物の歪みまで数センチ単位での把握が可能になる等、新たなデータを扱えるようになることで、宇宙データ産業利用は急速に発展してくと考えられます。

しかし、ビッグデータ化していく宇宙データを活用するには、大量の計算資源が必要不可欠です。
この課題を解決するために、産総研は計算資源の環境整備にも力を入れており、超高速のAIクラウドコンピューティング環境「ABCI」を導入後、外部にも利用を公開し、AIの社会実装を強力に促進していきます。

また、AIの加速化には「オープン・イノベーション」を活用した産学官が集まる場作りも重要と考えています。そこで、オープン・イノベーションの効果的な環境づくり(人材の発掘や育成、新たなデータ活用法の探索、研究コミュニティの拡大等)を行うことを目的に、その取り組みの第1弾として、産総研の保有する衛星データを活用した衛星画像分析コンテストを実施します。

今後も、ABCIを利用した本格的な分析コンテストを予定しています。

皆さまのご応募をお待ちしています。




開催部門
「①予測部門」と「②アイデア部門」の2部門を開催します。いずれか1部門のみでの参加も可能です。

部門①予測部門②アイデア部門
課題ゴルフ場の検出衛星データの活用アイデア
データ衛星画像衛星画像や衛星動画
懸賞/賞金1位:富士通賞(30万円)
2位:ABBALab賞(20万円)
3位:DDN賞(10万円)
オラクル賞(10万円)
さくらインターネット賞(10万円)
提出物予測モデルレポート
評価精度(定量評価)関係者による審査(定性評価)

懸賞金は協賛企業からの協賛金より支出されます



①予測部門
国立研究開発法人産業技術総合研究所 人工知能研究センターの提供する衛星画像データを使用し、各画像に対してゴルフ場が含まれているか否かを判別する、画像認識アルゴリズムの作成に挑戦していただきます。
使用するデータはLandsat-8で撮影された衛星画像をグリッド分割したパッチ画像 724,879枚です。

データ概要
 エリア:日本国内全域及び海外7エリア
 大きさ:32px × 32px × 7チャネル
 分解能:1pxあたり30m
 枚 数:学習用:296,182枚、評価用:428,697枚

正例・負例の定義
 画像データの総面積の5%以上をゴルフ場が占める場合は、”正例”
 画像データの中にゴルフ場が全く含まれていない場合は、”負例”
 ※中間のカバレッジ(0〜5%)の画像は使用していません。




チャネルの詳細
Landsat 8 衛星に搭載されているセンサーは、可視から短波長赤外波長にあたる0.43~2.29µmの観測波長帯を持ち、通常は太陽光の反射成分を観測しています。
本コンテストの提供データは、以下に示すバンド1~7を利用しており、人間の目で見える波長以外のバンドを含みます。例えば、高温からの輻射が存在すると、観測波長が長くなるにつれて輝度値が高くなることが分かっています。

 バンド 波長 [µm]
 1   0.43–0.45(沿岸エアロゾル)
 2   0.45–0.51(可視光「青」)
 3   0.53–0.59(可視光「緑」)
 4   0.64–0.67(可視光「赤」)
 5   0.85–0.88(近赤外)
 6   1.57–1.65(短波赤外線1)
 7   2.11–2.29(短波赤外線2)







②アイデア部門
衛星画像や衛星動画といったデータからは、識別した対象物の状態や変化を読み取ることができます。

本部門では、衛星データ活用アイデアを募集します。
衛星データから、何を見るとどういったことが分かり、その結果をどう活用できるか、一連のストーリーを考えてみてください。
思いついたアイデアは、データのダウンロードページで取得できる「アイデア部門_テンプレート」に倣って、以下の要点をレポート5ページに整理し、提出してください。

・識別する対象
・分かること
・想定される利用者
・解決できる課題

なお、本部門で言う衛星データは、本コンテストの提供データではなく、今後対応予定の高分解能画像や衛星動画までを含めたものを指します。
宇宙ビジネスの発展につながるような画期的なアイデアを期待します。

(参考事例)
米 Orbital Insight 社は、衛星データから石油タンクの蓋に映し出された影を元に、世界中の石油備蓄量を推計。政府や投資家等へ迅速に需給ステータスを通知するソリューションを展開。(図は、Orbital Insight社ホームページより引用した石油タンクの衛星画像)





レポートを送信


評価関数
精度評価は、評価関数「IOU」を使用します(下式参照)。
この関数はモデルの予測精度の”良さ”を表すため、大きい値であるほど優れています。







最終順位の決定
1.予測部門の最終順位は、開催期間中とは異なる正解データセットによる評価値で決定します。
 スコアボードの順位とスコアは、コンテスト終了と同時に、自動的に最終評価に切り替わります。

2.評価指標が、タイ(同値)の場合は、早い日時でご応募いただいた参加者を上位とします。

3.順位確定の際に下記の情報を提出していただきます。
 ・予測モデルのソースコード
 ・学習済モデル
 ・予測結果の再現の為の手順書(前処理部分、学習部分、予測部分が分かるよう明記)
 ・実行環境(OSのバージョン、使用ソフトウェア及び解析手法)
 ・乱数シード(Random Forest等の乱数を利用した手法の場合)
 ・各説明変数の予測モデルへの寄与度(寄与度の算出が可能な手法を用いた場合)
 ・データの解釈、工夫点、モデリングから得られる示唆等

4.再現性検証期間中、入賞候補者及び、その提出モデルが下記いずれかに該当する場合は懸賞の獲得資格を失います。
 ・事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 ・参加条件やルールを満たしていない
 ・モデルの予測結果を再現できない
 ・新しい画像に対して予測できない

参加条件
サイト利用規約の全ての条項に同意すること 。(ただし、第13条は以下を適用します)
 利用者は、弊社からコンテストの入賞の連絡を受けた場合、必要に応じて弊社と別途契約を取り交わすものとします。
 入賞後の手続きにおいては、別途両者間で特別な合意がない限り、入賞対象者は、本件権利を国立研究開発法人産業技術総合研究所へ無償譲渡することにつき同意しなければなりません。
 入賞対象者は、協賛企業による協賛金より拠出した懸賞金を受け取る権利を得るものとします。

1ユーザにつき1アカウント
  コンテスト参加者は1人につき1アカウントまでです。
  ただし、アカウントが1つという条件の元であれば、チームでの参加も可能とします。

他参加者との情報共有は禁止
  コンテスト参加者が同じチーム以外の参加者と本コンテストの予測に関連するデータ・ソースコードを共有する行為は禁止です。

手動でのラベル付は禁止
  手動でラベル付けした結果を提出することは禁止します。

学習データの改ざんは禁止
  学習データのラベルを書き換えてモデルを学習することは禁止します。
  ただし、学習用画像データを画像処理手法により自動で水増しして学習用データとして利用することは可能です。

学習データは提供データのみ
  配布するデータ以外のデータを用いてモデルを学習することは禁止します。

APIの使用(Google Cloud Vision API等)は禁止
   ただし、 オープンソース(ソースが明確で、誰でもアクセスでき、かつ商用ではない) の学習済みモデルやライブラリ(tensorflow, chainer, keras, etc)は使用可能です。
   学習済みモデルを使用する際は、ソース(論文のリンク等)を明記してください。

分析ガイドライン
1.前処理、学習、予測がわかるようにそれぞれ分けて実装してください。
  ・例えばPythonで実装する場合、前処理はpreprocess.py、学習はtrain.py、予測はpredict.pyをそれぞれ実行すれば処理が進むように実装する。
  ・実装例「sample_code.zip」(ダウンロードページ)を参考にしてください。

2.ソースコードとともに、学習済みモデルも提出してください。
  ・検収する際は学習済みモデルにより評価用データに対する予測値(応募用ファイル)を出力し、評価したときにスコアボードのスコアを再現できるかどうかを確認します。

3.ソースコードを提出する前に、最終提出した分析結果の予測値とご自身の環境で出力した予測値とが一致するか確認ください。
  ・評価用データや学習済みモデルなどのパスが正しいか確認してください。
  ・処理を実行するためのコマンドが正しいか確認してください。
2018年2月28日(水) コンテスト開始
2018年4月26日(木) コンテスト終了
2018年4月30日(月) 予測モデルソースコードの提出締切 (※入賞候補連絡を受け取った方)
2018年5月下旬   検収・審査にて入賞者を決定
2018年夏頃     入賞者による発表会(予定)

クライアント:国立研究開発法人産業技術総合研究所
協賛: