2021年8月4日、株式会社スペースシフト主催「新建造物検知アルゴリズム作成」コンペティションの表彰式が開催されました。当日は、1位から3位までの上位入賞者が表彰され、各入賞者による解法プレゼンテーションも行われました。また、プレゼンテーション終了後には、質疑応答も実施。オンライン開催ということもあり、多くの方が参加し、プレゼンターの有意義な発表に耳を傾けていました。 式の司会進行を務めたのは、株式会社スペースシフトの多田玉青氏。株式会社スペースシフト代表取締役CEO金本成生氏の主催者代表挨拶で表彰式は幕を開けました。
▼動画はコチラ▼
主催者あいさつ
株式会社スペースシフト 代表取締役CEO 金本 成生 氏 「皆様、本日はお集まりいただきまして誠にありがとうございます。株式会社スペースシフト代表の金本と申します。ありがたいことに、本コンペティションは大変多くの方にご参加いただきました。衛星データに興味を持っていただいたこと、そして貴重な時間を使ってコンペティションにご参加いただきましたことに、心から感謝申し上げます。今回のコンペティションを機に、より衛星データに関する理解や、それを活用した社会課題の解決にも興味を持っていただければと思っております。本日は、どうぞよろしくお願いいたします。」 開会の挨拶に続き、運営を代表してSIGNATE池之上氏より、コンペティション概要の説明が行われました。
株式会社SIGNATE データサイエンティスト 池之上陽平氏 「本コンペティションは、SAR画像から新規建造物を検出する、衛星画像を題材としたテーマでした。タスクとしては、画像内の各ピクセルにおいて新規建造物に概要する部分のみをラベル付けするといったものです。画像認識の一分野であるセマンティックセグメンテーションというタスクに類するものですが、時系列の要素を含む点が、本コンペティションの特徴的な部分になっています。評価指標については、FBetaScoreを用いております。こちらは、分類タスクで用いられることの多いF値をより一般化した指標です。参加者の皆様には、この指標が最も良い値となる予測アルゴリズムを作成いただきました。その上位3名の方に、これから解法のプレゼンテーションを行っていただきますので、そちらを楽しみにしていただければと思います。」
入賞者の発表
表彰式はいよいよ、メインイベントである上位入賞者の発表と、解法のプレゼンテーションへ。 まずは、司会の多田氏から入賞者の発表と表彰が行われました。第3位に入賞されたのは、kobababa氏。続いて、準優勝を果たしたのはpizza3900氏。そして、見事第1位に輝いたのは、motokimura氏。
成績上位者プレゼンテーション
入賞者の表彰が終わると、入賞者によるプレゼンテーションが始まりました。発表は第3位から順に行われ、発表後には質疑応答も実施されました。各入賞者の発表概要と質疑応答は、以下の通りです。
第3位
kobababa氏
「解法の概要としては、6つのモデルを使用してアンサンブルを行いました。訓練では元の画像が大きすぎたため、訓練数を増やす目的も兼ねて2倍にアップサンプリングしたものを使用しています。また、課題だと感じていたデータの少なさに関しては、オーギュメンテーションを用いることで対策を行いました。私はかなり重いオーギュメンテーションをかけたので、それが好成績につながったのではないかと思っています。また、モデルのバリアンスがかなり大きい実感があったので、アンサンブルもとても重要だったのではと思います。ただ、なるべく多様性を持たせたモデルをアンサンブルしたかったのですが、なかなか良いと思えるバリデーションスコアを出すモデルには辿り着けませんでした。コンペ終了後にスコアを確認したところ、バリデーションセットに過学習していたようでした。実験回数よりもモデルの正しい評価を優先すればよかったかなと思いますが、こちらは反省点として次回以降に活かしていければと思います。」 視聴者からの質問:機械学習のスキルはどのように身につけられたのでしょうか? kobababa氏の回答:現在高校生なのですが、中学生の時に機械学習に興味を持ちまして、サイトを用いて独学で機械学習全般に関する知識を身につけました。 視聴者からの質問:アップサンプリングは画像サイズを合わせるためではないということでしょうか? kobababa氏の回答:はい。今回自分が訓練に用いた画像は、オリジナルの画像を切り抜いているので、画像サイズを合わせるためではないです。意図としては、画像の解像度が低く、かなり小さな領域を予測しなければいけない点をなるべく改善するためです。また、訓練データを増やす意図もありました。
第2位
pizza3900氏
「まず、前処理としては画素値のクリップを行いました。学習に関しては、入力サイズが512から718程度のランダムサイズでクロップしていまして、そこでオーギュメンテーションとしてフリップは6回転、あとは分割する形のMosaic等を使用しています。予測では垂直および水平のフリップ、クロップサイズも3パターン、これらをずらしながら予測して重ね合わせる処理を用いました。アンサンブル部分ではいろいろ試した結果、15モデル使用しましたが、最後にスコアを見てみると9モデルのアンサンブルがスコアとしては最も良かったです。他の方との差別化という観点で言えば、前処理で行った画素値のクリップがポイントだったかと思います。これで情報量の多い、意味のある画素値を学習させることができたのが、スコアにも効いたと思っています。」 視聴者からの質問:アンサンブル間の重みづけでは、どのような注意をしていますか? pizza3900氏の回答:私の場合、アンサンブルは全て同じ重みです。モデルの数やバリエーションはいろいろ試しましたが、重みは変えずに全て等倍で、数やバリエーションの部分で試行錯誤を行いました。 視聴者からの質問:独学で機械学習スキルを身につけられたとのことですが、どのようなきっかけで機械学習の分野を学ぼうと思われたのでしょうか? pizza3900氏の回答:数年前、ビッグデータという言葉が流行り始めた頃に関連書籍を手に取ったのがきっかけだったと思います。そこまで明確な、学び始めた理由のようなものはないかもしれません。」
第1位
motokimura氏
「今回はニューラルネットワークを用いたセグメンテーションを行いましたが、このニューラルネットワークの学習の安定化のために、SAR画像に含まれる極端に大きな画素値を除去しました。推論と後処理に関しては、推論時のTTAとして左右上下のフリップと画像の拡大、これは1.1倍と1.25倍という2種類の拡大方法を採用しています。私の解法のポイントとしては、入力画像の拡大と異なる拡大率のアンサンブルというのが挙げられると思います。小さい建物等の境界付近でセグメンテーションがぼやけてしまう傾向があり、その対策として入力画像を拡大してモデルに投入しました。UNetの中では特徴を縮小するような処理を行ってしまうため、異なる拡大率をアンサンブルすることで、特徴の位置情報が失われることを一定緩和できたのではないかと考えています。」 視聴者からの質問:クロスバリデーションはどのように切りましたでしょうか? motokimura氏の回答:元々、画像が提供されたシーンに対してランダムに分割を行いました。 視聴者の質問:今回のコンペの作業時間はどれくらいでしたでしょうか? motokimura氏の回答:取り組んだ時間はおそらく、20時間ほどかと思います。土日や、平日の仕事終わりの時間を活用して作業を進めました。過去のコンペで使った手法を用いたので、そこで少しは効率化できたかなと思います。 3名の入賞者の表彰と解法プレゼンテーションが終了し、最後に閉会のご挨拶として、主催者の株式会社スペースシフト齋藤亮氏よりお話をいただき、閉会となりました。
株式会社スペースシフト CTO 齋藤 亮 氏 「本日は、ご参加いただきましてありがとうございました。今回のコンペティションの背景には人材発掘という意図もあり、対象者を日本在住の方限定にしたため、果たしてどのくらい集まるか不安もありました。しかし、最終的には82名からの投稿があったということで、他のコンペティションと比べても遜色ないほど人も集まり、嬉しく思っています。今回は、衛星のデータが少なかったという声もありましたが、限られたデータの中でもこれだけ多くの工夫を凝らしていただき、非常に素晴らしいなと感銘を受けました。引き続き、衛星+AIの領域に興味を持っていただければと思います。本日は皆様ありがとうございました。」
まとめ
人口増加に伴う居住地の確保。そのためには建物をどこに、どの程度建てるべきか。そんな社会が抱える課題を解決するために開催された今回のコンペティション。主催者側の期待に応えるかのように、データ量の少なさをはじめとした制約条件にも負けず、入賞者の皆さんが、各々に工夫を凝らしていた点が印象的です。また、高校生が入賞するなど、明るい未来を期待させるようなものも感じ取れる表彰式でした。 <株式会社スペースシフト「新建造物検知アルゴリズム作成」コンペティションの詳細はこちら>