2024年3月12日、事前学習用データセット生成モジュールコンテスト「自然画像を用いないAIの学習への挑戦」コンペティションの表彰式が開催されました。当日は定量評価部門の1位から3位までの入賞者と定性評価部門の受賞者が表彰され、各入賞者による解法のプレゼンテーションが行われました。プレゼンテーション終了後には質疑応答も実施。AIの社会実装に向けた熱い想いが飛び交う、素晴らしい表彰式でした。 まずは、コンペティションの主催者を務めた国立研究開発法人 新エネルギー・産業技術総合開発機構(以下、NEDO)新氏による主催者挨拶が行われました。


▼動画はコチラ▼


主催者挨拶

1-Competition-Report-Pre-training-Dataset

NEDO ロボット・AI部 専門調査員 プロジェクトマネジャー 新 淳 氏

「表彰式にご参加いただき誠にありがとうございます。本コンペティションの主催であるNEDOは、経済産業省の管轄組織として、エネルギー技術及び産業技術の強化をミッションとする研究機関です。明日の日本を支えるための研究を産官学の研究者に委託する他、世の中の知恵を広く結集することや優秀な人材を発掘することを目的に、今回のコンペティションのような企画を推進しています。今回は、NEDOで2例目となるコンペティションだったのですが、表彰式まで無事に漕ぎ着けることができ、嬉しく思います。入賞者の皆様、そしてすべての参加者の皆様のおかげです。本表彰式では、入賞者の方々を称えると共に皆様の工夫を発表していただき、相互の啓発の場にしたいと考えています。本日はどうぞよろしくお願いいたします。」 その後、NEDO 末岡氏からコンペティション概要の説明が行われました。

コンペティション概要

2-Competition-Report-Pre-training-Dataset

NEDO ロボット・AI部 主査 末岡 雅則 氏

「それでは、私から本コンペティションの概要について説明いたします。まず、このコンペティションの目的は2つありまして、1つは、大学や企業などさまざまな方に参加いただき、競争的な環境下で技術開発を促すこと。そしてもう1つは、各入賞者の開発したモジュールをオープンソースソフトウエアとして公開し、本技術の普及を図ることです。「自然画像を用いない事前学習用データセットを生成するモジュールの開発」というテーマのもと、プライバシーや著作権の侵害の懸念がないデータセットを大量に生成していただきました。 懸賞としては、プログラムで機械的に判定した定量評価と、レポートをもとに有識者が「新規性」と「了解性」の2つの視点から判定した定性評価の2つの部門で入賞者を決定しました。なお、本年度は前回よりも参加人数が増え、海外の方にも多数参加いただきました。多くの方に参加いただいたことに感謝申し上げます。」

入賞者の発表

表彰式はいよいよ、メインイベントである入賞者の表彰と、解法のプレゼンテーションへ。まずは、定量評価部門1位、そして定性評価も受賞したFYSignate1009氏による解法のプレゼンテーションが行われました。

定量評価部門 第1位 定性評価部門 受賞 FYSignate1009 氏

3-Competition-Report-Pre-training-Dataset

「既存文献の調査結果や、予選の説明会でも色の扱いについて注目されていたことをもとに、カラーのFractal DBをベースに進めていくことにしました。ただ、参考文献のとおりにそのまま組み立てたわけではなく、今回のテーマに合わせてカスタマイズした点も多かったです。例えば、既存文献ではMulti-instanceの精度が最も高いという結果になっていたのですが、一つの画像の中に複数のクラスや物体が描写されているため、今回の分類問題ではそのまま適用できない部分がありました。また、サンプルの画像の色合いが派手で、事前学習後のフィルターも少しカラフルになっていたので、転移学習させる際に悪い影響が出てしまうのではないかと考えました。それらを踏まえて、技法の改良を行いました。まず、Multi-instanceのデータセットを1物体のマルチクラス分類に変更しました。また、カラーリングの対策としては、Fractalと背景の着色方法を同じにした他、パラメータの調整などにより、Fractalの着色方法を少し穏やかな色合いになるよう変更しました。また、さらなる精度向上を目指して、クラス内の一貫性を保ちつつも多様性も確保するためにMix Upを行ったところ、転移性能以外の観点でも良い結果を得ることができました。」 続いて、定量評価部門2位、そして定性評価も受賞したPetr(CZ)氏による解法のプレゼンテーションが行われました。

定量評価部門 第2位 定性評価部門 受賞 Petr(CZ)氏

4-Competition-Report-Pre-training-Dataset

「まず最初に、データセットにおいて何が重要なのかを整理したところ、3つ挙げられると考えました。1つ目は画像の数が無限であること、2つ目は画像が十分に鮮明であること、3つ目は、画像を用いた学習があまり容易ではないということです。また、ユニバーサルモデルを考える上では、オブジェクトの位置、色、サイズが異なるだけではなく、回転することも考慮しなければいけません。これらを踏まえて、ベジェ曲線を使いつつ、数字を組み合わせた分析を行いました。アルゴリズムの詳細としては、黒背景の空のイメージを作成し、位置、サイズ、フォントなどをランダムにした画像を埋め込んだ上で、ベジェ曲線の制御点を決定しました。次に、ベジェ曲線を回転させ、色やサイズを変更しました。クラスを決める上では、ベジェ曲線の次数、太さ、曲線間の距離、始点、またぼかしの強さなどを組み合わせて考えました。こうした工夫により、クラスにおけるランダム性が実現できました。ただ、より良いスコアを得るためには、ネットワークは最も困難なパターンを学習しなければいけません。そのために、データにオーバーフィットすること、また複雑なタスクを解決する一般的なカーネルの確立を行いました。」 続けて、定量評価部門3位を受賞したaskbox 氏による解法のプレゼンテーションが行われました。

定量評価部門 第3位 askbox 氏

5-Competition-Report-Pre-training-Dataset

「開発したモジュールのポイントは、既存のFractal画像を利用せず、同じ漢字・文字が出現した生成画像は同じクラスと仮定した点です。また、精度向上のポイントとしては、漢字・文字の画像をクラスタリング処理、各クラスの文字数・各文字の大きさ・描画位置・回転角度・上下左右反転・合成の割合調整等の試行錯誤を重ねました。モジュールのアルゴリズムとしては、フェーズを2つに分けて、フェーズ1では漢字・文字の画像のクラスタリングを行いました。具体的には、3万以上の漢字・文字の画像をVAEで100次元に圧縮し、そのデータをk-means法やPCAを用いて1000クラスに調整しました。クラスタリングしたサンプルを見ると、同じクラスは似ている漢字が出現していることがわかります。フェーズ2では、フェーズ1で作った100クラスのCSVデータを読み込み、画像生成を行いました。まず行ったのは、各クラスに出現した漢字・文字の抽出です。その後、組み合わせを増やすためにフォントの種類や文字の大きさ、描画位置・回転速度・上下左右反転などの項目をランダムに選択しました。生成した画像リストの混合比もランダムに選択し、RGB画像を書き出しました。今回、3位入賞につながったのは、多様な漢字・文字のパターンを活かして画像処理の組み合わせの数を増やし、画像合成後に多様な拡張画像を生成した点だと思います。」 最後に、定性評価部門を受賞したKot 氏による解法のプレゼンテーションが行われました。

定性評価部門 受賞 Kot 氏

6-Competition-Report-Pre-training-Dataset

「先行研究では、カテゴリごとに単一のインスタンスで学習できること、ランダムなパッチテクスチャを付与するデータ拡張は有効であること、また3次元点群はYaw軸のみ回転させたものが最も精度が良いことなどについて述べられていました。そこで、3D-OFDBをベースに点群データ拡張と微分可能レンダラーの導入による、表現力の向上によって転移学習の精度改善を狙いました。本ソリューションの1つ目の工夫点は、OpenGLによるレンダリングからPytorch3Dにある微分可能レンダラーに変更したことです。微分可能レンダラーを使用したことで、手前に見える点だけでなく奥行き方向にある点を使って色を構成し、元の大きさを変更してFractal構造の輪郭が壊れないよう調整することが可能になりました。2つ目の工夫点は、点群データ拡張を導入したことです。回転やスケーリング、並行移動、ノイズ付与といった単純なものから、PointWOLFのような局所変形まで含めた手法の組み合わせを探索しました。こうして、点群に対するさまざまなデータ拡張機能を組み合わせたり画像拡張を実施したりと、転移学習の精度を改善する条件を探索したことが、精度向上につながったと考えています。」 全入賞者による解法プレゼンテーションが終了した後、以下のような質問が寄せられました。 視聴者からの質問:今回、素晴らしい解法がたくさん寄せられましたが、自分の解法を論文にしようと考えている方はいますか? 入賞者の回答:現在大学に在籍しているので、ぜひ近いうちに論文にして発表したいと思います。 入賞者の回答:論文を書くのは苦手なのですが、これを機に挑戦してみたいです。 視聴者からの質問:今回作ったモデルの活用方法について、何か考えていることはありますか? 入賞者の回答:昨今、大きなデータセットが必要とされる機会が増えてきています。その際にインターネットから画像をダウンロードして使うこともできますが、ノイズが入っていたり、クリアではなかったりと問題があることが多いです。そうした課題の解決に向けて、今回開発したモデルを活用できればと考えています。 入賞者の回答:同感です。これまでは大量のデータをダウンロードする必要がありましたが、自分で作ったモデルがあれば、そこから簡単にデータを集めることができるので、データを用いた研究・開発の効率を上げていけるのではないかと思います。 最後に、産業技術総合研究所 大西氏による講評と、NEDO 西村氏、経済産業省 千葉氏による代表者挨拶が行われ、閉会となりました。

7-Competition-Report-Pre-training-Dataset

国立研究開発法人 産業技術総合研究所(AIST) 人工知能研究センター 社会知能研究チーム 研究チーム長 大西 正輝 氏 「課題の作成や、定性評価委員として本コンペティションに関わらせていただいた大西と申します。今回の問題設定は、研究色が強いため参加者が集まるかとても心配していたのですが、第1回目よりも多くの方に参加いただき、とても良いコンペティションになったと思います。多種多様なアイデアが生まれてくるのを目にして、コンペティションの可能性を感じました。 今回は数式などを使って人工的に転移学習用のデータセットを作成するという特殊なテーマでしたが、皆さん、とてもよく勉強していらっしゃるなと感じました。このテーマは、1000カテゴリの画像をどう作るか、そして1カテゴリあたりの画像1000枚にどう増やすのかという2つの問題に絞られるのですが、こうした問題をうまく解決した方々が最終的には勝ち残っていったという印象を受けました。Fractal画像の転移性能をうまく改良したり、ベジェ曲線を使って独自の画像生成を考えたり、3次元点群で画像を作った上で、GPUを使って高速化したりなど、どの入賞者の解法もとてもレベルが高かったと思います。今回入賞された方のソースコードは公開しておりますので、ぜひご覧になってください。これからも知恵を結集させていき、人工知能技術の発展が少しでも進むことを期待しています。」

8-Competition-Report-Pre-training-Dataset

NEDO 理事 西村 知泰 氏 「創意工夫にあふれたアイデアが寄せられた、非常に素敵なコンペティションだったと思います。先ほど大西先生のお話にもありましたが、今回のアウトプットを活かして、よりAIの学習の質を向上させていければと考えております。今後も、この分野の研究者の方々と、そして今回参加いただいた皆様と何かしらの形で交流を続けていくことができたら幸いです。また、こうしたコンペティションは、研究開発を加速する上で非常に有効だと思います。今後も継続的に取り組んでいきたいと思っていますので、今回参加いただいた方は、ぜひまたチャレンジしていただきたいです。」

9-Competition-Report-Pre-training-Dataset

経済産業省 産業技術環境局 研究開発課 室長 千葉 直紀 氏 「まずは、入賞者の皆様にお祝い申し上げます。事前学習用のデータセットにつきましては、わかりやすい技術としてよく政府内でも説明しているのですが、専門家ではない方々にとっても、非常にパワフルな技術として理解していただいています。こうした技術をより多くの方に活用していただき、さらパワーアップして普及させていくことが、今後AI技術分野における日本の強みになっていくと思います。経済産業省としましても、AI技術分野を盛り上げて、技術発展を促していこうと考えています。また、ポテンシャルのある研究者の方々や、エンジニアの方々に挑戦いただくことで、人材発掘や人材育成的な面からも、この分野を発展させていきたいです。こうした取り組みが日本初で行われる環境をより増やしていきたいと考えているので、経済産業省、NEDOが手がける懸賞金事業の今後の展開にご期待いただければと思います。」

まとめ

今回のコンペティションは、画像データセットを機械的に生成するという新技術を扱うテーマだったため、難易度が高いのはもちろん社会に与える影響も大きく、参加者の強い意気込みが伝わってきました。また海外からの参加者も多く、世界の叡智が集まるグローバルなコンペティションとなった点も魅力的でした。勇気を出して参加した、すべての参加者の方々に心からの大きな拍手を送りたいです。こうした取り組みを通じて、日本のAI技術がさらに発展していくことを願っています。

この記事をシェアする