社会の至るところでAI化が進む中、特に画像認識の技術は業務の効率化や精度向上に役立つため、製造や医療などさまざまな応用で注目を集めている。一方で、画像認識の技術を開発するためには膨大な量の画像データをAIに学習させる必要があり、そのデータ収集やラベル付けに多大な労力がかかってしまっているのが現状だ。こうした課題背景のもと、数式から自動生成した大規模データセットをAIに学習させ、画像認識モデルを構築する手法を2022年に産業技術総合研究所の片岡らが世界で初めて開発した。この画期的な技術を参考に、学習用の画像データを機械的に生成するモジュールの開発を進めるために、今回の「事前学習用データセット生成モジュールコンテスト」が開催される運びとなった。一体、このコンテストにはどのような想いが込められているのか。主催者である、国立研究開発法人 新エネルギー・産業技術総合開発機構(以下:NEDO)の新氏、末岡氏、そしてコンペ設計を担当した産業技術総合研究所の大西氏にお話を伺った。
学習用の画像データを機械的に生成するという、新時代の技術に注目。
末岡:前回実施した「HPOモジュールコンテスト」では、専門的にAIの研究をしている方から学生の方まで想像以上に多くの方に参加いただき、私たちだけでは気づかなかった視点を得ることができました。「視点を掛け合わせると、こんなにも多様なアプローチが見つかるのか」と、コンペティションの可能性をひしひしと感じましたね。 新:しかし、本プロジェクトの「AIの社会実装を加速し、日本の産業を盛り上げる」という目的を達成するには、HPOモジュールの開発以外にもまだまだやるべきことがたくさんある。そのため、他のテーマでもう一度コンペティションを開催したいと考えていました。 大西:では何をテーマにしようかと考える中で参考にしたのは、機械学習モデルの設計や構築のプロセスを自動化するAuto MLの考え方。Auto MLが対象としているタスクは「データの理解・加工」「モデルの構築」「モデルの評価」と大きく3つに分けられるのですが、どれか1つではなく3つすべてを実現することで、最適な自動化ができるようになると言われています。前回扱ったHPOモジュールは「モデルの構築」だったので、残り2つのうち、より応用性が高い「データの理解・加工」を採用しました。 ただ、「データの理解・加工」と言ってもデータの前処理や特徴量の抽出などタスクはさらに分解される。どこにフォーカスして課題を設定するか悩んでいる中、産業技術総合研究所が機械的に画像データセットを構築する手法を世界で初めて開発したのを思い出し、この手法を基にした課題にしようと決めました。 末岡:大西先生が言ったようにこの手法は世界初であり、これまでの当たり前を変えるような革新的なものです。例えば、膨大な画像データの収集やラベル付けは非常に手間がかかるため多くのエンジニアを困らせてきたのですが、この手法を使えばデータ収集もラベル付けも人の手で行う必要がなくなり、自動で進めることができるのです。 大西:前回のHPOモジュールとうまく掛け合わせることができれば、「データの理解・加工」から「モデルの構築」までが効率化され、最適なモデルを短時間で作成できるかもしれません。こうした背景から、今回のコンペティションでは、事前学習用画像データセットを機械的に生成するモジュールの開発を課題に設定しました。

最も大切にしていたのは、この新技術が持つ社会へのインパクトを伝えること。
末岡:前回の経験があるため開催に向けてスムーズに準備できたと思われるかもしれませんが、実際は全くそんなことはなく、今回もかなり苦労しました。特に大変だったのは、画像データセットを機械的に生成するという新たな技術を、機構の上層部に理解してもらうことです。「本当にそんなことができるのか?」と疑問や懐疑的な意見が多く出たり、そもそも私自身技術を深く理解できていないため、論文を読み込んでこの技術の特徴を整理し、分かりやすい資料を作成した上で、上層部への説明を続けました。 大西:たしかに、この技術を説明することが一番難しかったですよね。ただ、馴染みがない技術ではあるものの海外ではかなり注目されており、世界的な学術誌でも取り上げられているので、そうした各国の記事や論文を世界中から集めて企画書に記載したことで、このコンペティションを開催すべき理由に説得力を持たせることができました。 末岡:そうですね。8月の予選前には、参加者の方々に向けてこの技術を解説する説明会を実施する予定です。運営側も参加者も含め、コンペティションに携わる全員がテーマをしっかり理解した上で臨めるよう、尽力していきます。 新:苦労したこともありましたが、そんな中でも常に心がけていたのは、この技術の可能性や革新性を伝えるということ。このコンペティションによって画像データを機械的に生成するための最適なモジュールが開発できれば、AIの常識がひっくり返るかもしれないし、参加者はその歴史的瞬間に携わることができるかもしれない。AIに携わる人なら、誰もが一度は「こんな機能があれば良いのに」と夢見たことがある技術の実現が、今、目前まで近づいている。そんな、とんでもないポテンシャルを秘めたコンペティションなのです。そのため上層部へ説明するときも、課題を設定するときも、「革新性」をキーワードにして進めていました。また広報施策においても、募集要項をまとめたチラシに「AIの学習プロセスを革新することが期待されています」と記載したり、海外の方にも解説するために英語でまとめたりと、この技術の可能性を伝える表現を入れています。 末岡:SIGNATEさんの公式Twitterでそのチラシを掲載したところ、「社会的インパクトが大きそう」「ゲームチェンジャーになり得る」「すごく楽しそう」など、すでにたくさんのポジティブなコメントが寄せられているんです。主催者の私たちだけでなく、AIに携わる多くの人々がこのコンペティションに期待してくださっていることを肌で感じ、気が引き締まりました。

時代を切り拓くコンペティションだからこそ、たとえ結果を残せなくても価値ある失敗が得られるはず。
末岡:このコンペティションに参加するメリットはたくさんありますが、やはり一番は、最新の技術を扱うからこそ、入賞した暁には世界中から注目を集める名誉が手に入ることだと思います。それに、入賞者のモジュールはオープンソースソフトウェアとして全世界に公開されるため、世界中で使われるようなモジュールになる可能性がある。AIを扱う者として、非常に大きなやりがいを得られると思います。 大西:私が研究者として最も伝えたいのは、「結果が出なかったら」と不安に感じる必要はないということ。たとえうまくいかなくても、前例のない挑戦だからこそ、失敗も貴重な資料や経験になるし、この技術の課題を発見することにもつながる可能性があるためです。世に出てくる新しい技術というのは、当たり前ですがうまくいったものだけであり、その裏には無数の失敗がある。つまり、失敗を通じて気づけることがたくさんあるのだと思います。もし結果が振るわなかったとしても、自分の解法と入賞者の解法を比較して「何が足りなかったのか」「どこが惜しかったのか」を分析することで、自分でも驚くほど成長できるはずです。 新:私も大西先生の意見と似ていて、結果に関わらず、コンペティションという公平な環境下で実力を試すことに価値があると思います。もちろん入賞を狙っていただきたいですが、自分がどの位置にいるのかを知ることだけでも、成長につながるはずです。 大西:新さんが言うとおり、挑戦することや新しい切り口を探すこと自体に価値があると信じているため、今回も定量評価部門と定性評価部門の2部門を設け、数値上の結果だけでなくアイデアそのものも評価するコンペティションにしています。だからこそ参加者の方々には、元の論文や順位にとらわれすぎず、自由な発想で取り組んでほしいと心から伝えたいです。 新:最初にお話ししたように、このプロジェクトの目的は日本の産業を盛り上げることですが、もう一つの目的として、これからの未来を担うAI人材を発掘したいと考えています。そのため、最適な解法や高い精度を求める以前に、新たな技術に挑戦する方々を応援したいという想いがあるのです。聞いたこともないような技術に好奇心を持ち、自ら挑んでいく。そんな方々を支えたいという気持ちも込めて、このコンペティションを運営しています。 末岡:そうですね。あくまでこのコンペティションの狙いは、完璧なモジュールを完成させることではなく新たなアイデアを集めることなので、参加者の方々もアイデアを武器に挑んでいただくことを期待しています。その結果、どの画像にはどの数式が向いているか、どのような数式の組み合わせにすべきかなど、この技術の活用方法が見えてくるはずですし、参加者の方々の成長をサポートすることにもつながれば嬉しいです。

叡智を結集させれば、予想もしなかった発見があるはず。だからこれからも“協創”し続ける。
末岡:本コンペティションは予選・本戦の構成となっており、現在はまだ予選の準備段階。その後本戦も残っているのでまだまだ道は長い。価値あるコンペティションにできるよう、気を引き締めて進めていきたいです。そして実施後は、他のコンペティションを開催したり新たな取り組みを始めたりなど、何かしら次につなげられたらと考えています。時間を空けずにすぐに次の取り組みに入れるよう、プロジェクトチームですでに議論を重ねています。 新:そうですね。前回も今回も、がむしゃらに走り続けるという進め方をしてきたので、今回のコンペティションが終わったら一度立ち止まり、全2回で培った経験や知恵を整理した上で、次何をすべきか模索していきたいと思います。どんな取り組みをするにせよ、“協創”という軸はぶらさずに進めたいです。 末岡:たしかに、前回・今回のコンペティションを通じて、多種多様な人の叡智を結集させることの面白みを改めて実感しました。一つの組織や特定の人たちだけで考えても同じ結果が出たかと問われたら、きっとそうはならなかったはず。AIに詳しい専門家だからこその視点もあれば、AIを扱って間もない方だからこその視点もあるし、産業用のAIにするか、医療用のAIにするかなどAIの使い道によっても視点は変わってくるためです。それに、入り口がオープンだからこそ、普段接することができないような方々の意見にも触れることができる。所属や肩書きにとらわれず、仕事などの合間を縫って参加してくださった方々のおかげで、こだわりがつまった多様な解法が集まったのだと思います。だからこそ新さんが言うとおり、次の取り組みでも“協創”は続けていきたいですね。 新:そして“協創”を重ねることによって、日本が国を挙げてAIの社会実装を進めていることを認知してくださる方々が増えれば、中には自動化技術の開発にチャレンジしようと思う方も出てくるはず。それがきっと、社会全体のAI実装を進めることにつながると思います。そんな未来を目指して、今後も挑戦し続けていきたいです。

コンペティションの開催を検討している企業・組織へのメッセージ (株式会社SIGNATEからのお知らせ)
学生から専門家まで、そして国内外からさまざまな方が参加してくださるのがコンペティションの魅力だと思います。それに、自分たちでは気づかなかった視点や課題を知ることができる。そのため、「どうせ参加者は集まらない」「大した解法は得られない」と決めつけてしまうのは非常にもったいない。少しでもコンペティションへの興味があるなら、まずは一度開催してみることをオススメします。開催するまでは想像もしなかった結果が得られるはずです。