理系や文系といった専攻分野に関係なく、誰でも平等にスキルを競い合える機会の提供を目的として、SIGNATEが主催する学生向けコンペティション「SIGNATE Student Cup」。このコンペティションへの参加条件はたった一つ。SIGNATE Campus会員であることだけだ。制限や制約なく、思う存分自身のスキルを試し、学び合い競い合うことができる場となっている。 2018年の初開催以降、AIやデータサイエンスへの関心の高まりを受けて継続的に開催され、2021年は春と秋の2回開催となった。2022年10月1日から10月27日にかけて開催された「SIGNATE Student Cup 2021秋」のテーマは、シェアサイクルの利用予測。特定の日時・ステーションで利用可能な自転車数を予測する「予測部門」と、シェアサイクルサービスの課題抽出とその解決策の提案を行う「アイデア部門」の2部門で開催された。 TOMU HIRATAさんは見事、予測部門で第1位に輝いた。大学院では研究に励みながら、インターンとして企業でも勤務するTOMU HIRATAさん。忙しい毎日を過ごす中でもコンペティションで優勝を果たせた要因は一体なんだったのか。ざっくばらんにお話しいただいた。


▼動画はコチラ▼


モデルを投稿するだけでなく、解決策まで考える経験はビジネスにも活きるはず。

機械学習については学部で基礎を学びました。今も大学院でディープラーニングを用いた研究を行っているので、一定の知見は持っていますが、コンペティションに参加したことはありませんでした。しかし、大学院の授業の関係でSIGNATEへ登録だけはしていたのです。そのためコンペティションが開催される度に、案内メールが届いていました。今回のコンペティションの案内がきたときに、まず目に留まったのが、「アイデア部門」という文字。詳細を確認すると、通常のアルゴリズムを投稿する形式ではなく、課題解決の施策を提案するというものでした。 学業と並行して、インターンとして企業に勤務しており、そこでは機械学習やデータ分析周りの仕事をしています。そのため、今回のようなデータを用いてビジネスにおける課題解決の施策を考える経験は仕事にもプラスになるのではと考えて、参加を決めました。予測部門にも参加し、結果的にはそちらで1位を取ることができましたが、元々興味を惹かれて注力していたのは、実はアイデア部門。そちらで入賞が果たせなかったことは、今も悔しく思っています。

-087-Winners-Interview-1

予測するのは難しいと証明するためのモデルが、なんと1位を獲得。

初めに取り組んだのはアイデア部門の提案内容の検討です。まず、駐輪場の潜在的な売り上げの損失を抑えたいと考えました。夜間に自転車を適切に再配置することで借りたくても借りられない人を減らそうと思ったのです。そのためには、どの駐輪場でどのくらい空きが出るのかを予測する必要がある。次はその予測モデルを作ろうと思ったのですが、ここに大きな壁がありました。 結果から言えば、予測は難しいというのが私の出した結論。データを見たところ分散が大きく、予測値を出す上で有用な説明変数が見つけられませんでした。各変数との相関も見られず、予測精度を出すことは難しいと判断。そこで、予測が難しいことを証明するために、いくつかシンプルな予測モデルを組んでみたのです。せっかくモデルを構築したのだから、予測部門に投稿してみたところ、リーダーボードで1位になったというのが実情です。モデル作成に関してはそこまで大きな工夫をしたわけでもなく、手元の精度も標準偏差と同程度のものしか出ていなかったため、1位を取れたのは偶然という部分もあると思います。

-087-Winners-Interview-2

見切りをつけずに、与えられたデータを全て丁寧に分析する重要性を学べた。

肝心のアイデア部門の提案内容に関しては、方向性を大きく変えることにしました。予測が難しい以上、予測を元にした再配置はソリューションとして妥当性が低い。他に需給を一致させる方法はないかと考えて思いついたのがダイナミックプライシングです。シェアサイクルというサービスは、ある程度価格の弾力性があるのではないかと思い、それならば、需要に沿って適正な価格設定をすることで、売り上げの潜在的な損失を抑えられるのではと考えました。 自転車の再配置を行わずに放置していると、残りの自転車台数はランダムに増減します。それを正規分布で仮定し、そこから毎日来場者数がサンプリングされる前提で、価格をいくら上げると借りる人が現れる確率がどれくらい減っていくかをモデリングしました。そのモデルを使い、1年間で出る利益のシミュレーションをしてコストメリットを提示したものが提案の概要になります。 そこまで筋の悪い提案だったとは思っていませんが、振り返ってみると反省点はいくつか思い浮かびます。特に勉強になったのは、周辺情報の分析。表彰式で発表されていた入賞者の皆さんの中には、地理的な情報や天気情報なども深く分析されている方が多くいらっしゃいました。一方、私はそれらの情報は有用ではないと早々に見切りをつけてしまい、詳細な分析を行わなかったのです。こうした周辺情報も丁寧に分析することで、提案の説得力を増す材料として使えた可能性があるなというのは学びになりました。

-087-Winners-Interview-3

研究とは一味違う、自由度の高さがコンペティションの醍醐味。

力を入れたアイデア部門では入賞を逃し、予測部門では1位を取れたものの、半分は偶然の産物。それでも、今回のコンペティションに参加したことで得られたものは多かったです。一番の収穫は、普段の研究や仕事では得られない知見を得られたこと。今回扱った時系列データは研究でも仕事でも触れる機会はほとんどなく、研究会でも他の方の発表で聞く程度。今回のコンペティションに取り組む中で、関連文献を検索したことや、実際にデータを分析したことで、基礎的な知識を身につけられたと思います。 また、コンペティションならではの面白さにも気づくことができました。普段行っている研究では、新規性が強く求められます。ところが、コンペティションにはそうした制約がありません。フォーラムでやり取りされている他の参加者の方の投稿内容や、過去のコンペティションの投稿を参考にして組み合わせたものも、精度が出れば評価される。自由度高く可能性を探っていける楽しさは、コンペティションだからこそ味わえるものだと感じました。こうした醍醐味を味わいながら、研究や仕事では触れられない領域の知識を得るためにも、今後もコンペティションに参加していけたらと思っています。

-087-Winners-Interview-4

今後の目標

博士課程には進学せず、就職することが決まっているので、来年からは忙しくなると思います。それでも、コンペティション参加をはじめとして、AIには携わり続けたいですね。この世界は技術進歩のスピードが著しく速く、1、2年経つと完全に取り残されてしまうスピード感です。そのため、分野外の論文にも目を通しながら、常に最先端の知識や情報をキャッチアップする姿勢を持ち続けたいと思っています。 <株式会社SIGNATE主催「SIGNATE Student Cup 2021秋: オペレーション最適化に向けたシェアサイクルの利用予測【予測部門】」の入賞者レポートはこちら>

この記事をシェアする