2021年11月19日、株式会社SIGNATE主催による「SIGNATE Student Cup 2021秋 オペレーション最適化に向けたシェアサイクルの利用予測」の表彰式が開催されました。本コンペティションは学生を対象として、シェアサイクルサービスの課題を解決するソリューションを募集するというもの。特定の日時・ステーションで利用が可能な自転車数を予測するアルゴリズムを提出する「予測部門」と、サービスの課題の洗い出しとその解決策を提案する「アイデア部門」の2部門で行われました。 表彰式当日は、予測部門とアイデア部門それぞれ上位3位入賞者が表彰され、入賞者による解法プレゼンテーションも行われました。全員が学生ではあるものの、それを感じさせないような鋭い着眼点や、工夫を凝らした解法が示され、学びの多い表彰式となっていました。


▼動画はコチラ▼


主催者あいさつ

-078- Competition-1

株式会社SIGNATE 代表取締役社長 齊藤 秀 氏

「SIGNATEで代表を務めている齊藤と申します。Student Cupも今回で5回目の開催となりました。今回も多くの学生さんや、企業スポンサーの方々にご参加いただき、厚く御礼を申し上げます。コロナ禍はだいぶ落ち着いてきたものの、コロナ禍を契機にした社会のデジタル化の加速の機運は間違いなく高まったと実感しております。このStudent Cupが、今後の社会のデジタル化をリードされる学生さんと、積極的にDXに関する活動をされている企業の皆様との良い出会いになればと思っております。私からは以上です。ありがとうございました。」

入賞者の発表

関係各社によるご挨拶が終わり、表彰式はメインコンテンツである入賞者の表彰と、解法プレゼンテーションへと移っていきます。 まず予測部門、アイデア部門それぞれの入賞者の表彰が行われました。 予測部門 第3位:TEAM_BDA 第2位:チームSHIZIU 第1位:TOMU HIRATA アイデア部門 第3位:MASA221 第2位:YUTARO GOLF 第1位:チームMITSU56 続いて、表彰された入賞チームによる解法プレゼンテーションが始まりました。そのトップバッターを務めたのは、予測部門3位入賞を果たしたTEAM_BDA氏。コンペティション初参加のメンバーも多い初心者チームながら、どんな工夫をして入賞を果たしたのかを共有いただきました。

予測部門 第3位

TEAM_BDA 氏

-078- Competition-2

「まず、解法の立案にあたって3つの課題があると考えました。1つ目が予測課題とデータの理解。2つ目が適切な学習アルゴリズムの検討。そして3つ目がコーディングと結果の検証です。これら3つの課題を解決するため、まずはチュートリアルを参考にコードベースを作成し、そこから学習アルゴリズムの検討や特徴量の選択や改良を行い、最終提出するという流れで開発を進めました。アルゴリズムに関しては主にRandomForest、XGBoost、LightGBMの3つの手法を試しました。 特徴量の選択に関しては重要度の高い特徴を抽出する統計的な手法を使用しました。最後に最も精度が高かったLightGBMのモデルを選択し、学習させて最終提出した形です。ご清聴ありがとうございました。」 発表後には、下記のような質問が寄せられていました。 Q. チームはどのような経緯で結成されたのでしょうか? A. 大学の学生研究会のメンバーで参加しています。学生研究会は、普段から研究で分析を行っている人だけではなく、Pythonやデータ分析に興味がある学生が幅広い学部から集まっています。今回のチームでは、コンペが初参加というメンバーも多く参加しています。 Q. 工夫された特徴量はありますか? A. 工夫した特徴量はシンプルで、年、月、日、曜日などを日付データを主に数値化して活用しています。また0時時点の台数は精度への影響が見られなかったため、特徴量からは外しています。 そして質疑応答に続いて、審査員を務めた早稲田大学基幹理工学部情報理工学科教授の内田真人氏よりTEAM_BDA氏の解法に関する講評が行われました。

審査員講評

早稲田大学 基幹理工学部情報理工学科 教授

内田 真人 氏

-078- Competition-3

「発表ありがとうございました。解法をお聞きしていて、比較的シンプルな手法で高い精度を達成しているという点が特徴的かなと感じました。初心者の方も多いとおっしゃっていましたが、そのおかげで問題を複雑化しすぎずにシンプルな形で適正化できたのかなと思います。改めて基本に忠実にということが大切だとよくわかった、そんな解法だったと思います。一方で、ここに辿り着くまでに色々と試されたと思うので、これを削ったらシンプルすぎて精度が出なかった、これを付け加えると精度が悪くなった等の情報ももう少し共有してもらえたら、さらに参考になったかなと思います。改めて、3位入賞おめでとうございました。」

予測部門 第2位

チームSHIZIU

-078- Competition-4

「まず、特徴量に関してですが、大きく3つを用いました。時間識別データ、場所識別データ、そしてその他データです。また、0時時点のバイク台数は追加してしまうと予測精度を悪化させる傾向にあったため、特徴量から除外しています。データに関しては予測対象の1カ月前のデータを検証データ、それより前のものを訓練データとしました。このように1カ月ごとにモデルを分けたため、計12個のLightGBMモデルを作成しました。ハイパーパラメータに関しては、ベイズ最適化のOSSであるOptunaを用いて最適化を行っています。精度向上の要因としては、データの時系列に沿うように学習や予測を行った点と、時系列を無視する特徴量を除外したこと、そしてハイパーパラメータの調整がうまくいったことが効いたのかなと考えています。」 発表後には、下記のような質問が寄せられました。 Q. 特徴量の選択、12個のモデル構築、ハイパーパラメータの最適化のうち、最も精度に効いたのはどれでしょうか。 A. 一番効いたのは12個のモデル構築で、ハイパーパラメータの調整が最後の決め手になったのかなという感想です。 Q. パラメーターチューニングに関して工夫した点はありますでしょうか。 A. 意識した点としては、トレーニングデータに対して過剰に適合しないようにという部分です。過剰に適合して汎用性が下がらないよう、試行回数は増やしすぎないようにしました。

審査員講評  内田 真人 氏

-078- Competition-5

「講評というよりも感想になってしまうのですが、データを時系列に沿うように学習させるという発想が面白いなと感じました。使用したモデル自体が3位の方と同じLightGBMであるにもかかわらず、この学習のさせ方、時系列という着眼点で精度が変わるという部分を興味深く感じました。2位入賞おめでとうございました。」

予測部門 第1位

TOMU HIRATA 氏

-078- Competition-6

「私の解法はヒューリスティックなモデルになっています。ブースティングツリーやトランスフォーマーを使ってみたりもしましたが、結局最終的に一番精度が良くなったのが、ヒューリスティックのモデルでした。やっていることは単純で、ステーションIDと時間・日付というペアがあったときに、予測日から180日以内の各ステーションのbikes_availableの値の平均値に対して、90日以内の平均値と180日から90日前までの平均値の差分にハイパーパラメータで重みづけしたものを加えた値を最終的な予測結果にしております。こうしたヒューリスティックなモデルが有効だった理由としては、説明変数の説明性の弱さや、予測対象日が断続的に存在するために入力データや学習データに欠損が多くなってしまうことが背景にあったのかなと考えています。」 発表後には、下記のような質問が寄せられました。 Q. 数式内で長期トレンドにかかっているλの値はどのようにして決めたのでしょうか。 A. 手元でクロスバリデーションを行い、サンプリングしていくつか入れてあげた中で一番良かったものを選んで使用しました。 Q. MLモデルの多くが、暫定評価より最終評価の方が精度が高い結果となっていた一方で、今回のモデルは精度の低下が見られるのですが、暫定評価用のデータにマッチしすぎている可能性はないのでしょうか。 A. 多少はあると思います。ただし、今回の場合はハイパーパラメータになりうるのは何日までを取るのかという部分と、λに何を取るかという2変数しかないので、ハイパーパラメータが暫定評価のデータセットにフィットしすぎることはあまりないのかなと思います。

審査員講評  内田 真人 氏

-078- Competition-7

「発表ありがとうございました。機械学習の手法を使うことを目的化するのではなく、今回のタスクの特性に合わせた適切なアプローチを採用するということが本質だということを改めて感じました。ヒューリスティックではありますが、時系列をある種意識した手法で、その点では2位のチームと同様のコンセプトを持っていると感じました。また、3位のチームと同様にシンプルな手法であったということで、結果としてそれらを兼ね備えた手法が1位を取ったという結末も大変興味深かったなと思います。優勝、おめでとうございました。」

アイデア部門 第3位

MASA221 氏

-078- Competition-8

「まず、一般的なシェアサイクルの課題として考えられる課題から出発しました。深夜の再配置コスト、満車や空車による満足度の低下等の課題を、3つの視点からデータを用いて探索することで新しい課題を抽出しています。1つ目が利用者の分析、2つ目が不満時間の発生、3つ目が鉄道駅周辺情報の付加です。これらの観点からデータを分析し、解決策として乗換検索アプリを活用し、自転車と利用者をマッチングすることで、利用者自身が再配置を行うという仕組み作りを提案しました。これにより、再配置コストの削減、不満時間の解消、新規登録促進、MaaSの一部として機能させるという4つのメリットが得られるのではないかと考えています。」 発表後には、下記のような質問が寄せられました。 Q. 解決策によって解消できる不満時間はどのように計算しましたか。 A. 鉄道駅周辺と定義したステーションで、利用可能または返却可能な台数が2台未満の状態を不満時間と定義しました。 Q. 鉄道駅周辺のステーションに特化して分析されていますが、鉄道駅周辺ではないステーションの特徴はあったのでしょうか。 A. 十分に分析しきれてはいませんが、満車は平日午前中に増えており、逆に空車が夕方の時間帯に増えているということから、利用が一方的になっているのかなと考えています。

審査員講評  内田 真人 氏

-078- Competition-9

「クーポンを活用するという発想自体は比較的オーソドックスではあったと思いますが、乗り換えの検索アプリを活用した自転車と利用者のマッチングという手法や、利用者が再配置を行う仕組みまで提案したというところが素晴らしかったと思います。また、その効果まで丁寧に考察されていたり、不満時間という独自の評価尺度を定義して問題設定を考えるという部分に非常にセンスを感じました。入賞おめでとうございました。」

アイデア部門 第2位

YUTARO GOLF 氏

-078- Competition-10

「シェアサイクルでは、再配置のタイミングと最大容量の最適化が重要な要素だと考えました。そこで、需要の規模に見合った供給ができるようなステーションの最大容量と再配置を実現したいと考えました。具体的な解決策としては2つありまして、1つはステーションの再配置を行う時間と供給場所の最適化を行うというもの。そしてもう1つがシェアサイクルの利用回数の少ない都市から多い都市へ自転車の移動と最大収容数の移設・拡張を行うことを提案しました。各ステーションにおける利用可能な台数、場所、利用可能な自転車が0台になりやすい曜日等を分析することで、再配置の最適なタイミングを決定しています。」 発表後には、下記のような質問が寄せられていました。 Q. 天気情報は使われていないようですが、天気が再配置のタイミングや台数に影響を与えることも考えられるのでしょうか。 A. 今回は分析していないのですが、ご指摘の通り変化する可能性もあると思うので、改めて分析してみたいなと考えています。

審査員講評  内田 真人 氏

-078- Competition-11

「経営学を勉強されているということで、そのバックグラウンドを活かした提案だったように思います。利用頻度の低いステーションから高いステーションに自転車を再配置する計画を丁寧に検討していて、汎用性のある形までまとめ上げていた点が素晴らしかったと思います。また、こうしたコンペティションで情報系の学部学科でなくても活躍できるのだということを証明してくださったようにも思います。改めて、入賞おめでとうございました。」

アイデア部門 第1位

チームMITSU56

-078- Competition-12

「シェアサイクルサービスにおける課題の1つとして、自転車ごとの利用頻度にばらつきが存在するという点に着目しました。多く利用される自転車は、汚損等によって劣化が早くなる可能性があるため、自転車の利用率を均一にすることで汚損を防げるのではと考えました。これを実現するために、利用頻度の高いステーションや低いステーション、どのステーションからどのステーションへ向かうか等をデータから抽出し、そこから2つの解決策を提案しました。まず1つが、利用頻度を用いた自転車の再配置です。2つ目の提案としては、利用頻度が低い自転車の点検を推薦するシステムの提案です。こちらでは、利用頻度が低い自転車に対して汚損されている可能性があるとして、メンテナンスをするようにアラートを行うアプリケーションを提案しています。またこれらの施策により、どれほどのコストメリットが見込めるかも算出しています。」 発表後には、下記のような質問が寄せられました。 Q. 自転車の劣化に着目するという点がユニークだったと思いましたが、どのような経緯でこの発想に至ったのでしょうか。 A. 自転車が利用されていない状況とはどのような状況かを想像して着想を得ました。自分がユーザーだとした場合、サドルが汚れていたり、パンクしていたら借りないだろうと考える中で、汚損という着眼点を得た形です。 Q. サイクルステーションの位置を可視化した地図は、どのようなツールを用いて作成したのでしょうか。 A. 地図をPythonで描画するライブラリがあったので、そちらを利用しました。また、移動線については、トリップデータのスタートとエンドの集約演算によって何回スタートとエンドの組み合わせの回数が出たかが集計できますので、そちらの回数を集計して、上位100件を抽出し、地図上にプロットしています。

審査員講評  内田 真人 氏

-078- Competition-13

「自転車ごとの利用頻度の違いに着目して、頻度が低いものが汚損じゃないかという仮説に基づいた非常にユニークな提案で感銘を受けました。また、仮説がユニークなだけでなく、自転車の利用頻度を分散させる具体的な提案や、利用頻度からメンテナンスの時期の通知を行うアプリケーションといった構想まで提案しているという部分が非常に素晴らしかったと思います。優勝おめでとうございました。」 以上で、全ての解法プレゼンテーションが終了。最後に、本表彰式の司会を務めたSIGNATEの小嶺美沙樹氏により、新設された賞の受賞者が発表され、表彰式は終了しました。

閉会のご挨拶

-078- Competition-14

株式会社SIGNATE Business Group コンサルタント 小嶺 美沙樹 氏 「入賞者の皆様、発表ありがとうございました。そして、今回のコンペティションでは予測部門、アイデア部門以外に新しくフォーラム活動賞とWeb記事賞を新設いたしました。フォーラム活動賞は、フォーラムページで他の参加者の疑問解決や知見共有に特に貢献いただいた方に、またWeb記事賞は、ブログ記事など知見共有に繋がるWebコンテンツを公開いただいた方に送られます。今回は合計4名の方がフォーラム活動賞、Web記事賞を受賞されましたので、こちらでお名前をご紹介させていただきます。フォーラム活動賞を受賞されたのは、YASHIMA氏、SYLK氏、チズチズ氏の3名です。また、Web記事賞を受賞されたのは、松田拓巳氏です。受賞された皆様、おめでとうございます。それでは、以上をもちましてSIGNATE Student Cup 2021秋の表彰式を終了いたします。長時間にわたるイベントにも関わらず最後までご視聴いただきまして、皆様本当にありがとうございました。」

まとめ

脱炭素社会やSDGsといった観点から、近年注目が集まっているシェアサイクルがテーマということもあり、コンペティション及び表彰式は非常に盛り上がりを見せていました。参加者が全員学生の皆さんであることを、思わず忘れてしまいそうになるほどクオリティーの高い解法やプレゼンテーションに刺激を受けるばかりのあっという間の2時間。コンペティションに参加されていた学生の皆さんはきっと、機械学習に関するスキルを活かして、今回のテーマに限らない様々な社会課題を解決してくれるに違いない。そんな将来を期待してしまうような充実した表彰式でした。改めて入賞された皆さん、本当におめでとうございました。 <株式会社SIGNATE主催「SIGNATE Student Cup 2021秋:オペレーション最適化に向けたシェアサイクルの利用予測」予測部門の入賞者レポートはこちら> <株式会社SIGNATE主催「SIGNATE Student Cup 2021秋:オペレーション最適化に向けたシェアサイクルの利用予測」アイデア部門の入賞者レポートはこちら>

この記事をシェアする