お知らせ
[2024/07/31 17:00] リーダーボードを再公開いたしました。同時にポイント・メダルも付与いたします。
[2024/06/18 16:15] 入賞者が全て確定いたしました。これ以降入賞候補に関する通知メールはございません。通知メールを受け取っていない方は入賞圏外となりますので、ご了承ください。
[2024/06/10 13:11] 入賞候補者にメールを送付いたしました。
※失格者が出た場合、繰り上げ入賞の可能性がございます。このため入賞候補に関する通知メールを受け取っていない方も、繰り上げにより入賞候補者となる可能性がありますのでご注意ください。
[2024/03/29] コンペ期間終了後(4/1以降)、Live評価および最終審査終了までリーダーボードを一時的に非公開とします。暫定順位が一時的に非公開となるので、必要に応じて個別にリーダーボードの情報を保存しておいてください。最終評価期間データを用いてLive評価を行い、入賞対象の方にのみ個別に表彰式のご連絡をお送りします。
[2024/03/05] 参加者の皆様へのお詫びとご連絡
配布データのtest_run.zipのrun.pyの処理について、一部サーバーと異なる処理となっている箇所を追加で修正いたしました。特に予測の際に、特徴量のシフトなどを行われている方は再度ダウンロードをお願いいたします。
変更前:1日ごとの予測を行う前に、評価用データのdatetimeによる日付順のソートを行わない。
変更後:1日ごとの予測を行う前に、評価用データのdatetimeに対してソートを行う。
サーバ上の評価用データでは、変更後の操作が行われており、評価用データの並びにつきまして、start_code, end_code, KP毎に並んでいるのではなく、datetimeの昇順で並んでおります。具体的には以下の違いがあります。申し訳ございません。
変更前でのデータの受け渡し(例: 2023年07月1日)
datetime | start_code | end_code | KP | ... |
---|---|---|---|---|
2023-07-01 00:00:00 | 1110210 | 1800006 | 2.48 | ... |
2023-07-01 01:00:00 |
1110210 | 1800006 | 2.48 | ... |
2023-07-01 02:00:00 |
1110210 | 1800006 | 2.48 | ... |
... | ... | ... | ... | ... |
2023-07-01 00:00:00 | 1800006 |
1110210 |
2.26 | ... |
2023-07-01 01:00:00 |
1800006 |
1110210 |
2.26 | ... |
2023-07-01 02:00:00 |
1800006 |
1110210 |
2.26 | ... |
... | ... | ... | ... | ... |
変更後(サーバー上)でのデータの受け渡し(例: 2023年7月1日)
datetime | start_code | end_code | KP | ... |
---|---|---|---|---|
2023-07-01 00:00:00 | 1110210 |
1800006 |
2.48 | ... |
2023-07-01 00:00:00 |
1040106 |
1040101 |
130.203 |
... |
2023-07-01 00:00:00 |
1800066 |
1800061 |
69.720 | ... |
... | ... | ... | ... | ... |
2023-07-01 01:00:00 |
1800051 |
1800041 |
50.52 |
... |
2023-07-01 01:00:00 |
1800021 |
1800016 |
25.2 | ... |
... | ... | ... | ... | ... |
このため変更前のような、同一のstart_code, end_code, KPが24時間毎に並んでいるのではなく、変更後のように日付の昇順に並んでおります。なお古いrun.pyの動作の想定をせずに、評価用データにおいて特徴量を作成するなどの処理を行っている場合は問題ございません。
[2024/03/01] 参加者の皆様へのお詫びとご連絡
配布データのtest_run.zipのrun.pyの処理について、一部サーバーと異なる処理となっている箇所を修正いたしました。特にtest_run.zipの動作を元に推論補助データ(inference_df)を利用した投稿ファイルを作成された方は、再度確認ダウンロードをお願いいたします。
変更前:ドラぷら検索ログ2次データの日付を1日前にシフト→トラカンデータとドラぷら検索ログ2次データのマージ→データを学習用と評価用で分割
変更後:データを学習用と評価用で分割→評価用期間のドラぷら検索ログ2次データの日付を1日前にシフト→学習用・評価用のトラカンデータとドラぷら検索ログ2次データのマージ
サーバー上では変更後の動作が行われており、推論補助データ(inference_df)は当日のドラぷら検索ログ2次データにマージしておりますが、配布していたrun_test.zipでは変更前の、学習用データ(補助推論用データ)を翌日のドラぷら検索ログ2次データをマージしており、サーバー上の動作について一部誤った表記となっておりました。申し訳ございません。なお推論補助データを利用していない方、推論補助データにてドラぷら検索ログ2次データを利用していない方につきましては影響はございません。評価用データやサーバー上のプログラムに関しても影響はございません。
[2024/02/21]説明会の動画を公開いたしました。コンテストの内容やデータへの理解が深められますので、ご参加できなかった方は是非ご視聴ください。
動画URL: https://www.youtube.com/watch?v=57CYT7SknFo
動画上の資料はタブの「説明会資料」に掲載しております。
[2024/02/19] 評価方法・ルールの「データの活用」のインターネット環境の利用内容について一部追記いたしました。
[2024/02/16] ルールの「データの活用」の内容について一部変更いたしました。
変更前
手動でラベル付けした結果を提出することは禁止します。
提供データ以外のデータを用いてモデルを学習することは禁止します。ただし、オープンかつ無料な学習済みモデルやライブラリは使用可能です。
※学習済みモデルを使用する際は、入賞時にソース(論文のリンク等)を明記してください。
変更後
提供データ以外のデータは、オープンかつ無料で商用利用可能なデータのみ使用することができます。またモデルやライブラリについても、オープンかつ無料な学習済みモデルやライブラリは使用可能です。
※外部データや学習済みモデルを使用する際は、入賞時にソース(論文のリンク等)を明記してください。
2024/02/19追記
※ただし、ライブ評価時はインターネット環境に接続できませんので、API経由で動的なデータを取得することはできません。ご注意ください。
[2024/02/06] 2月15日16時〜17時に本コンテストの説明会を開催いたします。なお説明会は以下のコンテンツを予定しています。
- NEXCO東日本の概要(全体事業概要、高速道路の役割、個々の事業概要)
- プログラム概要
- コンテスト趣旨、応募資格、提供するデータ、評価方法、実施期間
- 質疑応答
説明会はzoomウェビナーにて開催いたします。
https://zoom.us/j/91604910966?
趣意
ビッグデータを活用した高速道路における渋滞予測の精度向上を目的として、革新的なデータ分析事例を募集します。高速道路は、トラック・バス・タクシー・一般自動車など多種多様な目的・用途の車両の交通網として、日本の公共交通インフラを支えています。東日本高速道路株式会社(以下、NEXCO東日本)は、北は北海道から西は関東・長野まで、3,943kmの高速道路、446のインターチェンジ、328のサービスエリア・パーキングエリアを運営・管理し、交通の安全と安心をお客様にお届けしています。
NEXCO東日本がより安全・安心な交通の未来を作るために取り組んでいることの1つが、渋滞の予測です。渋滞に関する研究は、発生原因・緩和の方法などが見つかっているものの、予測を行う実務の現場では長年の経験則に則した予測が行われています。
昨年同時期に開催した第1回渋滞予測チャレンジコンテストでは、トラフィックカウンターのデータ(以下、トラカンデータ(※1))やドラぷらルート検索データ(※2)等を利用した渋滞予測のコンテストを行い、多くの方に参加いただきました。第1回のコンテストでは、学習データが不均衡であることに着目しデータ拡張を行ったモデルや、休日のパターンを特徴量化して扱うモデル、目的変数を前日との速度差に変換して回帰を行うモデルが上位入賞を果たしました。
第2回は提供データを詳細化し、予測対象路線を変更して渋滞予測チャレンジコンテストを行います。渋滞予測の精度が高いモデルを開発された方を精度賞として表彰します。さらに、今回も審査会において、プレゼンテーションによるアルゴリズムや実装の意図や工夫等について定性的な評価を行い優れたモデルを開発された方をモデリング賞として表彰します。また、コンテストの参加は、個人・企業・団体を問いません。
※1トラフィックカウンターによって計測される速度や交通量のデータです。首都圏近郊では概ね2km間隔で埋め込まれており、車の速度や状態などから高速道路が渋滞しているかどうかを判別しています。 (詳細はこちらをご覧ください。)
※2NEXCO東日本HPドラぷらで、お客さまが出発・到着インターチェンジを選んで高速料金・ルートの検索を行った結果のデータです。(詳細はこちらをご覧ください。)
開催概要
課題 | 高速道路の渋滞予測 | |
データ | ・トラカンデータ ・ドラぷらルート検索データ | |
最終提出物 | 予測モデル(ソースコード、学習済みモデル等) | |
評価 | 精度 | 精度賞入賞者の中から審査会での定性評価 |
副賞 | 精度賞: 1位 30万円, 2位20万円, 3位 10万円, 4~10位 5万円 | モデリング賞: 10万円 ×2チーム |
参加条件
精度賞・モデリング賞のそれぞれの入賞候補となるチームは、下記日程で開催予定の最終選考で登壇発表できることとします。日時:2024年6月27日(木) 15:00-18:30
場所:NEXCO東日本 本社
〒100-8979 東京都千代田区霞が関三丁目3番2号 新霞が関ビルディング 総合受付14階
※交通費・宿泊費等、本コンテストの最終選考にかかる費用の支給は予定しておりません。
タスク
過去の交通量に関するデータ(トラフィックカウンター)と高速料金・ルート検索履歴のデータ(ドラぷら)から、最終評価期間特定の日時(2024/4/1-2024/5/6)の指定日において、指定日前日までのデータを用いて、0時から24時までの高速道路(関越道・東北道)の各区間における渋滞の有無を、1時間毎に予測します。※コンテスト開催期間中は暫定評価期間の指定日の渋滞の有無において順位が表示されますが、最終評価は最終評価期間の指定日の渋滞の有無で順位が決定します。
予測対象(渋滞の有無)について
予測の対象とする渋滞の有無については、各区間に設置されたトラフィックカウンターから計測された自動車の平均速度が時速40km以下の場合に、渋滞が発生している(渋滞有り)と定義します。なお、上記渋滞の定義は、NEXCO東日本における渋滞の定義とほぼ一致しますが、厳密な渋滞の定義とは異なり、データチャレンジのため、便宜的に用意したものです。データ概要
内容 | 観測日時、渋滞状況、高速道路の各区間情報(マスターデータ)、トラカンデータ、ドラぷらルート検索データ | |
期間 | 学習用データ:2021年4月8日~2023年7月31日 暫定評価用データ:2023年8月1日~2023年9月30日 最終評価用データ:2024年4月1日~2024年5月6日 ※上記評価用データに評価対象日を指定しております。具体的な日付は評価方法タブ>評価期間をご確認ください。 | |
頻度 | 1時間毎 |