JR西日本 走行中の北陸新幹線車両台車部の着雪量予測
西日本旅客鉄道株式会社
  • 締切: 2018年01月31日
  • 応募:2115件 / 124人
  • 金賞¥1,000,000、銀賞¥700,000、銅賞¥300,000

~車両にくっつく雪だるまの身体測定コンペティション~

 降雪時に新幹線車両が走行すると、車両の台車部(足回り)へ雪が付着(以下、着雪)します。着雪量が増加すると落下する可能性があるので、多量の着雪が見込まれる列車に対しては、前日時点において、翌日の着雪除去の要否を判断しています。そのため、着雪量の予測精度向上は、着雪除去の要否判断の支援に非常に有効と捉えています。

 そこで、本コンペでは、過去の気象条件・走行条件と着雪量のデータを分析し、着雪量を定量的に予測するモデル作成に挑戦していただきます。

 気象学と鉄道オペレーションの両面に関わる分野なので、非常に難しい問題となっている可能性がありますが、皆様のアイデアや技術力・クリエイティビティを活かし、革新的な方法で解決策を見出し、鉄道オペレーションの品質を向上させていきたいと考えています。


提供データ
分析用データとして、以下が与えられます。(※項目等の詳細はデータのダウンロードページで確認できます。)

着雪量データ
富山駅および糸魚川駅で停車中に、レーザスキャナを用いて車両台車部の着雪量を測定しています。

地理データ
土木構造物(停車場・トンネル)やJR所有の測定計(風速・積雪深)のキロ程および緯度経度情報を示します。

列車データ
・ダイヤ:各列車番号の基本運転時刻を示しています。各駅停車列車と一部の駅を通過する速達列車が混在しています。
・金沢着雪ゼロ列車:車両基地から金沢駅へ出庫する列車番号。これらの列車は出庫時に車両の除雪作業を行うため、金沢駅において着雪量はゼロとなります。これ以外の列車は、金沢駅で折返し運転のため、金沢駅における着雪量は不明です。

気象庁データ
気象庁で取得している過去の気象データのうち、下記条件であらかじめ抽出しています。
・期間:2015/12/1~2016/3/31および2016/12/1~2017/3/31
・地点:金沢・富山・糸魚川

風速計データ
JR西日本で独自に設置している風速計(計20地点)の測定データで、毎秒1回測定しています。
・風速(瞬時):0.1m/s単位で測定
・風向(瞬時):北を0°とした時の角度を表しており、時計周りで角度が増加します。

積雪深計データ
列車が走行する軌道上および軌道外側にある側溝における積雪深を測定しています。積雪深計の設置地点によって、測定している地点によって、活用すべきデータが異なります。
(※詳細はデータのダウンロードページの[積雪深計の測定点(doc_1.pdf)]参照)
・軌道:レール面の高さを基準(0cm)とした積雪深を測定しています。
・側溝:側溝の底面を基準(0cm)とした積雪深を測定しています。
(※追記)積雪深計の数値については、-21~-23のような数値を示す場合は積雪なしとご理解ください。なお、レール頭頂面を基準面(0cm)としているため、積雪がレール頭頂面に達していない場合はマイナス値を示します。また、444,555,666,999のような数値が記録されている場合は、積雪深計のエラー値としてご理解ください。

用語解説
着雪量 :車両の台車(足回り)に付着した雪の体積
キロ程 :金沢駅からの離隔距離。駅・トンネル・各測定計の位置を示す指標
列車番号:鉄道のダイヤにおいて個々の列車に付与される識別番号


着雪量予測の基本情報

対象区間:北陸新幹線の 金沢駅 ⇒ 糸魚川駅 間
予測対象:予測期間の全列車に対する富山駅到着時の台車部への着雪量体積 Ⅹ
学習期間:2016/1/19~2016/12/31
予測期間:2017/1/1~2017/3/31


本コンペティションに参加するためには、SIGNATE.JPサイト利用規約(以下「利用規約」といいます。)に加え、本規約にもご同意いただく必要があります。本規約を熟読し、ご同意のうえ、本コンペティションにご参加ください。ご同意いただいた場合、本規約、「追加事項」として本規約に追加された事項、利用規約及びその他のご同意いただいた規約は、すべて一体の文書として当事者を拘束するものとします。


第1条(定義)

1.本規約において次の各用語の定義は、それぞれ次に定めるとおりとします。

(1)「本サイト」とは、コンペティションを掲載するウェブサイト「SIGNATE(https://signate.jp)」をいいます。
(2)「コンペティション」とは、ホストが開催する本サイト上でのAI開発又はデータ分析の競技会をいいます。
(3)「ホスト」とは、コンペティションの主催者をいいます。ホストは、株式会社SIGNATE(以下、「当社」といいます。)又は当社の顧客企業・提携企業・学校・団体等(以下、「顧客企業等」といいます。)です。
(4)「参加者」とは、会員のうち、コンペティションに参加する方をいいます。
(5)「提出物」とは、コンペティションにおいて提出される分析・予測結果及びレポート等の総称をいいます。
(6)「最終提出物」とは、コンペティション終了時点までに参加者が本サイトの所定のページで指定した提出物をいいます。
(7)「入賞候補者」とは、当社より入賞候補の通知を受けた参加者をいいます。
(8)「最終審査用提出物」とは、当社の指示に従い、入賞候補者が提出する分析・予測モデル、学習データ等をいいます。
(9)「最終審査」とは、入賞候補者の最終提出物及び最終審査用提出物に対して当社が行う、再現性検証を含む検収及び審査をいいます。
(10)「入賞者」とは、当社より入賞の通知を受けた入賞候補者をいいます。
2.本規約において使用される利用規約で定義された用語は、本規約で特に定義されていない限り、利用規約で定義された意味を有するものとします。

第2条(コンペティション)

1.コンペティションに参加することを希望する会員は、本規約に同意の上、各コンペティションにおいて定められている参加条件を満たしている必要があります。会員でない方は、コンペティションに参加することはできません。
2.参加者は、当社がご案内する方法に従い、各コンペティションに参加するものとし、各コンペティションにおいて定められたルールを順守する義務があります。
3.参加者は、各コンペティション期間中に各コンペティションの問題に対する提出物を提出することができ、ホストに対して問題解決方法の提案を各コンペティションの終了期限まで行うことができます。
4.参加者は、各コンペティションで指定される形式に従い、各コンペティションで指定される時点までに最終提出物を提出できるものとします。
5.提出された最終提出物は、各コンペティションで定められた評価方法で評価され、その評価をもって最終順位が決定されるものとします。
6.参加者は、提出物が数量的に評価できるものについては、原則、本サイト上で自己及び他の各参加者の評価結果を確認できるものとします。
7.参加者は、自身の提出物について、その適法性を含め、一切の責任を負うものとします。
8.参加者は、各コンペティションに直接関係のない提出物を提出しないものとします。
9.参加者は、特段の定めがない限り、コンペティションに関わる内容について、コンペティション期間中にホストに対して直接連絡、相談、依頼、勧誘等の活動はできないものとします。
10.参加者は、コンペティションに関して不明点や疑問点がある場合、必ず本サイト上に掲載する当社所定の手続きを通し、当社又は当社が指定する者まで連絡をすることとします。
11.当社は、本条各項で定める参加者の行為に対して、次条に定めるものを除き、一切の報酬その他の対価を支払う義務を有しないものとします。

第3条(懸賞及び権利の帰属)

1.参加者は、懸賞が付与されているコンペティションにおいて懸賞獲得の権利を得るためには、特段の定めがない限り、下記条件を満たす必要があります。

(1)入賞者となること
(2)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及びレポート、分析・予測モデル・アルゴリズム・ソースコード・再現法等の説明書等、及び提出物に関する著作権、特許を受ける権利、ノウハウ等すべての譲渡可能な権利(著作権法第27条及び第28条に定める権利及び特許を受ける権利を含み、以下、「本件権利」といいます。)のホストその他の当該コンペティションにおける権利譲渡対象者への譲渡に同意すること
(3)最終提出物及び最終審査用提出物に含まれるノウハウを権利譲渡対象者が何ら制限なく自らの事業及びその他目的に利用できる権利を専有することに合意すること
(4)権利譲渡対象者に対し、本件権利の著作者人格権を行使しないことに同意すること
(5)前3号への同意その他の合理的な条項を含む、本件権利の譲渡のための契約を権利譲渡対象者と締結すること
(6)当社による当該参加者の本人確認が完了すること
(7)本規約及び利用規約の規定に違反していないこと

2.入賞候補者は、当社より入賞候補の通知を受け取った後、当社の指示に従い、最終審査用提出物を指定期日までに当社に提出し、また、最終提出物及び最終審査用提出物に関する確認・回答事項を指定期日までに当社まで連絡するものとします。当社は、かかる確認・回答事項を前提に、最終審査を行います。指定期日までに当社が満足する確認・回答事項が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあります。
3.入賞候補者は、最終審査の過程で、最終提出物又は最終審査用提出物に修正又は変更の必要があると当社が判断、もしくは追加で確認事項が発生した場合、当社の指示に従い、修正等の必要な項目や確認事項の詳細情報について、指定期日までに対処し又は回答するものとします。指定期日までに当社が満足する対処・回答が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあります。
4.当社は、最終審査を経て入賞者を決定し、その旨の通知をするものとします。

第4条(秘密保持)

1.参加者は、各コンペティションに関して当社から受領する情報やデータ(以下「当社提供情報」といいます。)を秘密情報として取り扱い、第三者には開示しないものとし、かつ、当該コンペティション及び別途当社が指定した目的以外に使用することができないものとします。但し、以下の各号に定める情報は、秘密情報には含まれないものとします。

(1)開示の時点において公知となっていた情報
(2)開示の時点において、既に参加者が所有していた情報(当該参加者が合理的な手段で証明することができる場合に限ります。)
(3)開示の後に、参加者の責めによらず公知となった情報
(4)開示されたいかなる情報にもよらずに独自に開発した情報(入賞対象者の評価対象提出物を除く)
(5)何ら秘密保持義務を負担することなく開示権限ある第三者から合法的に開示された情報(当該参加者が合理的な手段で証明することができる場合に限ります。)

2.参加者は、各コンペティションの終了後、直ちに当社提供情報を消去又は当社に返還するものとします。
3.入賞者は、自己の最終提出物及び最終審査用提出物についても、第1項に定める取扱いと同様の取扱いをするものとします。
4.各コンペティションにおいて、別途秘密情報に関する取り決めがなされる場合は、当該取り決めの規定が本規約の規定に優先するものとします。
5.参加者が本条の規定に違反したことによりホストその他の第三者と当社の間で紛争が生じ、その他当該第三者が当社に対して請求を行った場合、当該参加者は当社が被る一切の損害、損失、費用(弁護士費用を含むがこれに限定されない。)、逸失利益、逸失収入などを補償するものとします。
6.本条規定は、当社提供情報並びに入賞者の最終提出物及び最終審査用提出物に関し、当該コンペティション終了後及び参加者が当社サービスの退会手続きを完了した後5年間は有効に存続します。

第5条(参加者の禁止行為)

1.当社は、コンペティションにおいて、参加者に対し、次に掲げる行為を禁止します。

(1)クラッキングやチート行為、なりすまし等の不正行為
(2)当社が関与しない形で行う、他の参加者又はホスト(当社以外の者に限る。)に対する直接連絡、相談、依頼、勧誘、勧誘対応等の活動
(3)書面その他当社が指定する方法による事前の承諾を得ることなく行う、コンペティションを利用した一切の営利活動(勧誘・スカウト行為、教育事業における第三者への利用等を含む)
(4)参加者としての地位又は参加者としての権利義務の移転、担保設定その他の処分(当社の書面による同意がある場合を除く。)
(5)その他、利用規約に違反する行為

2.参加者が前項に規定する禁止行為を行ったと当社が認める場合、当社は、当該参加者に事前に通知することなく、当該参加者のコンペティションにおける失格処分、当社サービスの一時利用停止、退会処分、損害賠償請求その他当社が必要と判断した措置をとることがあります。

第6条(本規約に基づくサービス提供の変更・中断・終了)

1.当社は、会員に事前の通知をすることなく本規約に基づき提供するサービスの変更又は一時的な中断を行うことができます。
2.当社は、1ヵ月の予告期間をもって会員に通知の上、本規約に基づき提供するサービスの長期的な中断もしくは終了を行うことができます。
3.当社は、本条に基づき当社が行った措置により生じた結果及び損害について、一切の責任を負わないものとします。

第7条(本規約の変更)

1.当社は、会員の了承を得ることなく、本規約を随時変更、追加、削除することができます。

2018年4月1日 制定

評価関数
・精度評価は、評価関数「weighted mean absolute error(WMAE:重み付き平均絶対誤差)」を使用します。
・評価値は0以上をとり、精度が高いほど小さな値となります。
・重みの比は真値の絶対値に10^4をかけて1を足した数値とします。
・目的変数は、列車の着雪量となります。




最終順位の決定
1.コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。※スコアボードはコンペ終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。

2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

・コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順**1、乱数シード**2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

3.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

4.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。

心構え
・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨むこと。

システムの利用
・利用アカウントは1人につき1つまで。ただし、アカウントが1つであればチームでの参加も可能。

情報の取り扱い
・同じチーム以外の参加者と本コンペの予測に関連するデータ・ソースコードを共有する行為は禁止。

データの利用
・第三者の権利を侵害しない、無償で誰でも手に入るオープンなデータに限り、利用可能。
・ある日の着雪量を予測する場合、以下のデータを利用できるものとします。
 ①気象庁データのうち「1時間毎の、気温・降水量・風速・相対湿度・天気」は、予測対象日当日中の情報を利用可能。
  これらは、気象協会が提供する気象情報で、前日に予報値が公表される情報です。
  (例)2017年1月11日を予測する場合、インデックスが、2017-01-12 00:00:00 以前のデータ(※24時は、翌日日付の0時で表現される)

 ②気象庁データのうち上記①以外の項目及び積雪深計・風速計データは、予測対象日の午前4時時点までの情報であれば利用可能。
  なお、提供データ以外のデータを利用した場合も、予測対象日の午前4時に取得可能な情報のみ利用可とします。
  (例)2017年1月11日を予測する場合、インデックスが、2017-01-11 04:00:00 以前のデータ

 ③ただし、上記①以外の気象情報のうち、着雪量の予測精度向上に必要と思われる情報は、①の説明変数(一次入力データ)との関係を推定して、二次的な特徴量(二次入力データ)として予測モデルに組み込むことは可能(下図参照)


実装方法
・モデルの学習に利用するツールは、オープン且つ無料なもの(python, R 等)に限定。
・既往研究の盗用や剽窃による予測モデル作成は不可。
・既存研究を参考にする場合は、ソースコード内、もしくはreadmeファイルにて、参考文献として明記してください。
・特許を含む手法に関してはご利用をお控えください。
・ソースコードは、以下のように、前処理、学習、予測、の3つに分け、それぞれを実行すれば処理が進むように実装すること。
 ①Preprocessing
  提供データを読み込み、データに前処理を施し、モデルに入力が可能な状態でファイル出力するモジュール。get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義してください。
 ②Learning
  ①で作成したファイルを読み込み、モデルを学習するモジュール。学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数も定義してください。
 ③Predicting
  ①で作成したテストデータ及び②で作成したモデルを読み込み、予測結果をファイルとして出力するモジュール。

2017年12月1日(金)コンペ開始
2018年1月31日(水)コンペ終了
2018年2月5日(月)予測モデル等の提出締切(※入賞候補の連絡を受け取った方)
2018年2月中旬(予定)入賞者の決定
気象学情報
本コンペでは、予測日については気温、降水量、風速、相対湿度、天気のみ入力データに利用可としますが、これらの気象条件を基に気象学的観点から他の気象条件を推定する考え方を参考に紹介します。(※詳細はデータのダウンロードページの[気象条件推定の考え方(doc_2.pdf)]参照)

降水量から降雪量を推定する手法
 降雪時における降水量は、降り積もった雪が溶けて水になった場合の水深を指します。
降雪量は降り積もった雪の深さ(積雪深)を示しています。同じ降水量でも水と雪の密度比によって降雪量の値は変化します。
雪の密度は、過去の実験則から気温に依存して変化することが示されていますので、降雪時の気温と降水量から、降雪量を推定することが可能となります。

日照時間から日射量を推定する手法
 日射量は、太陽の日差しによるエネルギーの強さを表す指標であり、降雪時や積雪時に日射量が大きくなることは、雪を溶かす(雪密度が大きくなる)方向に作用します。日射量データを観測していない地点では、日照時間と日射量の関係式を基に推定することが可能です。後述しますが、日照時間については天気から推定することが可能です。

天気から日照時間を推定する手法
 過去の気象データを基に、天気と日照時間の関係を統計的に分析することで相関関係を見出すことが可能です。参考までに今回準備している金沢市の気象庁データを用いた場合の天気と日照時間の関係を図示しています。前述の関係を用いることで、日照時間を観測していない地点や予測対象日における日照時間条件の推定に活用することが可能です。

参考情報として、下記リンク・文献を記載いたします。

参考URL
過去の気象データ:気象庁
気象予報:日本気象協会(tenki.jp)
台車着雪量推定手法:鉄道総合技術研究所(気象防災研究室)
東北新幹線八戸・新青森間における雪害対策の研究(6):雪氷研究大会
地表面に近い大気の科学 理解と応用:近藤 純正 著