The 4th Big Data Analysis Contest
IoT推進ラボ、経済産業省、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)
  • Closing: Jan 10, 2019(25 days left)
  • 672 submissions / 106 competitors
  • 619 participants
  • 総額¥2,400,000+副賞

NEWS
2018/11/12 探索的分析を中心とした予測部門のチュートリアルを公開しました。
2018/11/12 よくある質問をFAQに整理しました。
2018/12/06 FAQに「アイデア部門」に関するよくある質問を追加しました。
2018/12/06 過去の入賞作品のリンクをわかりやすくしました。


コンテスト趣意

IoT/ビッグデータによる産業活性化を目的として、革新的なデータ分析事例・アイデアを広く公募します。


第4回のテーマは「インフラメンテナンス・鉄道」
鉄道や道路、上下水道、ガス、港湾といった社会インフラは、人々の快適な暮らしを支える重要な役割を果たしていますが、近年その老朽化や維持管理が大きな社会的な課題になっています。このような社会インフラの重要性をデータ分析という切り口で考えてみることが、第4回ビッグデータ分析コンテストのテーマです。

現在、IoT技術や人工知能、センシング、モニタリング技術が大きく進展しています。上述の社会インフラの維持管理の問題を解決する手段の一つとしても、これらの技術は大きく期待されています。今回のコンテストは、社会インフラの一つである鉄道に着目し、「予測部門」と「アイデア部門」で行います。なお、コンテストの参加は、個人、企業、団体を問いません。



コンテスト概要
「予測部門」と「アイデア部門」の2部門を開催します。いずれか1部門のみでの参加も可能です。ただし、「予測部門」においてレポートの提出は必須で、未提出の場合は精度賞においても評価の対象外となりますのでご注意ください。

部門予測部門アイデア部門
課題軌道の高低変位の推移の予測鉄道をテーマにデータを活用した分析アイデア
データ軌道検測データ
設備台帳データ
独自に収集したデータ
提出物予測モデル + レポートHTMLファイルやポスター等
懸賞
(予定)
最高精度賞(1件)
賞金100万円+副賞
モデリング賞(2件)
1位:賞金50万円+副賞
2位:賞金30万円
グッドアイデア賞(2件)
1位:賞金40万円
2位:賞金20万円
評価精度精度上位 +レポートの審査成果物の審査

※副賞は鉄道博物館のスペシャル体験や大型線路補修機械の操縦体験を予定しています。

参加方法はこちらを参照



予測部門
分析の対象とするのは、東日本旅客鉄道株式会社より提供された鉄道の軌道検測データです。軌道は、列車走行に伴って一定度の「ゆがみ」が生じるように設計されています。これは、鉄道の建設費用を抑えるために、供用開始後に一定度の維持管理(メンテナンス)を前提とした構造を採用しているからです(建設費用と維持管理費用を足したものが全体として小さくなるように考えている)。

この「ゆがみ」は「軌道変位」と呼ばれますが、軌道変位が大きくなると、列車の安全性や乗り心地に影響します。そのため、鉄道事業者は、軌道変位を定期的に測定し(軌道検測)、一定の補修目安値に達すると補修を行うといったメンテナンスを実施しています。

一方で、軌道の強度はその建設された時々の技術水準を反映していることや、場所ごとによって軌道変位の推移が大きく異なるため、場所ごとの劣化状態を良く把握して補修のタイミングを意思決定することが求められます。軌道検測は、今まで年4回実施することが限界でしたが、小型で高精度な検測装置である「線路設備モニタリング装置」が実用化され、高頻度に軌道検測ができるようになってきました(http://www.jreast.co.jp/press/2018/20180704.pdf)。

これにより、軌道変位の詳細な推移を把握し、劣化傾向の変化を早期に発見することができるようになりつつあります。また、過去の軌道検測データから将来の軌道変位を予測し、最適な時期に補修を行うことで、ライフサイクルコストを最小化する試みが始まっています。

本コンテストでは、これらのモニタリングデータを基に、将来の軌道変位の予測にチャレンジしていただきます。データの特徴や予測時の注意事項は「詳細セクション」をご覧ください。普段目にする機会の少ない産業界の実際の課題・データを対象に分析することにより、優秀なデータサイエンティストの発掘や優れた分析者の技術からの学びによる人材育成効果も合わせて期待します。 




アイデア部門
重要な社会インフラである鉄道をテーマにデータを活用した分析アイデアを競う部門です。対象とするデータは公開されているデータを含めてどのようなものでも構いません。分析のテーマも鉄道に関連すればどのようなものを設定しても構いません。適用する分析手法も人工知能技術に限定せず、どのようなものを用いていただいても構いません。ただし、分析アイデアを第三者に理解してもらうために、「可視化」を上手く活用するなど分析結果の表示の仕方に注意を払う必要があります。それ以外は、自由な発想での分析を期待しています。提出物の詳細や参考事例は「詳細セクション」をご覧ください。





In order to participate in the Competitions, you are required to agree to these Terms, in addition to the Terms of Use of SIGNATE.JP Site (hereinafter referred to as the "Terms of Use"). You should participate in the Competition after reading carefully and agreeing to these Terms. If you agree, these Terms, the matters that are added to these Terms as "additional matters", the Terms of Use and other terms and conditions that you have agreed to shall be binding on the relevant parties as integral documents.


Article 1. Definitions

1.For the purpose of these Terms, the following terms shall be defined as follows:

(1)"Site" means the website "SIGNATE (https://signate.jp)" on which the Competitions are posted.
(2)"Competition" means any competition on AI development or data analysis on the Site as held by the Host.
(3)"Host" is the host(s) of the Competitions. The Host may be SIGNATE, Inc. (hereinafter referred to as the "Company") or the Company’s client companies, affiliated companies, schools or organizations, etc. (hereinafter referred to as the "Client(s)").
(4)"Participant(s)" means the member(s) who participate in a Competition.
(5)"Submissions" means, collectively, the analysis and prediction results and reports, etc. as submitted in the Competition.
(6)"Final Submissions" means the Submissions that are specified by a Participant on the prescribed page in the Site by the time of completion of a Competition.
(7)"Winner Candidate" means the Participant who has received a notice from the Company that he/she is nominated as a winner candidate.
(8)"Submissions for Final Judgment" means the analysis and prediction model and learning data, etc. as submitted by a Winner Candidate pursuant to the instructions of the Company.
(9)"Final Judgment" means the acceptance inspection and judgment, including reproducibility verification, by the Company for the Final Submissions and Submissions for Final Judgment of a Winner Candidate.
(10)"Winner" means the Winner Candidate who is informed by the Company that he/she has won a prize.
2.Unless otherwise defined in these Terms, the terms used in these Terms that are defined in the Terms of Use shall have the same meaning as defined in the Terms of Use.

Article 2. Competition

1.A member who desires to participate in a Competition shall be required to agree to these Terms and to satisfy the conditions for participation as specified in each such Competition. Any person who is not a member shall not participate in any Competition.
2.Participants shall participate in each Competition in the manner as advised by the Company and shall be obligated to comply with the rules as prescribed in each Competition.
3.Participants may submit the Submissions for the assignment of each Competition during the period of such Competition and submit a proposal on the method of solving the problem to the Host by the end of the period of the said Competition.
4.Participants may submit the Final Submissions in the form specified in each Competition by the time specified by the said Competition.
5.The Final Submissions as submitted shall be evaluated by the evaluation method as specified in each Competition and the final rank order shall be determined based on such evaluation.
6.Any Participant may, as a general rule, check the evaluation results of the Participant him/herself and each of the other Participants on the Site for the Submissions that may be evaluated quantitatively.
7.Participants shall be liable or otherwise responsible for their own Submissions, including their legality.
8.Participants shall not submit any Submissions that have no direct relationship to each Competition.
9.Unless otherwise provided for, Participants shall not directly communicate to, consult with, make a request to, solicit or take any other actions with the Host in respect of the matters related to a Competition during the period of the said Competition.
10.Any Participant who has uncertainty or questions about any Competition shall make sure to contact the Company or its designee through the procedures prescribed by the Company as posted on the Site.
11.The Company shall not be obligated to pay any remuneration or other consideration other than those prescribed in the following Article for any act of the Participants as prescribed in paragraphs hereof.

Article 3. Reward and Vesting of Rights

1.Unless otherwise provided for, any Participant shall satisfy the following requirements in order to be entitled to receive a reward in any Competition that offers a reward:

(1)To be a winner;
(2)To agree to transfer to the Host and the relevant transferee of rights in such Competition all transferable rights, such as copyrights, rights to obtain patents and know-how, etc. in and to all analysis and prediction results, reports, written explanations on analysis and prediction model, algorism, source code and reproduction method, etc., and the Submissions contained in the Final Submissions and Submissions for Final Judgment (including the rights as prescribed in Article 27 and Article 28 of the Copyright Act and the rights to obtain patents; hereinafter referred to as the "Rights");
(3)To agree that any relevant transferee of rights exclusively has the right to use the know-how contained in the Final Submissions and Submissions for Final Judgment for its own business and other purpose without any restriction;
(4)To agree not to exercise moral rights to the Rights against the relevant transferee of rights;
(5)To enter into an agreement for the transfer of the Rights with the relevant eligible transferee of rights, including the agreement to the matter in the preceding three (3) items and other reasonable provisions;
(6)To have the personal identity of such Participant verified by the Company.
(7)Not to breach any provision of these Terms and the Terms of Use.

2.Any Winner Candidate shall, after having received a notice from the Company that he/she is nominated as a winner candidate, submit the Submissions for Final Judgment on or before the designated date and communicate the matters requiring confirmation or response in relation to the Final Submissions and the Submissions for Final Judgment to the Company on or before the designated date, in accordance with the instructions of the Company. The Company shall carry out the final judgment based on such matters requiring confirmation or response. If the Company receives no confirmation or response satisfactory to the Company on or before the designated date, the Company may exclude such Winner Candidate from the subject of the final judgment.
3.If the Company considers that the Final Submissions or Submissions for Final Judgment need to be amended or modified, or there occur any additional matters requiring confirmation, in the course of the final judgment, any Winner Candidate shall take action or make response in relation to the matters that require amendment, etc. or the detailed information on the matters requiring confirmation, on or before the designated date in accordance with the instructions of the Company. If the Company receives no action or response satisfactory to the Company on or before the designated date, the Company may exclude such Winner Candidate from the final judgment.
4.The Company shall determine the Winner through the final judgment and inform the Winner to that effect.

Article 4. Confidentiality

1.Any Participant shall treat any information and data that they receive from the Company in relation to each Competition (hereinafter referred to as the "Company-Provided Information") as confidential information and shall not disclose the same to any third party and use the same for any purpose other than for such Competition and purpose specified by the Company separately; provided, however, that the confidential information shall not include any information that falls under any of the following items:

(1)Information that is known to the public at the time of the disclosure;
(2)Information that is already possessed by the Participant at the time of the disclosure (only in the case where such Participant may demonstrate such fact by reasonable means);
(3)Information that becomes known to the public without the fault of the Participant after the disclosure;
(4)Information that is independently developed by the Participant without reference to any information as disclosed (except for those Submissions of the person eligible for a prize which are evaluated); or
(5)Information that is rightfully disclosed by any third party having a right to do so without the obligations of confidentiality (only in the case where such Participant may demonstrate such fact by reasonable means).

2.Any Participant shall delete or return to the Company the Company-Provided Information immediately after the completion of each Competition.
3.Any Winner shall handle his/her Final Submissions and Submissions for Final Judgment in the same manner as prescribed in paragraph 1 hereof.
4.If there is any separate arrangement in relation to the confidential information in each Competition, the provisions of such arrangement shall prevail over the provisions of these Terms.
5.If any dispute occurs between the Host or other third party and the Company due to the breach by any Participant of the provisions of this Article and such other party makes any claim against the Company, such Participant shall compensate for any damage, loss, expenses (including, but not limited to, attorneys’ fees), lost profits and lost revenues, etc. incurred by the Company.
6.The provisions of this Article shall survive the termination of the relevant Competition or the Participant’s completion of the procedures for withdrawal from the service of the Company, with respect to the Company-Provided Information and the Winner’s Final Submissions and Submissions for Final Judgment for a period of five (5) years thereafter.

Article 5. Prohibited Acts of Participants

1.The Company shall prohibit Participants from engaging in any of the following acts in any Competition:

(1)An act of cracking, cheating, spoofing other misconduct;
(2)An act of directly communicating to, consulting with, making a request to, soliciting or responding to solicitation or other activities to other Participants or the Host (other than the Company) without the involvement of the Company;
(3)Any profitmaking activities using the Competition (including solicitation or scouting activities, and use for a third party in educational business, etc.) without the prior approval of the Company in writing or any other manner specified by the Company;
(4)Transfer, offering as collateral or other disposition of the status as a Participant or the rights or obligations as a Participant (except with the prior written consent of the Company); and
(5)Any other act in breach of the Terms of Use.

2.If the Company deems that a Participant engages in any of the prohibited acts as prescribed in the preceding paragraph, the Company may, without prior notice to the Participant, disqualify the Participant from the Competition in which the Participant participates, temporarily suspend the Participant from using the service of the Company, withdraw the Participant’s membership, claim damages from the Participant or take any other measures deemed necessary by the Company.

Article 6. Change, Discontinuation or Termination of Provision of Services under These Terms

1.The Company may change or temporarily suspend the services provided by the Company under these Terms without prior notice to the members.
2.Upon one (1) month prior notice to the members, the Company may suspend for a long period of time or terminate the services provided by the Company under these Terms.
3.The Company shall not be liable for any results or damage arising from the measures taken by the Company under this Article.

Article 7. Modification of Terms

1.The Company may modify, add or delete any provisions of these Terms from time to time without the approval of the members.

Enforced on April 1, 2018

予測部門

・精度は、評価データの実測値と予測値の差を誤差と定義し、評価期間中の「mean absolute error(MAE:平均絶対誤差)」により評価します。
 評価値は0以上の値をとり、精度が高いほど小さな値となります。
・モデリングは、精度で上位であった予測モデルのうち、独創性、新規性、先進性等の観点から総合評価を行います。




精度の最終順位の決定
1.コンテスト最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンテスト終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。
スコアボードはコンテスト終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。

 2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

 3.コンテスト終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順*1、乱数シード*2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

4.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

5.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。



アイデア部門
分析アイデアの先進性、理解のし易さ(可視化の度合い)、独自性等といった複数の観点から評価します。
※ 扱うデータはどのような形でも(オープンでもクローズでも)構いません。



審査員の紹介(敬称略、五十音順) 

井口 博美
武蔵野美術大学デザイン情報学科 教授, デザイン・ラウンジディレクター

伊勢 勝己
東日本旅客鉄道株式会社 常務執行役員 

齊藤 秀
株式会社SIGNATE 社長, 筑波大学人工知能科学センター客員教授, 理化学研究所 革新知能統合研究センター 客員研究員, 国立がん研究センター研究所 客員研究員 

杉山 将
理化学研究所 革新知能統合研究センター センター長, 東京大学 大学院新領域創成科学研究科 複雑理工学専攻 教授, 産業技術総合研究所 人工知能研究センター 客員研究員 

辻井 潤一
産業技術総合研究所 フェロー, 産業技術総合研究所 人工知能研究センター研究センター長

樋口 知之
情報・システム研究機構 理事, 統計数理研究所長, 総合研究大学大学院統計科学専攻 教授

古川 敦
公益財団法人鉄道総合技術研究所 研究開発推進部長

参加規約
・入賞した場合、本コンテストの事務局メンバーにメールアドレスを共有することに同意すること。
   ※表彰式に関する連絡は、運営事務局より入賞者に直接ご連絡させていただきます。

心構え
・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨むこと。 

システムの利用
・利用アカウントは1人につき1つまで。ただし、アカウントが1つであればチームでの参加も可能。 

情報の取り扱い
・同じチーム以外の参加者と本コンテストの予測に関連するデータ・ソースコードを共有する行為は禁止。 

データの利用
・(予測部門)提供するデータ以外のデータを用いてモデルを学習することは禁止。
・(アイデア部門)第三者の権利を侵害しないデータのみ利用可。

 実装方法
・モデルの学習に利用するツールは、オープン且つ無料なもの(python, R 等)に限定。
・提案した方法が一般的な環境において追加費用負担を伴わず、再現及び継続使用可能であることを保証すること。
 同じフォーマットで、異なるデータを入力した場合にも同様なロジックで予測できなければなりません。
 例えば、根拠無く局所的に予測値を修正することは禁止となります。
(基準について不安がある場合は、事務局までお問い合わせください)
・ソースコードは、以下のように、前処理、学習、予測、の3つに分け、それぞれを実行すれば処理が進むように実装すること。
 ①Preprocessing
  提供データを読み込み、データに前処理を施し、モデルに入力が可能な状態でファイル出力するモジュール。
  get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義してください。
 ②Learning
  ①で作成したファイルを読み込み、モデルを学習するモジュール。学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数も定義してください。
 ③Predicting
  ①で作成したテストデータ及び②で作成したモデルを読み込み、予測結果をファイルとして出力するモジュール。


2018年10月1日 コンテスト開始
2019年1月10日 コンテスト終了
2019年1月15日 予測モデルの提出締切 ※連絡を受け取った方
2019年2月7日 検収・審査にて入賞者を決定
2019年2月27日(予定) 入賞者表彰@(場所調整中) ※入賞者の一部の方にはプレゼンを実施いただく予定です。

Q. 分析した内容を論文に利用してもよいですか?

A. 本コンテストを通じて得たノウハウやテクニックに関して、以下条件を満たす場合に限り、論文等を執筆・投稿することが可能です。

・所属大学、所属学部、所属学科、氏名、論文のタイトル、使用目的を、SIGNATEの問い合わせフォームより事前に通知すること
 ※内容は、データ提供企業の東日本旅客鉄道株式会社にも共有します。
・本コンテストの参加規約を遵守すること
・提供データ自体を論文に掲載しないこと
・入賞者の場合は、モデルの著作権は東日本旅客鉄道株式会社の帰属する旨を論文に明記すること(学会発表時含む)


Q. 補修は、凹んだ部分を直す、つまりマイナスの軌道変位の数値を0に戻すものだと思いますが、それ以外のケースもあるのでしょうか。補修の方法や種類を教えてください。

A. 軌道変位の計測に利用している10m弦正矢法の原理上、数値がプラスに劣化する場合もあります。このため全てが凹むわけではありません。補修とは、列車走行によって軌道変位の絶対値が大きくなった部分を直すことで、定期的なチェックの元、変位があるしきいを超えていた場合等に機械を使用して1日で対応します。


Q. 軌道検測や設備台帳データをアイデア部門に利用することは可能ですか?

A. 可能です。


Q. ルールの実装方法記載の「同じフォーマットで、異なるデータを入力した場合にも同様なロジックで予測できなければなりません。」というのは、今回公開されているデータセットの路線とは異なる路線、または同じ路線の異なるキロ程でも作成したモデルで予測できなければならないということでしょうか。つまり、今回公開されている路線・キロ程の範囲に特化したモデルではダメということでよろしいでしょうか。

A.はい。今回公開されている範囲以外の路線やキロ程に対しても、予測できるモデルである必要があります。


Q. Google Colaboratory は利用してよいですか?

A. 有料ツールや、有料のAPIの利用は禁止ですが、Google Colaboratoryは、無料ですので利用可能です。


Q. Google Cloud Platform は使用可能ですか?

A. 分析環境として使用すること自体は構いませんが、プログラムがGPCの環境上でしか動かないような方法、例えば、Auto ML や Big Query の利用等は禁止となります。


Q. Amazon EC2 の Windows Server を利用することは可能ですか?

A. 分析環境として使用すること自体は構いません。ただし、メモリ容量の指定がある場合は、上限32GBまでとしてください。


Q. 高低左の値が1日単位でスパイク状に変化する箇所が見られますが、この発生メカニズムを教えていただけないでしょうか?

A. 営業車両で軌道検測を実施しているため、駅構内で停車する際の番線が日によって異なることがあります。基本的には別番線を走行した場合は、データ取得を止める仕組みとしていますが、場合によっては、データが取得されてしまう場合があります。なぜなら、検測点は車輪の回転に応じて付与される仕組みとなっており、滑走(車輪が回転しないのに電車が進む)や空転(車輪が回転しているのに電車が進まない)が生じると、位置がずれてしまうからです。検測地点のズレが生じた場合、補正する手法を導入していますが、補正手法は日々改良を重ねているため、データの取得時期によっては、複数のデータが存在する場合があります。異常値を除去したうえで、予測するモデルの構築を検討してください。また、評価期間における異常値は評価の対象外となりますのでご安心ください。


Q. アイデア部門の分析は人工知能技術等を使わなければならないのですか?

A. 分析に人工知能技術を使う必要は特にございません。


Q. アイデア部門は、分析しようとするアイデアだけを記載した文面でもよいですか?

A. アイデアがどこまでの範囲を指すのかによりますが、使ったデータやアイデアを導いた一連のストーリーも必要となります。昨年の入賞作品を参考にしてください。


Q. アイデア部門で用いるデータはオープンデータでなければならないのですか?

A. 特に制限はなく、オープンでもクローズでも構いません。


Q. アイデア部門の分析もインフラメンテナンスをテーマにしなければならないのですか?

A.  テーマが鉄道であればインフラメンテナンスに限る必要はございません。

共催:IoT推進ラボ、経済産業省、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)
後援:文部科学省、国土交通省(予定)、インフラメンテナンス国民会議、筑波大学 人工知能科学センター、公益財団法人 鉄道総合技術研究所、一般社団法人 日本鉄道施設協会、モビリティ変革コンソーシアム
協賛:東日本旅客鉄道株式会社、株式会社NTTドコモ、京セラ株式会社、さくらインターネット株式会社、株式会社ジェイアール総研情報システム、株式会社JR東日本情報システム、Tableau Japan 株式会社、株式会社日本線路技術、日本電気株式会社、パナソニック株式会社、株式会社日立製作所、三菱電機株式会社




予測部門

■予測の内容
予測部門では、線路設備モニタリング装置で測定した軌道検測データを基に、軌道の高低変位予測モデルの構築及び説明変数の設計を目的として、コンテストを実施します。

今回提供される線路設備モニタリング装置で測定したデータは、①高低変位、②通り変位、③水準変位、④軌間変位の4種類あります。①高低変位と②通り変位は「10m弦正矢法」という方法で検測されたものです。

これは、10mの水糸をレールに張り、その中央部の水糸とレールと間の距離を変位と定義する鉄道独自の方法です。この測定方法を連続的に間送りしたデータで軌道の状態を把握しています。この方法でレール長さ方向の凹凸(不陸)を評価したものが、「高低変位」、レール側面の長さ方向の凹凸を評価したものを「通り変位」と呼んでいます。なお、実際の測定機構は、測定したデータをフィルター処理することで、10m弦正矢法による変位量を算出する方法を採用しています。

「水準変位」は、左右レールの高さの差と所定高さの差を指します。軌道には、列車が曲線をスムーズに曲がるために(遠心力で外側に引っ張られすぎないようにするために)、外側のレールを内側のレールよりも高くする「カント」がつけられています。鉄道の世界では「カント」と呼びますが、「バンク」と同じものです。所定カント量(正規のカント量)は、曲線半径の依存しており、曲線半径が小さい曲線ほど大きな値となっています。この所定カント量(正規のカント量)に対する変位を「水準変位」と呼んでいます。

左右レールの距離を「軌間」と言います。軌間は鉄道事業者ごとによって異なりますが、今回のデータを提供している東日本旅客鉄道株式会社の在来線の軌間は1067mmです。この1067mmに対する差を「軌間変位」と呼んでいます。ただし、軌間も急曲線箇所は、列車が曲線をスムーズに曲がるように、5mmから20mmほど一部拡大させてあります。

東日本旅客鉄道では、線路設備モニタリング装置を営業列車に搭載してこれら軌道変位を検測していますが、以下の特徴を前提に予測モデルを構築することが必要になります。
・測定機構上、異常値が発生し易い箇所にはフラグがついている
・極稀に異常値が発生する場合がある(フラグはない)
・データが検測できず欠損する場合がある
軌道検測データは、補修の実績も含めて表現されているため、補修時期直後の検測データは良い状態(変位量が小さい)を示しています。ただし、補修時期はデータに明示されていないため、データ傾向から推定することが必要になります。

さらに、軌道は、土路盤の上に砕石とマクラギを配置して、マクラギにレールを締結する構造が一般的です。列車荷重をマクラギを介して砕石と土路盤で支えるため、軌道変位が急進的に変化する場合があります。一方、コンクリートでできた道床や路盤の線路や橋げたに直接マクラギが載っている橋りょう部分は支持剛性が高いため変化が小さくなります。このような特徴があることも踏まえて予測モデルを構築する必要があります。

概要のセクションでも説明したとおり、軌道は、場所ごとにその変位量が大きく異なるという特徴をもっています(同じ路線でも劣化率が場所ごとに大きく異なる)。この変動因子には様々なことが想定されますが、列車の走行量(通トン)と踏切、トンネル、橋梁等いった設備条件に大きく左右されることが分かっているため、これら条件データである「設備台帳データ」も同時に提供されています。

本コンテストで競っていただく予測内容は、「高低変位」になります。これら、高低変位を高い精度で予測できるようになると、どのタイミング補修を行えば良いかといった補修時期の最適化を図ることができます。そのため、軌道変位の劣化予測は保線業界(軌道のメンテナンス業界)では重要なテーマとなっています。また、今回は、「高低変位」だけでなく、「通り変位」「水準変位」「軌間変位」と予測内容以外の検測データも提供されています。従って、これらデータも活用した予測モデルの構築も大いに期待されます。

予測の精度を競う「最高精度賞」に加えて、予測モデルの独創性、新規性、先進性等を評価する「モデリング賞」が準備されています。参加者の強みを活かした応募をお待ちしています。



■具体的なデータ内容
今回提供されるデータは、東日本旅客鉄道の路線で検測された実データと設備台帳データです。首都圏路線と地方路線の複数路線のデータとなっています。
学習データ
【軌道検測データ】首都圏路線A、首都圏路線B、地方幹線C、地方路線Dにおける、各検測地点(キロ程)の変位量(mm)を1日単位で検測したデータ(2017/4/1~2018/3/31)
【設備台帳データ】各検測地点における構造物の情報や列車の走行量(通トン)とフラグ情報
 ※検測開始日は路線によって若干異なります。
 ※項目等の詳細はデータのダウンロードページで確認できます。
評価データ
【軌道検測データ】首都圏路線A、首都圏路線B、地方幹線C、地方路線Dにおける、各検測地点(キロ程)の左レールの高低変位の変位量(mm)を1日単位で検測したデータ(2018/4/1~2018/6/30)
 ※評価期間内に補修が行われた場合、該当するキロ程における補修作業日以降のデータは評価の対象外とします。
 ※評価期間内で異常値と考えられる値については、評価の対象外とします。

■提出物
構築した予測モデルの内容を説明したレポート(必須)。未提出の場合は、精度賞においても評価の対象外となりますのでご注意ください。


アイデア部門
アイデア部門では、鉄道をテーマにデータを活用した分析アイデアを競って頂きます。鉄道が重要なインフラであるということを踏まえて分析を行ってください。用いるデータに制限はありません。

■提出物
ブラウザで閲覧可能なHTMLファイル(関連ファイル一式)、またはPPTやPDFなどによるポスターやレポート等、特別な環境を用意することなく閲覧が可能なものであれば、表現方法は自由です。ただし、作品タイトル、コンセプト、利用データ、メッセージは提出物に含めてください。

■参考
第3回ビッグデータ分析コンテスト 入賞者の予測モデル・作品
    予測部門 精度賞 1位.Team-Itou-One
    予測部門 アイデア賞 1位.masato
    可視化部門 インフォグラフィック賞 1位.Dot
交通コンサルティング事業と データ分析事例
graphillion - 莫大な数の部分 グラフを扱う Python ライブラリ
Tracking the progress of Japan's trains