JSAI Cup 2017 人工知能学会データ解析コンペティション
SIGNATE
  • 締切: 2017年04月27日
  • 応募:587件 / 40人
  • 最大¥400,000の国際学会への参加費・渡航費

コンペ趣意
2017年度人工知能学会全国大会(第31回)が5月23日(火)~5月26日(金)にて、愛知県名古屋にある「ウインクあいち」にて開催されます。

今回は人工知能学会全国大会における初めての試みとして、データ解析コンペティションを開催いたします。
データ解析コンペティションは、参加者が同じデータを用いて解析に取り組み、予測モデルの精度を競う大会です。
本コンペティションでは、気象データから鉄道支障を予測するモデルの精度を競います。

コンペ上位の方には本会議に出席頂き、優れた分析手法や分析結果について発表をして頂きます。

概要
首都圏全線の1週間あたりの利用者数は述べ11,301万人と言われており、鉄道は公共交通機関の要と言えます。
その為、一旦運行支障が発生すると、遅延・混雑により、二次的な更なる危険発生リスクも高まり、社会的問題となっています。
そこで、事前に支障リスクを把握することで、少しでもリスク低減に寄与することが今回の問題の大きな目的となります。
気象と鉄道支障との関係性を見つけ出し、高精度な鉄道支障予測にチャレンジして下さい。

データ
データとして、気象データとJR東日本首都圏5路線の鉄道支障履歴データが与えられます。データの期間は、2012年1月1日から2013年6月30日までの1年半です。各種データは、10分刻みのデータとなっています。(落雷のデータのみ、発生毎に記録)

支障予測対象となる鉄道は、JR東日本の首都圏10路線です。
5鉄道の鉄道支障データを学習データとして利用し、残り5鉄道の鉄道支障を予測して頂きます。

<学習用路線>
 ・中央線(快速)[東京~高尾]
 ・京浜東北根岸線
 ・京葉線
 ・埼京川越線[大崎~川越]
 ・内房線

<テスト用路線>
 ・外房線
 ・宇都宮線
 ・山手線
 ・高崎線
 ・湘南新宿ライン



本コンペでは予測精度による定量評価と提出レポートによる定性評価の2つの観点から、最終的な入賞者を決定致します。
※予測精度及びレポートの両方を〆切までにご提出頂かないと評価対象となりませんので、ご注意下さい。

評価関数
・精度評価は、評価関数「logloss」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。
・目的変数は、時間毎の支障カテゴリ(支障なし、人身支障、機械支障、気象支障)です。
・今回の問題では、各路線、時間毎における複数支障の同時発生はありません。




 
レポート
・レポートは、データの解釈、ストーリー性、探索的分析、可視化表現、アイデア・発想力等を、厳正な審査により評価します。
・レポートは複数回応募できますが、最後に提出されたレポートが評価対象となります。
・レポートの形式は、JSAI Cup 2017のデータのダウンロードページにある、レポート要件.pdf を参考に作成し応募してください。

最終順位の決定
1.コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。※スコアボードはコンペ終了時に自動的に最終評価に切り替わり、その評価値とレポートの評価で最終順位を決定します。

2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

・コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順**1、乱数シード**2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

3.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

4.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。

参加条件
JSAI2017に参加予定であり、本コンペのセッション時に発表が可能な方
※1 発表対象者はコンペ上位の方より選出させて頂きます
※2 セッションの日時等の詳細については確定次第、お知らせいたします

心構え
・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨むこと。

システムの利用
・利用アカウントは1人につき1つまで。ただし、アカウントが1つであればチームでの参加も可能。

情報の取り扱い
・同じチーム以外の参加者と本コンペの予測に関連するデータ・ソースコードを共有する行為は禁止。

データの利用
・第三者の権利を侵害しない、無償で誰でも手に入るオープンなデータに限り、利用可能。
・ある時点を予測をする時は、その時点以前に確定している情報のみ使用可能。
・具体的には、予測したい時点の10分以前に取得可能なデータが使用できます。(2017/03/17修正)
e.g.) 2013-04-01 10:00:00を予測する場合は、2013-04-01 09:50:00以前のデータが使用可

実装方法
・モデルの学習に利用するツールは、オープン且つ無料なもの(python, R 等)に限定。
・ソースコードは、以下のように、前処理、学習、予測、の3つに分け、それぞれを実行すれば処理が進むように実装すること。
 ①Preprocessing
  提供データを読み込み、データに前処理を施し、モデルに入力が可能な状態でファイル出力するモジュール。get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義してください。
 ②Learning
  ①で作成したファイルを読み込み、モデルを学習するモジュール。学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数も定義してください。
 ③Predicting
  ①で作成したテストデータ及び②で作成したモデルを読み込み、予測結果をファイルとして出力するモジュール。

2017年3月13日(月)コンペ開始
2017年4月27日(木)コンペ終了
2017年5月1日(月)予測モデルソースコードの提出締切 (※入賞候補連絡を受け取った方)
2017年5月8日以降 検収・審査にて入賞者を決定
2017年5月23日(火)人工知能学会全国大会のセッションにて発表


・会場案内
【特別セッション:JSAI Cup報告会】
日時:5月23日(火)17:50-20:10
場所:C会場(ウインクあいち-9F 902会議室)


2017年度人工知能学会全国大会(第31回)
日時:2017年5月23日(火)~ 2017年5月26日(金)
場所:ウインクあいち(愛知県産業労働センター)
(愛知県名古屋市中村区名駅4丁目4-38)

論文への利用について
本コンペを通じて得たノウハウやテクニックに関しては共有可能であり、論文等を執筆・投稿することが可能です。
なお、本コンペで提供された鉄道支障データ、気象データ等についてはコンペ終了後削除していただく必要がありますが、コンペ参加者に限り、別途利用許可を申請していただければ、論文等にご使用いただくことも原則として可能です。
申請の際には、下記情報をお問い合わせフォームからご連絡ください。

・大学・研究機関名等のご所属先
・論文執筆者名
・発表日時
・発表学会名
・発表形態
・論文タイトル
・論文概要
・利用データ

主催
人工知能学会

賞品
入賞賞品として、最優秀の方1名様に40万円を上限に、人工知能関連分野の国際会議への参加費・渡航費を支援致します。
※1 人工知能学会でのセッション発表が必須となります
※2 支援の際には、参加学会名がわかる資料、飛行機・学会参加費の領収書等のご提出が必要となります