第1回データサイエンス・カップ 2015 春
株式会社サポーターズと株式会社オプトデータサイエンスラボ
  • 締切: 2015年03月06日
  • 応募:307件 / 35人
  • 1位¥15,000、2位¥10,000、3位¥7,000、4位¥5,000、5位¥3,000、6-10位¥2,000

J1リーグ公式戦の開幕1か月間の全試合の観客動員数を予測するモデルを作成していただきます。

日本プロサッカーリーグ(略称Jリーグ)は1993年にリーグ発足し、2015年シーズン開始時点では、52のクラブチームが所属しています。J1リーグの公式リーグ戦では、毎年各チームが30数試合を行います。J1リーグ戦の年間総入場者数は、リーグ発足時の323万人であったのに対し、2007年には580万人を超え、2014年の実績は520万人です。

クラブチームによっては、熱狂的なサポーターが多数存在し、これらのチームのホームゲームではスタジアムを埋め尽くすほどの観客が自身のひいきのチームの奮戦を楽しみます。

データサイエンティストを目指す学生の皆さんに、機械学習や統計・データマイニングのスキルの腕試しの場として、本コンペを開催します。 


データ
学習用:2012~2014年のJリーグ(J1、J2)の各試合の観客動員数、チーム名、開催スタジアム、天候、出場メンバー、試合結果等の情報。
評価用:学習用データから一部ランダムに抽出したものと2015年第3節までのJ1の試合の情報。

評価関数
・精度評価は、評価関数「RMSE(Root Mean Squared Error 平均二乗誤差)」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。 


最終順位の決定
1.予測結果投稿期間の評価(暫定評価)は評価用データセットの一部で評価し、最終評価期間では、各節が終了するごとに、その節までの観客数の実績と、各参加者の予測値により評価を行います。
 ・第1節が終わった段階で、第1節のみのデータで評価を行い、スコアボードに反映。
 ・第2節が終わった段階で、第1節と第2節のデータで評価を行い、スコアボードに反映。
 ・第3節が終わった段階で、第1、第2、第3節全てで評価を行い、スコアボードに反映。

2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

3.コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書

4.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

5.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。


システムの利用
・学生であること。
・サポーターズの会員であること。
・表彰式でプレゼンテーションを行うこと。

データの利用
・第三者の権利を侵害しない、無償で誰でも手に入るオープンなデータに限り、利用可能。
予測結果投稿期間:2015/2/9 ~ 2015/3/6( J1 開幕前日)
最終評価期間:2015/3/7 ~ 2015/3/22
※投稿の締切は2015年3月6日
「データサイエンス・カップ」は株式会社オプトデータサイエンスラボと株式会社サポーターズが共同で開催する学生限定のコンペです。
今後、データサイエンティストを目指す学生の皆さんに、実世界での予測モデル構築の課題を実践していただくとともに、機械学習や統計・データマイニングのスキルの腕試しの場として提供するものです。終了後には表彰式も開催しますので、同じ専門分野を目指す方々の交流の場としても活用いただけます。