【練習問題】Jリーグの観客動員数予測
SIGNATE
  • 締切: 無期限
  • 応募:3240件 / 333人
  • Knowledge

Jリーグ公式戦2014年シーズン後半戦全試合の観客動員数を予測するモデルを作成していただきます。

日本プロサッカーリーグ(略称Jリーグ)は1993年にリーグ発足し、2016年シーズン開始時点では、56のクラブチームが所属しています。J1リーグの公式リーグ戦では、毎年各チームが34試合を行います。J1リーグ戦の年間総入場者数は、リーグ発足時の323万人であったのに対し、2007年には580万人を超え、2015年の実績は540万人です。

クラブチームによっては、熱狂的なサポーターが多数存在し、これらのチームのホームゲームではスタジアムを埋め尽くすほどの観客が自身のひいきのチームの奮戦を楽しみます。

サポーターたちを惹きつけるものは何だろう。
熱のこもったプレー、目当ての選手、応援団の一体感、はたまた地元への愛か。
それぞれの思いを持って、彼らはスタジアムに足を運ぶのです。

本コンペでは、2012年~2014年シーズン前半までのデータを使って、
「2014年後半戦J1,J2全試合の観客動員数を予測するモデル」
を作成していただきます。

データ
学習用:2012~2014年シーズン前半戦(~7月31日)のJリーグ(J1、J2)の各試合の観客動員数、チーム名、開催スタジアム、天候、出場メンバー、試合結果等の情報。
評価用:2014年シーズン後半戦(8月2日~11月23日)のJリーグ(J1、J2)の試合の情報。


評価関数
・精度評価は、評価関数「RMSE(Root Mean Squared Error 平均二乗誤差)」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。 


応募方法
・予測する変数は、スタジアムの入場者数です。
・応募ファイルの形式はcsv(カンマ区切り)のヘッダーなしファイルです。
・検証用データの1列目にある値をインデックスとし、2列目に予測値を記述します。

システムの利用
・応募は1参加者あたり1日に5度までとします。


データの利用
ある日の予測をする時は、その日に確定している情報のみ使用可