【練習問題】お弁当の需要予測
SIGNATE
  • 締切: 無期限
  • 応募:5078件 / 821人
  • Knowledge

千代田区四番町のとある会社のカフェフロアで販売されているお弁当の販売数を予測するモデルを作成していただきます。

千代田区四番町の株式会社 "O" では、お昼になるとお腹を空かした社員たちが続々とカフェフロアに集まってきます。彼らの目的は、お弁当。
午後の業務を遂行するためにも、お昼のエネルギー補充は欠かせません。平均年齢30歳の社員たちにとってのランチタイムは、財布、胃袋、時間、そして己の味覚との相談の時でもあります。

「財布に優しく、お昼は安く」「ランチに外に行く時間すら惜しい」「今日は好物の○○。お弁当にしよう」
さまざまな思いが交錯するなか、お弁当はひとつ、またひとつと売れていきます。しかし、売れ残るお弁当もチラホラ。社員の胃袋に収まらなかった売れ残りのお弁当から漂う哀愁は、環境にも、そしてお弁当屋さんの懐にも優しくありません。

売り切れた場合も同様。「ひょっとしたら、もっと売れたかもしれない……」売り切れは、お弁当屋さんにとっては機会損失、カフェフロアまで来た社員にとっては時間損失となります。

お弁当の売上向上・廃棄削減のためには、正確な需要予測に基づき生産計画を立てる必要があります。
今回のコンペでは、曜日やメニュー等の複数の変数から最適なお弁当の量を推測していただき、お弁当屋さんと、その利用者、そして環境に貢献していただきます。 


データ
データの期間は、お弁当の販売を開始した 2013年11月18日 から 2014年11月30日 まで(土日祝を除く平日)です。

学習用データ期間:2013年11月18日 ~ 2014年 9月30日
検証用データ期間:2014年10月 1日 ~ 2014年11月30日

変数の詳細やデータ形式については、「データをダウンロード」ページをご参照ください。

評価関数
・精度評価は、評価関数「RMSE(Root Mean Squared Error 平均二乗平方根誤差)」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。 


応募方法
・予測する変数は、その日に売れるお弁当の数です。
・応募ファイルの形式はcsv(カンマ区切り)のヘッダーなしファイルです。
・検証用データの1列目にある日付をインデックスとし、2列目に予測値を記述します。

システムの利用
・応募は1参加者あたり1日に5度までとします。