株式会社リンクバル イベントレコメンドエンジン作成
株式会社リンクバル
  • 締切: 2018年05月21日(残り25日)
  • 応募:628件 / 71人
  • 1位 ¥600,000 2位 ¥300,000 3位 ¥100,000

”検索をしなくとも、ユーザ様にとってベストなイベントが表示される”
そんなサイトを私たちは目指しています。

弊社は「街コンジャパン」というサイトを運営しており、そこでは日本各地の「街コン」や「婚活パーティー」など、「出会い」をキーワードとしたイベントを数多く掲載しております。

そんな数多くのイベントの中から、自分が欲しい情報を探し出すというのはなかなか大変な作業です。そこで私たちは、「各ユーザ様が欲するイベントを優先的に表示し、検索をしなくとも欲しい情報が表示される」というレコメンドエンジンの作成を目指しています。

皆様には、ユーザ様の行動履歴を元に、そのユーザ様に合ったイベントを予測するモデル作成にチャレンジしていただきたいと思います。

イベントという商品の性質上、まったく同じ商品が存在しません。皆様の創意工夫が重要になるかと思います。
ご自身の経験・知識・発想力を生かし、日本中の「出会い」をサポートしませんか?

皆様のご応募、お待ちしております。


評価関数
今回予測していただく目的変数は2017-09-24~2017-09-30の間に少なくとも1回はあるイベントを購入、またはブックマーク、または詳細ページを閲覧した各ユーザーに対するイベントの関連度が高いランキングです。予測精度の評価は、nDCG(normalized discounted cumulative gain)を使用します(右図参照)。この評価値は0~1の値をとり、精度が高いほど大きな値となります。関連度(rj)は購入を3、ブックマークを2、イベントページの閲覧を1とします。ユーザー(全部でn=2886人)ごとの最大推薦数kは20とします。予測値の出力形式についてはダウンロードページの応募用サンプルファイルをご参照ください。


最終順位の決定
1. コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。
 スコアボードはコンペ終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。

2. スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

3. コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順*1、乱数シード*2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

4. 再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない
 - 新しいデータに対して予測できない

5. 入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。

心構え
・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨んでください。

システムの利用
・利用アカウントは1人につき1つまでです。チームでの参加は不可とさせていただきます。

情報の取り扱い
・他の参加者と本コンペの予測に関連するデータ・ソースコードを共有する行為は禁止とします。

データの利用
・第三者の権利を侵害しない、無償で誰でも手に入るオープンなデータに限り、利用可能です。
・今回提供しているデータ以外に対しても予測が可能である必要があります。ゆえに、説明変数にユーザidやイベントidを入れることは他ユーザへの予測が困難となる為、禁止です。
・本コンペでは2017-09-23以前を学習期間とします。よって、2017-09-24以降の情報を使うことは禁止します。
 - 提供データについて(詳細はダウンロードページをご覧ください)
   ・イベントの属性データに関して、イベント掲載日が2017-09-24以降となっているデータについては使うことは禁止します。
   ・ユーザーの行動ログデータ、ユーザーのデモグラ情報についても同様となります。
 - 提供データ以外について
   ・2017-09-23以前に取得可能なデータのみ利用可とします。

実装方法
・モデルの学習に利用するツールは、オープン且つ無料なもの(python, R 等)に限定します。
・ソースコードは、以下のように、前処理、学習、予測、の3つに分け、それぞれを実行すれば処理が進むように実装してください。
 ① Preprocessing
  提供データを読み込み、データに前処理を施し、モデルに入力が可能な状態でファイル出力するモジュール。get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義してください。
 ② Learning
  ①で作成したファイルを読み込み、モデルを学習するモジュール。学習済みモデルや特徴量重要度、クロスバリデーションの評価結果を出力する関数も定義してください。
 ③ Predicting
  ①で作成したテストデータ及び②で作成したモデルを読み込み、予測結果をファイルとして出力するモジュール。
2018年3月20日(火) コンペ開始
2018年5月21日(月) コンペ終了
2018年5月28日(月) 予測モデル等の提出締切 (※入賞候補の連絡を受け取った方)