Platform ID ネット広告のクリック予測
株式会社Platform ID
  • 締切: 2014年12月14日
  • 応募:827件 / 74人
  • 総額¥1,600,000(条件付き)

インターネット広告配信プラットフォーム上に蓄積されているログデータから、広告が表示された際のクリック有無を予測するモデルを作成していただきます。

広告配信プラットフォーム上では、時々刻々とネット広告に関するデータが蓄積されており、データサイエンティストの活躍が期待されているビッグデータの一つとして、今、注目を浴びています。なかでも広告効果の向上を目的とした解析は、重要な課題です。

広告効果の向上は、広告主にはもちろんのこと、それを表示する媒体(ウェブサイト)やその媒体にアクセスするユーザーにとっても高い有用性があるのは論をまちません。
広告主にとっては「少ない費用で高い効果を得ること」ができ、
媒体社にとっては「広告在庫の効果的な供給」が可能となり、
ユーザーにとっては「有意義な情報に触れられる可能性が高くなること」が期待されます。

広告効果のさらなる向上に向けて、近年、重要視されているのが大量にあるログデータの活用、すなわちデータサイエンスです。

今回のコンペでは、多数の変数から「表示される広告をユーザーがクリックするかどうか(0:クリックなし、1:クリックあり)」を予測するモデルを作成していただき、ネット広告のエコシステムの発展に寄与していただきたいと考えております。

データ
データの期間は、2週間分(年月日の記載なし)で、各レコードは広告が表示された際に生成されたものです。1週間分のログデータを活用してモデルを学習し、次の1週間分のクリックの有無を予測してください。
学習用データ期間:1週間分
検証用データ期間:学習用データに続く次の1週間分





賞金
1位¥600,000(スコア0.22以下)
2位¥400,000(スコア0.23以下)
3位¥300,000(スコア0.24以下)
4位¥200,000(スコア0.26以下)
5位¥100,000

評価関数
・精度評価は、評価関数「LogLoss(Logarithmic Loss function 対数損失関数)」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。 


 
最終順位の決定
1.コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。
 スコアボードはコンペ終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。

2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

3.コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順*1、乱数シード*2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

4.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

5.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。

2014年10月6日 コンペ開始
2014年12月14日 コンペ終了