【練習問題】銀行の顧客ターゲティング
SIGNATE
  • 締切: 無期限
  • 応募:5940件 / 981人
  • Knowledge

予測モデル構築の練習課題として、実データを使った例題を提示します。


本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。
活用するデータは、実際のビジネス環境で得られたもので、マーケティングキャンペーンの効率化を図るためのモデリングを行います。
過去、このデータを使用して書かれた論文によるモデリング精度を超えることを目指し、腕試しがてらコンペに参加してみてください。



データ
使用するデータは、ある銀行の顧客属性データおよび、過去のキャンペーンでの接触情報、などで、これらのデータを元に、当該のキャンペーンの結果、口座を開設したかどうかを予測します。


学習用のデータは、27,168名の顧客データとキャンペーンの結果(口座開設の有無)です。
予測する対象は、18,083名のキャンペーンに対する反応(結果)を予測していただきます。

予測に使用する変数(説明変数)は16で、これらの変数は学習用、予測対象の両方のデータに含まれます。
予測対象となる変数は、学習用のデータにのみ含まれます。

変数の詳細や、データ形式については、「データをダウンロード」ページをご参照ください。

本コンペで使用するデータは、以下のサイトおよび論文からの引用です。

Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science.

[Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference - ESM'2011, pp. 117-121, Guimarães, Portugal, October, 2011. EUROSIS.

評価関数
・精度評価は、評価関数「AUC(Area Under the Curve)」を使用します。
・評価値は0~1までの値をとり、精度が高いほど大きな値となります。
・目的変数は、対象となる顧客の定期預金の申し込みが成立するか否かであり、0~1の実数で予測していただきます。
・検証用のデータファイルに含まれる、すべてのidについて予測値を提出してください。
・ファイル形式は、csv形式とします。


システムの利用
・応募は1参加者あたり1日に5度までとします。

【お知らせ】コンペ再開及び第2回中間順位発表

 お待たせしました。

本コンペは本来終了しましたが、次回のコンペの開催まで少々時間がかかってしまいましたので、
本コンペを再開させていただきました。
従いまして、本来の最終順位を中間順位とさせていただきます。

下記、4月1日0時時点の順位を発表させていただきます。

1位 欠席
2位 欠席
3位 cogsoc (スコア:0.936773456449943、4月1日0時時点)
4位 欠席
5位 欠席

この度、上位5位の方のソースコードで再現性を検証し、
ソースコードをご提出頂いた方に、順位の決定をさせていただきました。

残念ながら、3位の方のみはソースコードを提出いただいたので、
1位、2位、4位及び5位を欠席とさせて頂きます。

ソースを提供していただいたcogsoc様にお礼を申し上げます。
ありがとうございました!

2015年05月22日時点