お知らせ
[2023/03/04] 入賞者のみなさまには、表彰式への参加をお願いいたします。詳細は続報をお待ちください。
[2023/03/01] 中間イベントの動画公開されました。こちらからご覧いただけます。
[2023/02/23] SIGNATE賞の内容を「特徴量アイデアの募集」に変更いたしました。詳細については評価方法タブをご参照ください。
[2023/02/08] Databricksの分析環境へ登録できる人数の上限に到達しました!多くの方のご参加ありがとうございます。また今回参加できなかった方は、Slackにて次回開催についての事前案内を予定しておりますのでぜひSlackの登録よろしくお願いいたします。
[2023/02/06] 2月10日開催の中間イベントの情報をイベント情報タブに記載いたしました。
[2023/02/02] チュートリアルを微修正しました。データタブからtutorial.dbcを再ダウンロードしDatabricks環境でご覧ください。
[2023/01/31] チュートリアルを公開しました。データタブからtutorial.dbcをダウンロードしDatabricks環境でご覧ください。
[2023/01/27] Databricksの分析環境へ登録できる人数の上限である約1000アカウントにはまだ余裕がありますので、引き続きご応募受け付けています。(サイト上部に表示されている参加人数は、弊社の参加規約に同意いただいた人数であり、Databricksの分析環境の登録人数ではありません)
[2023/01/25] SIGNATE CLI 実行時にプロフィールの入力を促すエラーが表示される場合、以下いずれかのアクションを実施ください。プロフィール入力モーダルが表示され、情報をご入力いただくとエラーが出なくなります。
・データページにて再度何らかのデータをダウンロード
・「チーム作成」というアイコンをクリック(チームは作成いただかなくても問題ございません)
[2023/01/25] 開会式の動画を公開しました。こちらからご視聴いただけます。
[2023/01/23] 配布データ(dbcファイル)の更新をいたしました。
[2023/01/23] 配布データ(SlackURL)の更新をいたしました。
[2023/01/21] 配布データ(dbcファイル)の更新をいたしました。
[2023/01/20] 本番用分析環境のオープンに伴い、配布データを更新いたしました。データタブからご確認ください。
[2023/01/20] Databricksの分析環境へ登録できる人数には上限(約1000アカウント)があります。上限に達し次第分析環境は利用できなくなりますのでご了承ください。
[2023/01/19] 定員に達したため、説明会の募集を締め切りました。後日、録画をSlackにて共有予定ですので、参加できなかった方はそちらをご視聴ください。
[2023/01/11] 【要応募】2023年1月20日18時より説明会を開催いたします!応募方法などの詳細は
こちらをご覧ください。
背景
金融機関の個人向けビジネスにおいては、家計変調の予兆を捉えることが重要です。家計変調の予測が可能になると、お金に困っている人に対して先回りしてアプローチすることができます。これは顧客体験を向上させるだけでなく、金融機関の立場にとっても、適切な商品提供による収益向上、ローンの延滞により生じる事務コストの削減などのメリットがあります。
今回は住宅ローンの延滞予測というテーマを通して、家計変調の予兆を捉えることに挑戦して頂きます。住宅ローン契約者の中には、資金繰りに窮し、延滞に陥ってしまう方がいらっしゃいます。延滞が長期間に渡ると、返済のためにご自宅の売却を余儀なくされてしまうため、住宅ローンの延滞を防止することは、金融機関にとっても、ご契約者にとっても必要なことです。住宅ローンの延滞予測は、住宅ローンの条件見直しや、フリーローンや資産運用の提案に活用できます。
今回提供するデータは、金融機関での実務経験に近い人工的なデータ(※)であり、限りなく実データの性質を反映したものです。金融機関のデータ活用に興味がある方の参加をお待ちしています。
※人工的なデータとは、実データと同じ構造、カラム数、型を有するものの、AIのアルゴリズムによって作成された全く新しい架空のデータのことをいう。
課題
今回の課題は住宅ローン契約者の分析をしていただきます。顧客の属性情報や銀行の口座の情報(入出金や預金残高)等の金融データを用いて、延滞抑止を目的とした延滞を予測するモデルを構築してください。延滞する可能性のあるお客様へファイナンシャルアドバイスをすることも想定し、基準月をN月とした場合にN+3カ月時点で延滞しており、かつN+4カ月以降も連続で延滞する会員を予測していただきます。また、1度でも連続で延滞した(target_flag = 1)会員は、それ以降の日付には(testデータも含め)出現しません。
参加条件
16歳以上の方
※本コンペでは情報交換・問い合わせ先としてSlackを利用いたします。そのためSlackのプライバシーポリシーによる年齢制限が適用となり、16歳未満の方はご参加いただけません。ご了承ください。
エントリー方法
本コンペは、Databricks より提供される分析環境上で、データの取得、分析、モデル作成、予測結果の投稿等、一連の作業を行っていただきます。データタブに記載の手順に従い、Databricks アカウントを発行し、コンペにご参加ください。Databricks 上の分析環境では、AI モデル構築のプロセスを一通り体験できるコンテンツも提供しています。
- Databricks への登録には、SIGNATEの登録のメールアドレスと同じものを使用してください。
- Databricks 上での分析データへの参照開始は1/20からとしており、それまでは準備期間とします。
- Databricks の環境は、登録直後から使用できる①練習用分析環境(Community Edition)と、1/20以降に本コンペの分析データを参照して分析や投稿を行っていただく②本番用分析用環境、の2種類があります。
- 2023年1月20日18時まで:①練習用分析環境
- 2023年1月20日18時から:②本番用分析環境
- ①練習用分析環境は、Databricksの操作に慣れていただくためにご活用ください。(当環境は場合によっては正常に動作しない可能性もあります旨、予めご容赦ください)
- ②本番用分析環境では、分析データそのものや、分析のために作成したNotebookなど、Databricks 上の分析環境からローカル環境へのダウンロードやコピー(画面キャプチャなども含む)は一切不可となり、違反した場合は失格となります。
投稿方法
Databricks 上の分析環境で、SIGNATE CLI を利用して予測結果を投稿いただくと、リーダーボードに反映されます。コンペ終了後は、選択された投稿ファイルのスコアで順位が決まるため、終了までに「投稿済みファイル」タブにて忘れず選択ください。
情報交換・問い合わせ
コンペに関する連絡は、本コンペ専用のSlackワークスペースにて行います。参加者同士の情報交換や議論はもちろん、運営とコミュニケーションいただくことも可能ですので、ぜひご参加ください。Slackのリンクはデータタブに記載しています。なお、コンペに関する問い合わせは、SIGNATEの問い合わせフォームではなく、Slack上からお願いいたします。