あなたの「技術」を試してみませんか?
SIGNATEはデータサイエンティストが作る「モデル」を競い合う場です
STEP 1

会員登録

まずはSIGNATEへ会員登録しよう!

会員登録について

自己紹介や追加情報を埋めよう

自己紹介や得意な手法などの追加情報は他ユーザも閲覧できる項目です。SNSリンクも登録が可能なので、自己アピールの場として積極的に活用しよう。思わぬ出会いがあるかも!?

就活・転職サポートを活用しよう

就活・転職サポートを活用しようにチェックを入れることでデータサイエンス関連の求人情報やスカウトを受け取ることができます。情報収集ツールの1つとして活用しよう。

教育目的でSIGNATEを利用したい方は

大学や企業における教育目的でSIGNATEを活用したい方はコチラからSIGNATEへお問い合わせください。ニーズに合わせてツールや研修プログラムのご案内をさせていただきます。

手順

  • 1

    会員登録をクリック

    仮登録情報入力画面に必要事項を入力しましょう。

    • ユーザ名は2文字以上20文字以内での入力となります。
    • 既に他ユーザが利用しているユーザ名は使用できません。
    • パスワードは半角英数字6文字以上20文字以内での入力となります。
  • 2

    仮登録メールを受信

    ①で入力後、仮登録メールが送信されるので、メール中のリンクをクリックしましょう。

    • 24時間以内にリンクをクリックして本登録をいただかないと再登録となりますのでご注意ください。
    • 万が一仮登録メールが届かない場合は、コチラからお問い合わせください。
  • 3

    本登録ページへ記入

    ②のリンクをクリックすると本登録入力画面へ移動しますので、必要事項を記入してください。

    • 生年月日はパスワードを忘れてしまった際に必要となります。
STEP 2

コンペに参加

コンペティションに参加してみよう!

コンペティションの種類

OPEN

オープン

全会員参加可能で、企業や行政の課題解決を目的とした懸賞金型コンペティション。多くのライバルと競い合い、懸賞金を勝ち取ろう!

MASTERS

マスターズ

SIGNATEでの実績が認められた方のみが参加可能な参加者限定コンペティション。参加者はNDA締結の上、クラウド上の分析環境で競います。参加者少数で懸賞金も高額!懸賞金ゲットのチャンス大?!

RESEARCH

リサーチ

大学・公的研究機関を中心とした研究を目的としたコンペティション。知的好奇心をくすぐる最先端テーマにチャレンジできます。共同研究や論文にもつながるかも?!

PRACTICE

プラクティス

まずはここから!さまざまな分野の練習問題を通じて実践経験を積みましょう。Learningページでは、プラクティスコンペティションを通じてプログラミング技術やデータ前処理、モデリング手法等を学ぶ教材も提供しています。

手順

  • 1

    一覧から選ぶ

    コンペティション一覧より自分のスキルや興味に合ったものを選びましょう。

  • 2

    規約に同意

    データをダウンロードしようとすると、コンペティションの規約が表示されます。

    コンペティション参加規約を読んだうえ、同意へチェック。

    • コンペ毎の規約に同意いただかないとそのコンペに参加することはできません。
    • NDA締結や本人確認が必要となるコンペもあります。
  • 3

    データをダウンロード

    データの概要事項を読んだうえで、データやコンペティションの規約についてご不明点がありましたら、コチラよりお問い合わせください。

    • コンペで配布するデータはコンペでの利用においてのみ使用ができます。
    • コンペでの目的以外での使用や再配布は禁じられています。
    • ローカル環境へデータをダウンロードできず、クラウド分析環境で分析するコンペ形式が指定される場合もあります。
STEP 3

分析開始

提供されるデータにアクセスして、最高精度の予測モデルを作ろう!

4つの心得

コンペルールを確認しよう

コンペ毎に定められたルールをよく読んでから分析を進めましょう。せっかく入賞してもルールを満たしていないと失格となります。コンペルールの例はコチラをご覧ください(※コンペによっては途中で変更になる場合があります)。
ルールに不明点がある方は、コチラからお問い合わせください。

分析結果を管理しよう

コンペは数ヵ月続くため、ご自身の分析結果をしっかり管理しておきましょう(ファイル名に日付や手法、パラメータ等の名称をつけるなど)。入賞候補になった場合の入賞手続き時に有効です。なお、他参加者の失格等で全員に入賞チャンスがあるので、スコアがふるわなくても管理は怠らないで!(入賞手続きについてはコチラをご覧ください)

過学習に注意!

学習用データに依存して、別のデータで想定する予測性能を発揮できないことを“過学習”といいます。過学習を起こすと、手元の学習用データのスコアが良いのに、提出した評価用データのスコアが悪くなり、順位が伸びない要因となります。詳しくは下記の手順2を参照してください。

実用性を重視しよう

コンペには企業課題の達成や社会問題の解決、研究成果の共有等、大前提となる目的があります。モデリングの際には実運用を意識したアプローチをお願いします。最終順位・入賞確定時に本趣旨に反するモデルやチート行為等が疑われた場合、事務局の判断で失格となる場合があります。

手順

  • 1

    データの確認

    データにアクセスできるようになったら、まず提供データの性質を把握しよう。例えば、データのレコード数やデータのタイプ(連続値なのか離散値なのか、文字列なのか等)、欠損値の有無、データの分布の形状、タスクタイプ(回帰、分類、マルチクラス、マルチラベル)の確認をすることが重要です。


    データの性質が把握出来たら、探索的分析を始めよう。クラスタリングや相関分析、各種手法を用いて、変数間にどんな関係があるのか、どの変数が目的変数と関連深いか、どんな特徴量を作る必要があるのか等、予測精度を上げる為の仮説をどんどん作っていこう。

  • 2

    モデリング

    データの基礎分析が終わったら、学習データを加工し、モデルを作っていこう。モデルを作ったら、まずは学習データにおける予測精度を評価してどの程度の予測が期待できそうかを確認しよう。その後、このモデルへ評価データを入力して予測結果を求め、SIGNATEに投稿してみよう。


    精度向上の為に、データの確認の時に挙げた仮説を元に予測に寄与しそうな特徴量を生成し、更なるモデル改良を続けよう。


    過学習を避けるために、クロスバリデーションやブートストラップ法、特徴量選択、ハイパーパラメータのチューニング等、様々な工夫を駆使して、上位を狙おう。


    分析結果はあとからわかりやすいように管理しておこう。

STEP 4

順位の確認

モデルがどのくらいの精度を有するか?順位を確認しよう!

評価・投稿について

順位は細かく確認しよう

コンペ開催中はスコアボードで自身やライバルのスコアも確認しながらモデルの精度改善に取り組もう。コンペ終了間際は予測結果の投稿が増え、デッドヒートになる傾向があります。期間中は上位であっても逆転が起こるので、油断しないで改善を続けましょう。

1日の投稿回数上限に注意

各コンペには1日の投稿回数に上限があるので、計画的な投稿を心がけよう。1日の上限に達した場合は、いったん頭とマシンを休ませて、毎晩0時に行われる投稿回数のリセットを待ちましょう。

最終順位は終了後のスコアボードで決定

コンペ最終日までの評価(暫定評価)は、評価用データの一部で評価されます。最終順位決定の為の評価(最終評価)は、評価データの残りの部分で評価がされます。スコアボードはコンペ終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。その為、コンペ開催中と終了後とでは順位が大きく変動することがあります。

手順

  • 1

    学習済モデルで評価用データを予測し、指定フォーマットで出力の上、SIGNATEに投稿します

    コンペでは評価用データの目的変数のみ配布されず、こちらを予測するモデルを作ることが目的となります。
    ※評価用データのどの部分が暫定用・最終用であるかは開示されません。また、それらを探索する行為(チートと呼ぶ)は認められておらず、その事実が発覚した場合には失格とさせていただきます。

  • 2

    順位の確認

    投稿が完了するとコンペ毎に設定される評価関数により自動的に予測精度が計算され、スコアボードに順位が表示されます。
    コンペ開催中は暫定評価、終了時に最終評価のスコアが表示されます。

    終了後、自動的にスコアボードに最終評価が表示されます。

  • 3

    上位を目指して、STEP3分析開始と、STEP4順位の確認を繰り返します

STEP 5

入賞の手続き

入賞手続きをして、懸賞金をゲットしよう!

懸賞金を獲得するには

ソースコード等を提出しよう

懸賞金を獲得するためには、事務局が指定する必要事項を提出する必要があります。その際に、どの分析結果が最終提出物だったかを事前に確認しておきましょう。また、検収・審査にスムーズに合格できるように、ルールに違反していなかったどうかの再確認や、ソースコード・記入事項は出来るだけ正確に細かく記載するようにしてください。

モデル検収にクリアしよう

最終順位により入賞候補者となった方は、モデルと必要記載事項を事務局に提出し、SIGNATEによるモデルの検収・審査に合格する必要があります。このモデル検収をクリアすると晴れて入賞者に確定し、懸賞金を受け取ることができます。詳細については下記の手順を参照してください。

各種権利を譲渡する必要があります

コンペは提出いただいたモデルやレポートの著作権を権利譲渡対象者へ譲渡することで懸賞金を受け取れる仕組みとなっています。権利を譲渡いただくと、そのモデルの利用や、ブログ等で自身のアプローチを外部へ公開できなくなりますので、あらかじめご了承ください。ご不明な点がある方は、コチラからお問い合わせください。

手順

  • 1

    候補者通知を受信

    最終結果が上位だった方には事務局より入賞候補者通知が送られます。

    • 最終順位確定後、1週間以内に本通知がされます。
    • 稀に迷惑メールフォルダに入ってしまっていることがありますのでご注意ください。
  • 2

    提出物を提出

    事務局の案内に従い、ソースコード及び必要事項を記載の上、事務局に期日までに提出しよう。

    • ソースコードやファイルは整理の上ご提出いただけますと検収をスムーズに進めることができますので、ご協力ください。
    • 最終提出物とは異なるモデルのソースコード提出や、パラメータ違いであるケースが多発しています。提出前によくご確認ください。
  • 3

    検収・審査を受ける

    提出物の提出が確認できたらモデル検収やルール順守しているか等の審査を事務局で実施いたします。

    • 不明点や動作ができなかった場合には、事務局よりお問い合わせさせていただきますので、ご協力ください。
    • モデル概要の記載は特にモデル検収において重要です。詳しくご記入ください。
      記入項目例)
      ・予測ロジック
      ・分析・モデリングから得られた示唆
      ・再現の為の手順
      より詳細な項目を知りたい方はコチラへ。
  • 4

    入賞手続きをする

    審査に合格すれば懸賞金獲得まではもう目前。事務局に従い、権利譲渡等の契約をもって獲得権利が得られます。

    • 本契約を締結後、原則、1~2ヶ月で懸賞金の振込が完了致します。