▼心構え
・特に運用性・拡張性を鑑みた実装を期待します。すなわち、機械的・自動的な処理に基づく学習・推論を前提とし、人間の判断に依存しない処理フローを期待します。
▼システムの利用
・個人で参加する場合、アカウントは1人につき1つまで。
・予測部門、インサイト部門ともにチーム参加可とします。
・チームでの参加を希望する場合、代表者を含めて最大5人のチームが作成可能です。
※チームを作成する場合は、各部門のコンペページ右上の「チーム作成」ボタンより、チームリーダーとなる方がお申込み下さい。
※本コンペでチームを作成をされる場合は4/25(日)までにお申込み下さい。
※チームリーダー(チーム参加の申込者)がSIGNATEから退会すると、チームは解散として扱われます。チームを解散すると、それまでメンバーとして参加していたユーザーは、チームとしても個人としても、当該コンペに投稿できなくなりますのでご注意下さい。
※その他、チーム機能の詳細はこちらをご参考下さい(https://signate.jp/features/team)。
・1日の投稿上限回数は5回/日とします。
▼情報の取り扱い
・本コンペティション期間中の学習済みモデルや分析結果(ソースコード、アプローチ、戦略等)は本コンペティションの規約に同意の上、フォーラムのみで共有可能です。
▼データの利用
・手動でラベル付けした結果を提出することは禁止します。
・学習データのラベルを書き換えてモデルを学習することは禁止します。ただし、統計的かつ機械的な手法により学習用データを水増しして利用することは可能です。
・提供データ以外のデータを用いてモデルを学習することは禁止します。ただし、オープンソースの学習済みモデルやライブラリは使用可能です。
※学習済みモデルを使用する際は、入賞時にソース(論文のリンク等)を明記して頂く必要があります。
・有償のAPI、あるいは無償利用枠を超える範囲でAPIを使用する実装は禁止します。
▼実装方法
・モデルの学習に利用するツールは、オープン且つ無料なもの (python, R等) に限定します。
・同じフォーマットで、異なるデータを入力した場合にも同様なロジックで予測できなければなりません。
・追加費用を伴わない(有償の外部API等を使用しない)環境下で、提案した手法が再現でき、かつ継続使用が可能なように実装をお願いします。 ※GPUの使用を前提とした実装は可能です。
・ソースコードは、原則的に前処理・学習・予測の3つに分け、それぞれを実行すれば処理が進むように実装して下さい。
①preprocess
提供データを読み込み、データに前処理を施し、モデルに入力が可能な状態でファイル出力するモジュール。
get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義してください。
※preprocessに渡す情報として、学習用データと評価用データを混在させることは可能ですが、
get_train_dataで返す結果は前処理された学習用データ、get_test_dataで返す結果は前処理された
評価用データとなるように、処理の内容を独立させて下さい。
②train
①で作成したファイルを読み込み、モデルを学習するモジュール。
学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数も定義してください。
③predict
①で作成したテストデータ及び②で作成したモデルを読み込み、予測結果をファイルとして出力するモジュール。