Download Data


These data can not be used for purposes other than those state in Terms of Participation in SIGNATE Competition.
Download Filename File size
学習用データ (train.csv) 35.37 MB
評価用データ (test.csv) 53.25 MB
サンプル投稿ファイル (sample_submit.csv) 319.02 KB

Download data using SIGNATE CLI


By using an official api command line interface SIGNATE CLI (Beta), you can perform general activities such as data downloading and score submitting on the command line. Please refer to this page as for its installation and usage instruction.

Description


学習用データ(train.csv)、評価用データ(test.csv)

レコード数:(学習用)27,145(評価用)40,834
カラムヘッダ名称データ型説明
0id数値インデックスとして使用
1title文字列論文のタイトル
2abstract文字列論文の抄録
3judgement数値論文が診断精度研究に該当するか否かの判定結果 (0: 診断精度研究に該当しない, 1: 診断精度研究に該当する)
※『情報不足により「診断精度研究」であるか否かの判断がつかず、追加情報を要する』と判断された論文は、judgement=1に振り分けるという基準のもとラベル判定が行われています。


※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

サンプル投稿ファイル(sample_submit.csv)

投稿用のサンプルとして、ランダムに0または1を予測した結果を記載したファイルです。

学習用データ、評価用データとは違いヘッダが存在しないという点にご注意ください。

カラムヘッダ名称データ型説明
0無し数値インデックスとして使用
1無し数値論文が診断精度研究に該当するか否かの判定結果 (0: 診断精度研究に該当しない, 1: 診断精度研究に該当する)