▼お知らせ


2021/08/24 10:30:
リーダーボードのボーダーライン表示に誤りがありましたため、以下の通り表示内容を修正いたしました。
           金メダル獲得:10位以上(変更なし)
           銀メダル獲得:27位以上 → 24位以上
           銅メダル獲得:54位以上 → 48位以上
           60%Line   :82位以上 → 72位以上
           なお、実際に付与されておりますメダル・ポイントに誤りはございません。
           ご迷惑をおかけしましたことお詫び申し上げます。

2021/08/13 17:20:入賞者様のご発表資料、提出モデルのソースコードの一覧が公開されました。

2021/07/05 11:10:入賞者がすべて確定しました。

2021/07/01 10:10:フォーラム活動賞、Web記事賞表彰者が確定しました。詳細はフォーラムをご確認ください。

2021/06/30 12:00:入賞者(1~9位)が確定しました。10位入賞者は引き続き審査中です。

2021/06/11 13:00:Web記事賞の表彰対象選出期間は「2021年1月29日から2021年6月21日正午まで」となっております。詳細はフォーラムをご参照ください

2021/06/10 09:00:第4回(ラウンド4)のLIVE評価結果が確定し、最終評価が確定しました。

2021/06/02 14:45:第3回(ラウンド3)のLIVE評価結果が確定しました。

2021/05/26 17:30:第2回(ラウンド2)のLIVE評価結果が確定しました。

2021/05/19 16:00:第1回(ラウンド1)のLIVE評価結果が確定しました。

2021/04/22 09:00:オンラインイベントの発表資料「LDAを利用した予測モデル構築」を概要ページ末尾に追加しました。

2021/04/21 21:30:オンラインイベントの発表資料「提供データ・学習済モデルの読込み方法」を概要ページ末尾に追加しました。

2021/04/09 17:00:ポートフォリオ構築方法のライブコーディング、モデル提出方法の解説等
           を行う
オンラインイベントを開催いたします。詳細は以下のフォーラムをご覧ください。
           [お知らせ] オンラインイベントの開催について @4/20(火) 19:00-21:00

2021/03/29 10:00 : 配布データに一部欠損があったためデータを差し替えました。データページより再取得をお願いします。(stock_fin.csv.gzデータ及びstock_fin_price.csv.gzデータ)

2021/03/26 17:00:モデルの投稿が可能となりました。

2021/03/19 12:00:本コンペティションをオープンしました。なお、モデルの投稿は3月26日より開始ですので、ご留意ください。


▼J-Quants概要




J-Quantsは、投資にまつわるデータ・環境を提供し、個人投資家の皆様によるデータ利活用の可能性を検証する、(株)日本取引所グループによる期間限定の実証実験プロジェクトです。

本プロジェクトでは、「ファンダメンタルズ分析チャレンジ」と「ニュース分析チャレンジ」の2本のコンペティションの開催を予定しています。

ファンダメンタルズ分析チャレンジに続き、今回は株式市場を対象としたデータ分析の初学者・データサイエンスに知見のある有識者・自然言語処理の有識者等を対象者として「ニュース分析チャレンジ」を開催いたします。

(参考)J-Quantsについて

(参考)株式分析チュートリアル


▼背景

証券市場では、長年、様々なデータや数学的手法を用いて様々な市場を分析し、金融商品の組成や投資戦略の立案が行われてきました。以前はこのような分析を行うことができるのは、金融機関や機関投資家と呼ばれる大手の投資家に限られてきました。しかし近年では、個人の方にも、ITやデータを活用した金融市場の分析や取引が拡大しています。 

日本においても様々なデータの活用やデータサイエンティストの育成が推進されていることも踏まえ、本コンペティションを開催します。本コンペティションを通じて、データ分析の経験者のみならず、「今まで金融データやデータ分析に知見がなかった初心者の方にもポートフォリオ分析等のITを活用した投資手法を学んでいただくこと」や「データサイエンスを学ぶ学生の方々に金融データに興味を持っていただくきっかけとなること」を期待しています。


▼課題

現金100万円を原資として、1週間の収益(キャピタルゲイン)がより高くなるポートフォリオ(購入する銘柄等の組み合わせ)の予測に取り組んでいただきます。本コンペティションにおける収益とは、ある1週間のうち、初日(月曜日)の始値で購入し、最終日(金曜日)の終値で売却する時の収支を指します(詳細は「予測対象」を参照)。 ポートフォリオの予測に当たって、銘柄情報・株価情報・ファンダメンタル情報・日経電子版見出しテキストデータ・適時開示データ等の様々なデータを利用することができます。 本コンペティションでは、この1週間における収益の競争を、2021年5月10日(月)〜2021年6月4 日(金)の4週間(4ラウンド)の期間でそれぞれ実施し、その4ラウンド全ての総合的な収益を競っていただきます。なお、本コンペティションでは各銘柄は1株単位で購入可能とします。



▼リーダーボード

パブリックリーダーボード(Public LB)では、2021年2月1日(月)〜2021年2月5 日(金)の1週間(1ラウンド)について、収益をスコアとしてランキングします。 
プライベートリーダーボード(Private LB)では、前述のとおり、2021年5月10日(月)〜2021年6月4 日(金)の4週間(4ラウンド)における、総合的な収益をスコアとしてランキングします。なお、Private LBにおける推論時間の上限は、各ラウンドごとに設定されますので、パブリックリーダーボードでの推論時間の出力値がそのまま参考値として利用できます。これらを踏まえ、下記の図と表のとおり、Public LB及びPrivate LBの仕様をまとめました。



項目 Public LB Private LB 
用途 モデルが正常に投稿できることを確認するための環境 本コンペティションの最終的なランキングを表示 
予測対象の期間 2021年2月1日(月)〜2021年2月5 日(金) の1週間(1ラウンド)2021年5月10日(月)〜2021年6月4 日(金)までの4週間、4ラウンド 
予測対象の条件 予測対象タブに記載の通り.同左 
予測内容 予測対象期間の週初営業日に購入し、当該期間の週末営業日に売却した際にできる限り利益を得られるポートフォリオ 同左


▼J-Quants API

J-Quantsプロジェクトでは、個人投資家の皆様によるデータ利活用の可能性を検証するため、銘柄情報・株価情報・ファンダメンタル情報・日経電子版見出しテキストデータ・適時開示データ等を配信するAPIを提供します。本APIの仕様についてはJ-Quants APIドキュメントのWebページをご参照ください。

データの更新頻度は、日経電子版見出し・メタデータ及び適時開示資料のメタデータについては月次、それ以外については週次を予定しております。APIの詳細については下記ドキュメントをご参照ください。 

J-Quants APIドキュメント 
https://jpx-jquants.com/apidoc.html


▼表彰

本コンペティションでは、幅広い層の方に取り組んでいただくことを目的として、スコアによる表彰対象を上位10名としました。奮ってご参加ください。

また、本コンペティションでは、フォーラムにおける参加者間の質疑応答や、Web記事等による知見の共有を歓迎します。秀逸なフォーラム投稿やWeb記事等については、「フォーラム活動賞」や「Web記事賞」として、別途表彰します。なお、「フォーラム活動賞」や「Web記事賞」については、「ファンダメンタルズ分析チャレンジ」と共通して表彰します。

また、「フォーラム活動賞」と「Web記事賞」は、モデルを提出していない方でも表彰対象です。

(スコアによる表彰)

     順位 賞金・商品
     1位 30万円
     2位 20万円
     3位 10万円
     4~10位 Amazonギフト券2万円

(フォーラム活動賞・Web記事賞)

     表彰名 表彰対象  人数  賞金・商品
     フォーラム活動賞 フォーラムにて他参加者の疑問の解決やチュートリアルの改善等に寄与した個人  3名程度  3万円 
     Web記事賞 他の参加者への教育効果が特に見込めるコンテンツ*をWeb上で公開した個人  3名程度  3万円 
    *主にblog記事を想定していますが、これに限らず、幅広いコンテンツを想定しています。 


▼注意事項

・本コンペティションはランタイム環境を利用したモデル提出型コンペです。提出するモデルを"zip化"した上でご提出ください。また、モデルをご提出いただいた参加者の方は、モデル提出締切日までに投稿済みファイルのページにて、最終評価に用いる投稿ファイルを選択していただく必要がございます。
・提出するモデルの制限やルールについては、「ルール」をご参照ください。
・ポートフォリオ等の詳細については「予測対象」をご参照ください。
・ランタイム環境へのモデル提出の詳細については、「ランタイム環境」をご参照ください。


▼投稿モデル等に係る補足事項

・本コンペティションで投稿いただいたモデルは、主催者側では、表彰対象者の決定のみに利用され、商用には一切利用されません。また、全てのモデルを閲覧可能なのはSIGNATEのみであり、日本取引所グループを含むその他関係者が閲覧可能なモデルは上位入賞者のみに限られます。 

・本コンペティションの上位入賞者の最終審査用提出物(モデル、ソースコード等)は、オープンソースライセンスを付与のうえ、GitHub等にて公開いただきます。それ以外のモデルやソースコードについては、必ずしも公開いただく必要はありません。


▼チュートリアル

データセットの詳細、および分析から投稿までの流れは、別途こちらのチュートリアルをご参照ください。 

(参考)株式分析チュートリアル


チュートリアル サンプルイメージ(一部抜粋)


▼オンラインイベント公開資料


評価関数

本コンペティションでは、モデルで予測したポートフォリオで得られる利益の総合計をもとに評価します。従って、提出モデルでは、利益の総合計がより高くなるポートフォリオを予測いただきます。利益の総合計は、以下の算出式を用いて計算します。   

利益の総合計 = Σ [r=1, n] ラウンドrの収益 (Public LB: n=1, Private LB: n=4) 

ラウンドrの収益 = ラウンドrの保持現金 + ラウンドrの合計評価額 - 100万円   

ラウンドrの保持現金 = ラウンドrの最初営業日において株式の購入に利用せずに残った現金   

ラウンドrの合計評価額 = ラウンドrの最終営業日の終値 x 保持する株数


パブリックリーダーボードでの評価の概要


プライベートリーダーボードでの評価の概要



最終順位の決定

1.コンペ最終日までの評価(暫定評価)は2021年2月1日(月)に始値で購入し、2021年2月5 日(金)の終値で売却するとした際に、できる限り利益を得ることができるポートフォリオを予測します。また、コンペ終了後の評価(最終評価)は下記期間における4ラウンドの利益を合計し、利益の高い順に順位付けされます。

・モデルより出力されたポートフォリオについて、5月10日(月)の始値で購入し、5月14日(金)の終値で売却とした際の利益(ラウンド1)

・モデルより出力されたポートフォリオについて、5月17日(月)の始値で購入し、5月21日(金)の終値で 売却とした際の利益(ラウンド2) 

・モデルより出力されたポートフォリオについて、5月24日(月)の始値で購入し、5月28日(金)の終値で 売却とした際の利益(ラウンド3) 

・モデルより出力されたポートフォリオについて、5月31日(月)の始値で購入し、6月4日(金)の終値で 売却とした際の利益(ラウンド4) 

なお、暫定評価については、学習方法によってモデルの学習時に予測対象となる未来のデータも含めて学習することがあるため、リークしている可能性があることについてご留意ください。リーダーボードはコンペ終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。


2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

3.コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順*1、乱数シード*2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

4.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

5.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。

心構え

・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨むこと。


システムの利用
・利用アカウントは1人につき1つまで。ただし、アカウントが1つであればチームでの参加も可能(代表者を選定の上、代表者アカウントで分析結果を投稿)。


情報の取り扱い
情報公開ポリシーに従い、データやソースコードを取り扱うこと。


データの利用

・提供するデータ以外の外部データ(為替や金利データ等)や、提供するデータの期間外のヒストリカルデータを用いてモデルを学習することは禁止。(例として、2015年以前の株価等)

・ただし、言語資源の外部データについては、第三者の権利を侵害しない、無償で誰でも利用可能なオープンなものに限り利用可能。(例として、形態素解析辞書や、BERTモデル)


J-Quants APIへの登録
・本コンペティション参加登録後、直ちに、J-Quants APIにてアカウントを作成すること。
https://jpx-jquants.com/signUp


実装方法

・投稿ファイルの詳細については、「提出ファイル」をご参照ください。 

・出力するポートフォリオは、「予測対象」の記載を満たすようにしてください。

・モデルの学習に利用するツールは、pythonに限定します。

・Random Forest等の乱数を利用した手法を用いる場合は、乱数シードを固定してください。

・提出モデルが汎用的なモデリングによって生成されていること。

 提案した方法が一般的な環境において追加費用負担を伴わず、再現及び継続使用可能であることを保証する必要があります。

 基準について不安がある場合は、事務局までお問い合わせください。

・提出モデルが汎用的であること  

 本コンペティションの提出モデルに求められる汎用性とは、主に次の3要素から構成されると考えています。  

 要素1: 入力が一定であれば、出力が一意に定まること  

 要素2: 入力の変化に応じて、出力が変化すること  

  →常に固定のポートフォリオを出力するモデルは失格  

 要素3: データ分析の結果に依らず、根拠の無い、決め打ちの内容が含まれていないこと  

  →常にラベルA(例: 時価総額)の上位N銘柄をM円まで購入するポートフォリオを出力するモデルは失格  

  →ただし、それらの根拠が十分に説明可能であるならば失格にはならない  

 基準について不安がある場合は、事務局までお問い合わせください。

予測対象

本コンペティションでは、現金100万円を原資として、1週間の収益(キャピタルゲイン)がより高くなるポートフォリオの予測に取り組んでいただきます。資産運用分野におけるポートフォリオとは「様々な資産ないし、銘柄の組み合わせのこと」を指し、本コンペティションでは「各ラウンドの初日に購入する銘柄及び購入金額のテーブルデータ」を指します。


以下では、本コンペティションにおける予測対象であるポートフォリオの条件等について説明します。


モデルの予測フォーマット

提出モデルに出力いただくポートフォリオ(csv形式)は、date(取引を実施する日付(YYYY-MM-DD)、Local Code(購入する銘柄コード)、Budget(購入する金額)の3列で構成されます。


この表では、2021年2月1日に、i行の銘柄コードの銘柄をN_i株(N_i=i行の銘柄コードの株をBudgetの金額まで購入する時、最大となる自然数)購入することを意味します。 ポートフォリオの出力形式の詳細については「データ」タブ最下部に記載の「モデル出力形式サンプルの指定」をご参照ください。 なお、本コンペティションにおいて、提出モデルは汎用的であることが求められます。詳細は、ルールページに記載されている「提出モデルに求められる汎用性の箇所」をご参照ください。


ポートフォリオに組入れできる銘柄の条件

・本コンペティションで、ポートフォリオに組み入れることができる銘柄は、2020年12月時点で時価総額200億円以上の、東証上場企業(普通株式のみ。ETFやREIT等は除きます。)です。

 - なお、この条件を満たす銘柄は1,779銘柄あります。具体的にどの銘柄が該当するのかは、「データ」タブの「stock_list (stock_list.csv.gz)」のデータにおいて、「universe_comp2」列がTrueとなっている銘柄となります。 

 - また、チュートリアルの「ポートフォリオを構成する銘柄の条件」にも本条件について記載しておりますので、こちらも併せてご参照ください。 


ポートフォリオの条件

・提出モデルが出力するポートフォリオは、次の2要件を満たす必要があります。

  -(要件1)原資100万円のうち、50万円以上株の購入に充てられていること 

  -(要件2)購入銘柄数が5銘柄以上であること 

なお、いずれかのラウンドで出力ポートフォリオがこれらの要件のいずれかを満たさない場合、本コンペティション全体で失格となりますので、ご留意ください。 


各条件を踏まえた特記事項・注意点

以下では、各条件を踏まえた特記事項及び注意点につきまして、説明します。 

・本コンペティションでは、各銘柄は1株単位で購入可能とします。

   - 東京証券取引所をはじめとする全国の証券取引所で実際に売買する際は、売買単位は100株単位に統一されていますが、本コンペティションでは、ポートフォリオの組成を可能な限り幅広く行っていたくことを考慮して、売買単位を1株単位としています。 

ポートフォリオに組入れできる銘柄の条件に合致しない銘柄がモデルの予測に含まれている場合は、評価の際に該当のレコードは評価対象外として無視されます。(エラーとはなりません。) 

・モデルの予測においてdate列が週初営業日以外の日付のレコードは、評価対象外として無視されます。 

budget列が1未満のレコードは評価対象外として無視されます。 

・週初営業日に値段が付かなかった銘柄*のレコードは評価対象外として無視されます。

   *なお、週末営業日に値段が付かなかった場合には、その日より前の日で終値が存在する日の終値を用います。 

・購入金額が50万円に到達していなかった場合は、選択された銘柄を入力順(テーブルデータの並び順)に1株ずつ50万円以上になるまで買い足されます。(評価時の具体的な処理はバックテスト関数の挙動をご参照ください。) 購入金額が100万円を超える場合は、100万円以内の範囲で購入可能な株数に調整されます。(具体的な処理はバックテスト関数の挙動をご参照ください。) 

最終的に購入された銘柄数が5銘柄未満の場合若しくは購入した金額が50万円未満の場合は、エラーとなり失格となります。 


バックテスト関数(backtest.py)の挙動

本コンペティションにおける評価では、データページ及びチュートリアルリポジトリにも配置してある独自のバックテストライブラリ (backtest.py)を用います。モデルにより予測されたポートフォリオについて、具体的な処理の概要は以下のとおりです。なお、詳細な挙動につきましては、チュートリアル及び実際のコードをご参照ください。

【前提条件チェック等】

1. 予測されたポートフォリオのフォーマットについて以下のチェックを行う(*)

 - date列(ヘッダー)が存在するか

    - Local Code列(ヘッダー)が存在するか 

    - budget列(ヘッダー)が存在するか

    - データにNaNが含まれていないか

2. 予測されたポートフォリオのLocal Code列について、「ポートフォリオに組入れできる条件」に合致するレコードに絞り込む。

3. 予測されたポートフォリオのdate列について、月曜日のみのレコードに絞り込む。 

4. 予測されたポートフォリオのbudget列について、1円以上のレコードに絞り込む。 

【購入処理】 

5. 2〜4で絞り込んだポートフォリオについて、5銘柄以上選択されているかチェックを行う(*)。 

6. ポートフォリオのLocal Code列の上から順に、原資金100万円を上限として、budget列で指定された金額で購入処理を行う。(なお、各ラウンドの週初営業日の始値で購入するため、指定された金額と実際の購入金額は異なることが想定され、予算と実際の購入金額の差額は残額となります。) 

7. 予測されたポートフォリオの全てのレコードについて6の処理を行い、実際の購入金額が50万円未満の場合は、ポートフォリオのLocal Code列の上から順に、更に1株ずつ50万円以上となるまで購入処理を繰り返す。 

8. 購入処理後に残った原資金は現金保有とする。 

9. 6〜8 までの購入処理を終えたポートフォリオについて、実際に購入した銘柄数が5銘柄以上かつ実際の購入金額が50万円以上かチェックを行う(*)。 

【売却処理・評価】

10. 購入した各銘柄について、各ラウンドの週末営業日の終値で売却したこととし、週初営業日からの始値からの運用実績(保有している株式の合計評価額 + 保持現金 - 購入原資金)を算出する。 

なお、(*)と記されているチェック項目については、チェックでエラーとなった場合は、評価算出されず失格となりますので、ご注意ください。

以下に、Public期間について具体例を用いて処理について例示しております。


・上表の左側がモデルが予測したポートフォリオの出力例です。上表の右側は説明のために付け加えたものになります。 

・前提条件チェック等の1〜4に従い、条件の確認と銘柄等の絞り込みを行います。 

・購入処理の5で5銘柄以上含まれていることを確認し、6の処理により購入を行います。 

・ポートフォリオの全てのレコード列を処理した結果、実際の購入金額の総額は474,860円/5銘柄だった(9983の始値が指定してbudgetを超過し購入できていない)ため、7の処理により再度ポートフォリオの上から1株ずつ追加で購入する処理が行われます。 

・具体的には7203を1株購入→50万円check→未達→9984を1株購入→50万円check→未達→9983を1株購入→50万円基準達成(実際の購入金額588,960円/6銘柄、保持現金411,040円) 

・6〜8までの処理を終え、9で実際に購入した銘柄数が5銘柄以上及び実際の購入金額が50万円以上かをチェックし、購入処理は完了します。 

・最後に購入した銘柄について、そのラウンドの週末営業日の終値で評価し、保持現金と合わせてそのラウンドの運用実績とします。

モデル提出の概要

・本コンペティションはランタイム環境を利用したモデル提出型コンペです。提出するモデルを"zip化"した上でご提出ください。また、モデルをご提出いただいた参加者の方は、モデル提出締切日までに投稿済みファイルのページにて、最終評価に用いる投稿ファイルを選択していただく必要がございます。

・モデル提出締切後はモデルの提出ができなくなりますので、モデル提出締切間近の際は十分にご注意ください。


モデル提出方法
モデルのzipファイルを提出すると、自動で予測結果ファイルの作成・推論速度と認識精度の評価が行われます。

機能の説明や投稿方法については、以下を参照ください。
 ・機能の説明
 ・投稿方法
※モデルの実行を伴うため、評価結果がリーダーボードに反映されるまで時間がかかります。

※モデル自体の制約については「ルール」をご参照ください。

※ランタイム環境への投稿は3/26(金)よりオープンの予定です。


モデル提出の制約

・モデル提出締切後はモデルの提出ができなくなりますので、モデル提出締切間近の際は十分にご注意ください。

・モデルのサイズの上限は5GBです。5GBを超えてしまう場合は、ファイルを5GB以下に分割してアップロードした上で、その旨ご連絡ください。(https://signate.jp/inquiry

・モデルのサイズが大きい場合は提出に時間がかかりますので、余裕を持ったご対応をお勧めします。

・アップロード時間が10分を超えるとタイムアウトのメッセージが表示されることがあります。その場合でも基本的には正しく受領できておりますが、念の為確認いたしますのでご連絡ください。(https://signate.jp/inquiry

・投稿回数は1日5回までに制限されています。あらかじめご注意ください。


ランタイム環境の制約

・ランタイム環境でのモデルの推論時間は、(predict関数の実行時間=ポートフォリオのcsvファイルの出力までの時間)は、ラウンドごとに、3時間の制限が設けられています。 

・ランタイム環境から外部インターネットへの通信は不可となっています。


ランタイム環境で利用可能なパッケージ

・下記URLの [In Installer] にチェックが入っているものが、ランタイム環境で既にインストールされています(ただしバージョンは異なります)。  

https://docs.anaconda.com/anaconda/packages/py3.7_linux-64/ 

・これらに加えて、MeCabとmecab-ipadic-NEologd(v0.0.7)がインストールされています。

・これら以外のパッケージの利用については、下記チュートリアルをご参照ください。  

https://japanexchangegroup.github.io/J-Quants-Tutorial/#_%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E6%8F%90%E5%87%BA


ランタイム環境で利用可能なデータ

・ランタイム環境に提出したモデルは、各銘柄の株価の最高値及び最安値を予測する際、評価対象となる決算短信の開示日以前のデータ(株価、ファンダメンタル情報)を利用することができます。 

・ただし、適時開示データのPDFファイルやXBRLファイルについては、ランタイム環境では利用できません(学習時にクライアント環境で利用することは可能です。)。ご注意ください。

・ランタイム環境に格納されているデータの概要は次の表のとおりです。 

データ名 ファイル名 期間 
銘柄情報 stock_list.csv Public LB: 2021年1月末時点
Private LB: 2021年3月末時点
株価情報 stock_price.csv 2016年1月1日〜各ラウンド初日の前日 
ファンダメンタル情報 stock_fin.csv 2016年1月1日〜各ラウンド初日の前日 
問題1の目的変数データ stock_labels.csv 2016年1月1日〜各ラウンド初日の前日 
財務諸表+株価情報データ stock_fin_price.csv 2016年1月1日〜各ラウンド初日の前日 
日経電子版見出し・メタデータ nikkei_article.csv 2020年1月1日〜各ラウンド初日の前日 
適時開示資料のメタデータ tdnet.csv 2020年1月1日〜各ラウンド初日の前日 
記事種別 article.csv 2020年1月1日〜各ラウンド初日の前日 
業界コード industry.csv 固定 
業界コード(PDコード) industry2.csv 固定 
地域 region.csv 固定 
記事内容のテーマコード theme.csv 固定 
公開項目コード  disclosureItem.csv  固定 
評価対象週における初日の日付を指定するファイル  purchase_date.csv  評価対象週における初日の日付 


実行環境

・実行環境については以下をご参照ください。

    GitHub: https://github.com/signatelab/runtime-jpx 

    Docker Hub: https://hub.docker.com/r/signate/runtime-jpx 

・vCPU: 3 ・メモリ: 16GB(※ただし、実際の推論にお使いいただけるメモリは12GB程度です。)

・WORKDIR: src 

・外部ネットワーク: アクセス不可

※メモリについては、提出モデルの実行状況を踏まえ、随時増強等を検討いたします。


投稿結果の確認について

・投稿後、提出完了の通知をメールで確認いただけます。なお、投稿後にエラーが発生した場合には、エラーメッセージが出力されますが、より詳細なエラー内容はメールの方をご確認いただけますと幸いです。


本ページでは、本コンペティションに関して提供する情報やデータ及びそれらを用いて得られた知見や生成物について、取り扱いや情報公開に係る概要を説明いたします。取り扱いや情報公開に係る詳細は、コンペティション参加規約及びJ-Quantsサービス利用規約をご確認ください。


▼本コンペティションの方針

本コンペティションに関して当社から提供するデータや、それらを改変して作成したデータは、本コンペティションへの参加に向けた情報解析等の目的に限り利用することができます。これらのデータは、本コンペティション終了日(2021年6月30日)までに、参加者自身で削除いただきます。

本コンペティションへの参加を通じて得られたプログラム、学習済みパラメータ、知見等をまとめた資料は、それぞれ作成した本人に知的財産権が帰属します。そのため、原則として、参加者はこれらを自由に公開することができます。

また、本コンペティションでは、フォーラムにおける参加者間の質疑応答や、Web記事等による知見の共有を歓迎します。秀逸なフォーラム投稿やWeb記事等については、「フォーラム活動賞」や「Web記事賞」として別途表彰いたします。


▼本コンペティションにおける知的財産権等の概要

項目名説明 例
 権利帰属先
本データ当社が利用者に貸与する、整形した状態のデータの一式銘柄情報、株価情報、決算情報、配当情報原権利者 
派生データ本データを加工、分析、編集、統合等することによって新たに生じたデータ株価の移動平均、特定企業の株価・決算・配当をまとめたデータ原権利者 
プログラム本コンペティションへの参加を通じて得られたプログラム等ソースコード、コンパイル済みのプログラム、機械学習モデル(学習済みパラメータを除く)
参加者*1
学習済みパラメータ
本データ又は派生データを用いて導出した、プログラム中のパラメータとして使用されるデータ
機械学習モデル中に含まれるパラメータの一式
参加者*1

*1 本データ及び派生データの知的財産権の範囲を除きます。


▼Q&A

1. データ用途

Q.1-1 本コンペティションで提出した機械学習モデル等を、自分の投資活動に活かすために利用することはできますか?

A.1-1 機械学習モデルをはじめとするプログラムの知的財産権は参加者自身に帰属するため、本コンペティション終了後も、自身の環境等で使用することができます。ただし、本コンペティション終了後、本データや派生データは削除いただく必要がございますので、その点をご留意ください。 


Q.1-2 本データや派生データを学術研究に利用することはできますか?

A.1-2 本データや派生データの用途は、本コンペティションの参加に関する情報解析等に限られます。そのため、学術研究への利用は禁止します。 また、株価情報等の学術研究への利用に当たっては、下記Webページを併せてご参考ください。 

JPXデータクラウド

http://db-ec.jpx.co.jp/


Q.1-3 本コンペティションで得た知見をまとめたWeb上の記事を拝見しました。この記事を引用する形でこの知見を自分の学術研究に利用したいと考えていますが、これに当たって、何かしらの制限はありますか?

A.1-3 当該Web記事の著者等による特段の制限等が無い限りにおいて、特段の制限はございません。 


Q.1-4 チュートリアルのWebページに記載されている内容をWeb記事に引用したり、授業等で利用したりすることはできますか?

A.1-4 チュートリアルのWebページのチュートリアル、ハンズオンのソースコードは、CC BY-NC-ND 4.0に従うライセンスで公開しており、教育などの非商用の目的での本チュートリアルの使用や再配布は自由に可能です。なお、商用目的で全体、一部を転載する行為は禁止しておりますので、その点をご留意ください


2. プログラム等のWeb公開

Q.2-1 Web記事やプログラムを公開するために必要な手続きはありますか?

A.2-1 本コンペティションのフォーラム以外で公開する場合は、本コンペティションのフォーラムを通じて、公開する場所(リンク等を含みます。)を明記のうえ参加者全員への共有を図ってください。また、資料中には、本コンペティションの参加に関連して作成したものであることを明記してください。  


Q.2-2 プログラムや学習済みパラメータを、学術研究の目的で公開することはできますか? また、これらを有償の書籍等で掲載することはできますか?

A.2-2 プログラムや学習済みパラメータの公開は、本コンペティションの参加に関する情報解析等の用途に限られ、商用や学術研究の目的で公開することはできません。 


Q.2-3 Web記事を執筆するに当たって、本データや派生データの一部を引用することはできますか?

A.2-3 一般的な引用の要件を満たす限りにおいて、本データや派生データを引用することができます。なお、本データや派生データの全てを掲載する場合は引用に該当しないため、これについてはお控えください。


Q.2-4 過去の株価情報から算出した移動平均の一式のCSVファイルに出力し、それをパラメータとして用いた数理モデルを作成しました。このようなCSVファイルは、学習済みパラメータとして、本コンペティション終了後にGitHub等で公開してもいいでしょうか?

A.2-4 本データを用いて作成したデータのうち、本コンペティションの目的以外の用途での利用が容易に想定されるデータは、機械学習モデルのパラメータとして用いたとしても、学習済みパラメータではなく派生データとして捉えられます。そのため、当該CSVファイルは派生データに該当し、第三者が閲覧可能な環境への公開は禁止します。このようなCSVファイルをパラメータとして用いる機械学習モデルをGitHub等で公開する場合は、当該CSVファイルを削除(あるいは、疑似データに差し替え)する必要があります。


Q.2-5 本コンペティションで作成した機械学習モデルに含まれるパラメータの知的財産権が、派生データとして原権利者に帰属するのか、学習済みパラメータとして自分に帰属するのか、判断に悩んでいます。どのように判断すればいいでしょうか?

A.2-5 当該パラメータが派生データと学習済みパラメータのどちらに分類されるかの判断に当たっては、その用途やファイル形式等を総合的に考慮したうえで判断することになります。一つの基準として、本コンペティションの目的以外の用途での利用が容易に想定されるデータは派生データに該当する可能性が高いと考えています。個別の事案については、別途事務局へご相談ください。


3. 入賞候補者

Q.3-1 入賞候補者が最終審査用提出に付与するオープンソースライセンスに制約はありますか?

A.3-1 Apache License 2.0(https://www.apache.org/licenses/LICENSE-2.0)または MIT License(https://opensource.org/licenses/mit-license.php)を想定しています。


Q.3-2 入賞候補者になった場合、最終審査用提出物の知的財産権の帰属先はどうなりますか?

A.3-2 他の参加者の成果物と同様、本データ及び派生データの知的財産権の範囲を除き、参加者自身に帰属します。


2021年3月19日制定

Disclosure policy

As a general rule, in accordance with Article 4, Paragraph 1 of the terms of participation, diclosing any contents such as insights and deliverables transmitted through the information or data provided by our company in relation to this competition is not permitted, however, only after the completion of this competition and for non-commercial purposes, it will be possible to disclose the contents within the score of the table below
Model *1
Public
Analysis results *2
Public
Public : Posting to social media sites, blogs and source repositories, and citing to papers
Restricted : Using in a limited range from research, education to seminars, where many unspecified people cannot access
*1 Execution unit source code and learned models
*2 The insights obtained using the information and data provided, or the solutions including scripts and processed data such as summary statistics

※Notes

準備中

▼本コンペティションにおける追加事項(以下、「本追加事項」といいます。)

本コンペティションの主催者(ホスト)である株式会社日本取引所グループは、データサイエンスに興味のある個人をターゲットに、IT及びデータ分析を利用した取引を促進する目的で、株式会社日本経済新聞社及び株式会社QUICK(以下、総称して「データ提供事業者」といます。)からデータセットの一部提供をうけ、本コンペティションを開催いたします。当該データセットの性質に鑑み、データ提供事業者がこれを保有することとなる参加者を把握することを目的として、株式会社SIGNATEは、データ提供事業者へ参加者のメールアドレス、本コンペティションへの参加申込時にご入力いただく参加者の氏名、及びアンケート内容をパスワード付きのファイルを電子メール等で送信する等の方法により、第三者提供いたします。参加者は、株式会社SIGNATEがデータ提供事業者に対しこれらの情報を第三者提供することについて理解し、同意の上、本コンペティションに参加するものとします。

本コンペティションに参加するためには、株式会社日本取引所グループのJ-Quantsサービス利用規約(以下、「J-Quants規約」といいます。)にご同意いただき、かつ、本コンペティション終了後に最終審査用提出物を第三者が閲覧可能な環境(GitHub等)にご自身で公開することに同意する必要があります。本追加事項又は下記SIGNATEコンペティション参加規約(以下、「SIGNATE参加規約」といいます。)の規定がJ-Quants規約の規定と抵触する場合には、本追加事項に別段の定めがある場合を除き、J-Quants規約の規定が優先して適用されるものとします。なお、参加者がJ-Quants規約に違反したことに起因して本コンペティションへ参加できなかった場合その他参加者に不利益が生じた場合であっても、株式会社SIGNATEは何ら責任を負いません。

また、参加者が本コンペティションにおいて入賞者となる資格を得るためには、最終審査用提出物にオープンソースライセンスを付与いただく必要がございます。なお、当該オープンソースライセンスを付与いただけない場合、又は当該公開にご同意いただけない場合は、本コンペティションへの参加は可能ですが、入賞者となる資格を得ることはできません。 また、J-Quants規約の定めにかかわらず、参加者が、自身で開発したアルゴリズム及びその他本コンペティションへの参加に関連して作成した資料等(最終提出物及び最終審査用提出物を含みます。)をSIGNATE参加規約第4条第3項に従い公開することについては、その目的が商用又は学術研究である場合を除き、何ら制限しません。


SIGNATEコンペティション参加規約

本コンペティションに参加するためには、 SIGNATE.JPサイト利用規約 (以下「利用規約」といいます。)に加え、本規約にもご同意いただく必要があります。 本規約を熟読し、ご同意のうえ、本コンペティションにご参加ください。本規約、本コンペティションへの参加時に「追加事項」として表示されご同意いただいた事項、利用規約及びその他のご同意いただいた事項(以下総称して「本規約等」といいます。)は、すべて参加者を拘束するものとします。

第1条(定義)

1.本規約において次の各用語の定義は、それぞれ次に定めるとおりとします。

(1)「本サイト」とは、本コンペティションを掲載するウェブサイト「SIGNATE(https://signate.jp)」をいいます。

(2)「本コンペティション」とは、ホストが開催する本サイト上でのAI開発又はデータ分析の競技会をいいます。

(3)「ホスト」とは、本コンペティションの主催者をいいます。 ホストは、株式会社SIGNATE(以下、「当社」といいます。)又は当社の顧客企業・提携企業・学校・団体等(以下、「顧客企業等」といいます。)です。

(4)「参加者」とは、会員(利用規約に定義する「会員」をいい、以下同様とします。)のうち、本コンペティションに参加する方をいいます。

(5)「提出物」とは、本コンペティションにおいて提出される分析・予測結果及び予測モデル並びにレポート等の総称をいいます。

(6)「最終提出物」とは、本コンペティションの終了時点までに参加者が提出した提出物の中から本サイトの所定のページで最終提出物として指定した提出物をいいます。

(7)「入賞候補者」とは、当社より入賞候補の通知を受けた参加者をいいます。

(8)「最終審査用提出物」とは、当社の指示に従い、入賞候補者が提出する提出物並びにその他当社が指定するものをいいます。

(9)「最終審査」とは、入賞候補者の最終提出物及び最終審査用提出物に対して当社が行う、再現性検証を含む検収及び審査をいいます。

(10)「入賞者」とは、入賞候補者のうち当社より入賞の通知を受けた者をいいます。

第2条(本コンペティション)

1.本コンペティションに参加することを希望する会員は、本規約等に同意の上、本コンペティションにおいて定められている参加条件を満たしている必要があります。 会員でない方は、本コンペティションに参加することはできません。

2.参加者は、当社がご案内する方法に従い、本コンペティションに参加するものとし、本コンペティションにおいて定められたルールを遵守する義務があります。

3.参加者は、本コンペティションの開催期間中に本コンペティションの問題に対する提出物を提出することができ、ホストに対して問題解決方法の提案を本コンペティションの終了時点まで当社所定の回数行うことができます。

4.参加者は、本コンペティションで指定される形式に従い、本コンペティションで指定される終了時点までに提出した提出物の中から本サイトの所定のページにおいて最終提出物を指定できるものとします。

5.提出された最終提出物は、本コンペティションで定められた評価方法で評価され、その評価をもって最終順位が決定されるものとします。

6.参加者は、提出物が数量的に評価できるものについては、原則、本サイト上で自己及び他の参加者の評価結果を確認できるものとします。

7.参加者は、自身の提出物について、その適法性を含め、一切の責任を負うものとします。

8.参加者は、本コンペティションに直接関係のない提出物を提出しないものとします。

9.参加者は、特段の定めがない限り、本コンペティションに関わる内容について、本コンペティションの開催期間中にホストに対して直接連絡、相談、依頼、勧誘等の活動を行ってはいけません。

10.参加者は、本コンペティションに関して不明点や疑問点がある場合、必ず本サイト上に掲載する当社所定の手続きにより、当社又は当社が指定する第三者まで連絡をすることとします。

11.ホストは、本コンペティションにおける参加者のいかなる行為に対しても、名目の如何を問わず一切の報酬その他の金員を支払う義務を有しないものとします。また、当社は、本コンペティションにおける参加者の行為に対して、次条に定める懸賞を除き、一切の報酬その他の金員を支払う義務を有しないものとします。

第3条(懸賞及び権利の帰属)

1.参加者は、懸賞が付されている本コンペティションにおいて懸賞を獲得する権利を得るためには、特段の定めがない限り、以下の各号に定める条件を満たす必要があります。

(1)入賞者となること

(2)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及び予測モデル並びにレポート等、アルゴリズム・ソースコード・再現法等の説明書等(但し、これらに限りません。)、及び提出物に関する著作権(著作権法第27条及び第28条に定める権利を含み、以下同様とします。)、特許を受ける権利、ノウハウ等すべての譲渡可能な権利(以下総称して「本件権利」といいます。)について、ホストその他の本コンペティションにおける権利譲渡対象者へ譲渡するために必要なすべての権限を有していることを保証したうえで、当該譲渡に同意すること

(3)最終提出物及び最終審査用提出物に関する本件権利について、権利譲渡対象者が何ら制限なく無償で自らの事業及びその他目的に利用できることを保証し、権利譲渡対象者が本件権利を専有することに合意すること

(4)権利譲渡対象者に対し、本件権利に関する著作者人格権を行使しないことに同意すること

(5)前3号の保証及び同意その他の合理的な条項を含む、本件権利の譲渡のための契約を権利譲渡対象者と締結すること

(6)当社による参加者の本人確認が完了すること

(7)本規約等の規定に違反していないこと

2.入賞候補者は、当社より入賞候補の通知を受け取った後、当社の指示に従い、最終審査用提出物を指定期日までに当社に提出し、また、最終提出物及び最終審査用提出物に関する確認・回答事項を指定期日までに当社へ連絡するものとします。当社は、かかる確認・回答事項を前提に、最終審査を行います。指定期日までに当社が満足する確認・回答事項が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあり、入賞候補者はこれについて異議を述べないものとします。

3.入賞候補者は、最終審査の過程で、最終提出物又は最終審査用提出物に修正又は変更の必要があると当社が判断、もしくは追加で確認事項が発生した場合、当社の指示に従い、修正又は変更の必要な項目及び確認事項について、指定期日までに対処し又は回答するものとします。指定期日までに当社が満足する対処・回答が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあり、入賞候補者はこれについて異議を述べないものとします。

4.当社は、最終審査を経て入賞者を決定し、入賞者に対しその旨の通知をするものとします。

第4条(秘密保持)

1.参加者は、本コンペティションに関して当社から受領する情報、データ及びそれらを用いて得られた知見や生成物等(参加者の提出物を含み、以下「当社提供情報」といいます。)を秘密情報として取り扱い、第三者には開示しないものとし、かつ、本コンペティション及び別途当社が指定した目的以外に使用することができないものとします。 但し、以下の各号に定める情報は、秘密情報には含まれないものとします。

(1)受領の時点において公知となっていた情報

(2)受領の時点において、既に参加者が所有していた情報(当該参加者が合理的な手段で証明することができる場合に限ります。)

(3)受領の後に、参加者の責めによらず公知となった情報

(4)受領したいかなる情報にもよらずに独自に開発した情報

(5)何ら秘密保持義務を負担することなく開示権限ある第三者から合法的に受領した情報(当該参加者が合理的な手段でこれを証明することができる場合に限ります。)

2.入賞者は、自己の最終提出物及び最終審査用提出物について、入賞の通知を受けた後も引き続き当社提供情報と同様の取扱いをするものとします。また、前項の定めにかかわらず、入賞者が決定した後は、当該入賞者の最終提出物及び最終審査用提出物を除く参加者の提出物は、当社提供情報に含まれないものとします。

3.本コンペティション終了後に自身で開発したアルゴリズム及びその他本コンペティションへの参加に関連して作成した資料等(最終提出物及び最終審査用提出物を含みます。)について、本サイト上で公開される本コンペティションの情報公開ポリシー(以下、「情報公開ポリシー」といいます。)の記載に従い、これを公開することができます。なお、情報公開ポリシーにおいて公開不可の記載がある場合には公開することはできず、また、公開にあたっては以下の事項を遵守するものとします。

(1)本コンペティションの参加に関連して作成したものであることを明記すること

(2) 公開する資料中にデータセットの一部が含まれる場合のクレジット表記については、情報公開ポリシーの記載に従うこと

(3)本コンペティションのフォーラム以外で公開する場合は、全ての参加者が閲覧できる場所(本コンペティションのフォーラム、その他当社が指定する場所を含みますが、これらに限りません。)に公開する場所(リンク等を含みます。)を明記すること

4.参加者は、本コンペティションの終了後、直ちに当社提供情報(但し、第3項に定めるものを除きます。)を消去又は当社に返還するものとします。

5.本コンペティションにおいて、別途秘密情報に関する取り決めがなされる場合は、当該取り決めの規定が本規約の規定に優先するものとします。

6.参加者が本条の規定に違反したことにより、第三者と、当社又はホストとの間で紛争が生じ、その他第三者が当社又はホストに対して何らかの請求を行った場合、当該参加者は当社及びホストが被る一切の損害、損失、費用(弁護士費用を含むがこれに限定されません。)、逸失利益、逸失収入などを補償するものとします。

7.本条の規定は、当社提供情報並びに入賞者の最終提出物及び最終審査用提出物に関し、本コンペティション終了後及び参加者が当社の提供するすべてのサービスについて退会手続きを完了した後5年間有効に存続します。

第5条(参加者の禁止行為)

1.当社は、本コンペティションにおいて、参加者に対し、次に掲げる行為を禁止します。

(1)クラッキングやチート行為、なりすまし等の不正行為

(2)データセットに含まれるデータファイルそのものの再配布

(3)当社が関与しない形で行う、自己の利益を図ることを目的とした他の参加者又はホスト(当社以外の者に限ります。)に対する直接連絡、相談、依頼、勧誘等の活動

(4)書面その他当社が指定する方法による事前の承諾を得ることなく行う、本コンペティションを利用した一切の営利活動(勧誘・スカウト行為、教育事業における第三者への利用等を含みますが、これらに限りません。)

(5)参加者としての地位又は参加者としての権利義務の移転、担保設定その他の処分(事前に当社の書面による同意がある場合を除きます。)

(6)第三者の知的財産権、その他一切の権利を侵害する行為

(7)その他、本規約等に違反する行為

2.参加者が前項に規定する禁止行為を行った、又は行う恐れがあると当社が認める場合、当社は、当該参加者に事前に通知することなく、当該参加者の本コンペティションにおける失格処分、当社が提供する全部又は一部のサービスの一時利用停止、退会処分、損害賠償請求その他当社が必要と判断した措置をとることがあります。

第6条(本規約の変更)

1.当社は、参加者の了承を得ることなく、本規約を随時変更、追加、削除することができます。

2021年3月19日