コンペ表彰式開催レポート_J-Quantsデータ分析コンペティション_日本取引所グループ

2021年7月19日、株式会社日本取引所グループ(以下:JPXと記載)主催「J-Quants(※) データ分析コンペティション」の表彰式が開催されました。本コンペティションは、異なるテーマを扱う2つのチャレンジから構成されています。1つ目が、与えられた銘柄情報や株価情報、ファンダメンタル情報等を駆使して株価の最高値および最安値の予測を行う「ファンダメンタルズ分析チャレンジ」。そして2つ目が、現金100万円を原資とし、銘柄情報・株価情報・ファンダメンタル情報・日経電子版見出しテキストデータ・適時開示データ等を利用して1週間の収益(キャピタルゲイン)がより高くなるポートフォリオの予測を行う「ニュース分析チャレンジ」です。 表彰式当日は、各チャレンジの成績上位入賞者と、参加者に有意義な知見を共有した方を対象とした「フォーラム活動賞」「ウェブ記事賞」入賞者の表彰が行われました。また、表彰後には、入賞者の中から代表者数名による解法プレゼンテーションも行われ、1000名近くが視聴する大規模なイベントとなりました。 表彰式は、本コンペティションの主催者であるJPXの高頭氏による進行でスタート。冒頭では、開会のご挨拶として株式会社日本取引所グループ代表執行役グループCOO兼株式会社東京証券取引所社長である山道氏のご挨拶ムービーが放映されました。 ※J-Quants:投資にまつわるデータ・環境を提供し、個人投資家の皆様によるデータ利活用の可能性を検証する、株式会社日本取引所グループによる期間限定の実証実験プロジェクト。


▼動画はコチラ▼


開会あいさつ

[059] Competition-Report-1

株式会社日本取引所グループ 代表執行役グループCOO 兼 株式会社東京証券取引所代表取締役社長 山道 裕己 氏 「本日はJ-Quantsデータ分析コンペティションの表彰式にご参加いただきありがとうございます。東京証券取引所では、個人投資家の皆様に向けて様々な金融教育の施策を行ってまいりましたが、今回のような株式投資とデータサイエンスを結びつけた教育コンテンツの提供は初めての試みとなっています。しかしながら、かつてないほど日本語で詳しく分析手法を記したチュートリアルや、提供するデータセットの整形を丁寧に行ったこともあり、予想を大きく上回る参加をいただくことができました。コンペ第1弾となるファンダメンタルズ分析には1,443名の参加、第2弾のニュース分析は問題の難易度が高かったにもかかわらず900名の参加をいただけたことをとても嬉しく思っております。本プロジェクトが日本の金融人材の拡大に少しでも貢献できれば幸いです。以上をもちまして表彰式の挨拶とさせていただきます。ありがとうございました。」 山道氏による開会のご挨拶に続き、JPXの高頭氏から改めてコンペティション概要の説明が行われました。各チャレンジの概要は以下の通りです。

ファンダメンタルズ分析チャレンジ

銘柄情報や株価情報、ファンダメンタル情報等を駆使して、各東証上場企業が決算短信を発表した後の20営業日の間における、当該企業の株価の最高値および最安値の予測を行います。本コンペティションの学習データは、2016年1月1日以降の銘柄情報、株価情報、ファンダメンタル情報等となっています。

ニュース分析チャレンジ

現金100万円を原資として、1週間の収益がより高くなるポートフォリオの予測を行います。なお、本コンペティションにおける収益とは、ある1週間のうち、初日の始値で購入し、最終日の終値で売却する時の収支を指します。ポートフォリオの予測に当たっては、銘柄情報や株価情報、ファンダメンタル情報、日経電子版見出しテキストデータ、適時開示データ等の様々なデータが利用可能です。各銘柄は1株単位で購入可能です。 各チャレンジの概要説明を終えると、表彰式は入賞者の発表へと移っていきます。各チャレンジの上位10位までの入賞者、そして「フォーラム活動賞」「Web記事賞」各4名、計23名の方が表彰対象となりました。それぞれの入賞者は下記の通りです。 ※本記事では、SIGNATEアカウント名にてご紹介させていただきます。

ファンダメンタルズ分析コンペティション 入賞者

1位:M.Mochizukiさん 2位:UKI1さん 3位:nyoki-mtlさん 4位:y.umeさん 5位:takyanさん 6位:stockmanさん 7位:Yu~さん 8位:Jiehuntさん 9位:heegleさん 10位:Nagaoka(TeamShiny)さん

ニュース分析コンペティション 入賞者

1位:kuraさん 2位:UKI1さん 3位:Shun11111さん 4位:チームTeamWeekend 5位:Hiroshi_110さん 6位:jcさん 7位:fx.askbox.netさん 8位:Ken.Ken.さん 9位:onhrsさん 10位:nakayasuさん

フォーラム活動賞 入賞者

もしぇのんさん UKI1さん watantaさん Masonori Yamadaさん

Web記事賞 入賞者

bilzardさん heegleさん Ken.Ken.さん katsu1110さん 各チャレンジの成績上位者は最終スコアにより決定。フォーラム活動賞および、Web記事賞については、意見発信の頻度や開催期間序盤でのアドバイス等、多面的にみたコンペティションおよび参加者への貢献度が評価されての受賞となりました。受賞者の皆さん、おめでとうございます。 表彰も終了し、イベントもいよいよ後半戦。メインコンテンツである、入賞者の代表による解法プレゼンテーションが行われました。トップバッターは、ファンダメンタルズ分析チャレンジで栄えある1位に輝いたM.Mochizuki氏が務めました。

ファンダメンタルズ分析チャレンジ 第1位

M.Mochizuki氏

[059] Competition-Report-2

「まず着目したのは、特徴量に定常性を持たせるにはどうしたらいいのかという部分です。当てるべき目的変数が定常性を持っていたため、それに合わせて特徴量も定常性を持っている必要があるとチュートリアルで示唆されていました。そこで、株価の金額ではなく前年比の変化率が重要であると置いて、単位が円ではなく無次元数となるよう特徴量を設計していきました。また、コンペティションの説明文やチュートリアルを熟読した結果、真に予測すべきは株価の変動率ではなく順位であると気付き、ランク学習で解くという判断をしました。回帰で解いている方が多かったようなので、ここは私ならではの工夫と言えるかもしれません。また、最終スコアは1か月半の中での順位が決まるという仕組みでしたが、実験してみた結果、四半期の範囲内での順位を予測すると精度が出ました。プライベートリーダーボードを再現するとの原則を鵜呑みにせず、本当にそれでいいのかを慎重に確かめたこともポイントだったかと思います。」 発表後には多くの質問が寄せられ、その一つひとつにM.Mochizuki氏が丁寧に回答。「もし、今から精度を上げるとしたら何をしますか?」という質問に対しては、「今回は四半期の区切り方を1月1日から区切る形にしましたが、特にそのような指定があったわけではありませんでした。そのため、違う区切り方も試しながらのランク学習を行う方法もあったかなと今は思っています。それらのモデルでアンサンブルをしたら、多少精度が良くなる可能性はあるかもしれないです。」と回答。質問者にも、視聴者にも、そしてM.Mochizuki氏にとっても有意義な時間となりました。 続いて解法のプレゼンテーションを行ったのは、UKI1氏。ファンダメンタルズ分析チャレンジ、ニュース分析チャレンジの両方で2位に入賞するという快挙を成し遂げ、プレゼンターに選ばれました。

ファンダメンタルズ分析チャレンジ 第2位 / ニュース分析チャレンジ 第2位

UKI1氏

[059] Competition-Report-3

「まずファンダメンタルズ分析に関しては、ランダムウォークをベースとしています。そして、ボラティリティと株価は高値側で正相関、安値側で負相関。トレンドと株価は高値と安値両方とも正相関という特性を踏まえてボラティリティ予測、トレンド予測を混ぜる形で精度を上げていきました。特徴量については、計182の特徴量を作って、網羅的に探索しています。ポイントは、評価期間の選定。パブリックの評価期間は2020年であり、コロナショックの影響でおかしな挙動が見られました。そのため、プライベートと同じ期間を四半期にわたって平均する形で選定しました。ここがモデリングの成否を分けたと思っています。 ニュース分析チャレンジについても、ファンダメンタルズ分析チャレンジで構築したモデルを流用しております。ただ、ボトルネックがいくつかありました。ひとつが翌日仕掛け時の収益性低下です。決算発表は15時以降に集中していますので、当日の終値では仕掛けられず、翌日仕掛けになると10分の1程度まで収益性が下がります。ただ、それでも一定のプラスが出ると判断しました。また、終盤はほとんど決算を行う銘柄がなくなるという偏りもボトルネックでしたが、これは序盤にスタートダッシュする戦略を取るしかないと割り切りました。」 プレゼン後の質疑応答では、XGBoostを使われた理由を質問され、LightGBMも試したがXGBoostの方が良い結果が出たためと回答されていました。また、ツリー系のモデルを採用した理由としては、交互作用を考慮できるためとのことでした。 3番目のプレゼンターは、nyoki-mtl氏。ファンダメンタルズ分析チャレンジで、見事3位入賞を果たされました。nyoki-mtl氏は、本業がプロの棋士ということで先の2人とは違い、株についての専門知識を持たない中での工夫を解説されていました。

ファンダメンタルズ分析チャレンジ 第3位

nyoki-mtl氏

[059] Competition-Report-4

「私の場合は、株についての知識もほとんどなく、コンペティションに割く時間もあまり取れなかったため、最初から方針を立ててから臨みました。その方針とは、まず提出周りでバタつかないようにローカルの環境を整えること。そして、モデルはスタンダードな構成にして、その改良にはあまり時間を使わないこと。最後が、特徴量の生成をひたすら頑張ること。ここで精度を出せればという考えでした。その特徴量生成については、一般的な財務指標を調べて、使えそうなものを全てひたすら実装した形です。前期からの各指標の変化率も思いつく限り追加しました。フォーラムも参考にしながら、他に有用と思われる特徴量を追加していき、最終的には400近くあったと思います。注力すべきポイントを特徴量生成に絞るという戦略が上手くはまってくれたという感想です。」 解法についての質問はもちろん、プロ棋士という職業も影響して「将棋研究なども含めて、時間のマネジメントをどうされているのか気になります」という質問も寄せられ、「やりたいことをやる気持ちが大切だと思います。私のモットーが『楽しいことを全力で』なので楽しいと思うことに全力を注ぐようにしています。やはり、苦しんでしまうとやる気もなくなってしまうので。」と将棋やAIを心から楽しんでいることが伝わる回答をされていました。 解法プレゼンテーションの締めを任されたのは、heegle氏。ファンダメンタルズ分析チャレンジで9位入賞という結果も残されていますが、知見を共有するために執筆した記事の内容の興味深さを評価されてプレゼンターに選出。そのため、プレゼンテーションも記事内容についての解説が中心となっていました。

ファンダメンタルズ分析チャレンジ 第9位 / ウェブ記事賞

heegle氏

[059] Competition-Report-5

「私は20年ほど株式投資をしていますが、機械学習エンジニアとしてはまだまだ駆け出しという状況です。それでも、株式投資の知見を活かすことで入賞できました。そこで、投資家の常識をどうやってアルゴリズムに落とすのか、その橋渡しの部分を丁寧に解説すれば役に立つのではとの想いで記事を執筆しました。具体的には、『株価予測の18手』という形で、株式投資の常識とそれをアルゴリズム化するための工夫を1セットとして、18セットご紹介しました。例えば、私は、株価はサプライズによって動くと考えています。そのサプライズをどう特徴量として表現するか。そう考えると、staticな値や過去実績との比較を特徴量にするのではなく、事前予想と決算の乖離等が意味のある特徴量だよねというような解説をさせていただいています。興味があれば、ぜひ記事を読んでいただけたらと思います。」 heegle氏はドメイン知識を活かして入賞されたということもあり、「ドメイン知識をつけるために勉強したことって何ですか?」といった質問も。heegle氏は「皆さん、最初に株の入門書を買って勉強されることが多いと思いますが、そこではチャートの読み方など、断片的な知識しか得られないと思っています。そのため、自分が莫大な資金を持っていたら、その会社を買いたいと思えるかという経営者目線で企業見るということが大事かなと思います。」と回答。実際に長期にわたる株式投資の実績を持っているからこその貴重な意見でした。

総評1

代表者による貴重な発表を受けて、解法についての総評が行われました。総評をして下さったのは、本コンペティションのITサポートベンダーを務めたAlpacaJapan株式会社。同社を代表して、北山氏よりお話がありました。

[059] Competition-Report-6

AlpacaJapan株式会社 北山 朝也 氏 「ファンダメンタルズ分析チャレンジに関しては、上位の方ほどクロスバリデーションや評価期間、また評価の手法を工夫している印象を受けました。基本的に金融マーケットの問題においては、まず信頼できる評価関数や手法を探すところから始めるのが王道であると考えています。そういう意味では上位入賞者の方は、信用できるクロスバリデーション手法やプライベートの評価手法を、自分の哲学もしくはデータサイエンティストの過去の経験から作っており、それがスコアに反映されていたのではないかと考えております。 ニュース分析チャレンジでは、ファンダメンタルズ分析チャレンジのモデルをベースに組んでいる方が入賞者に複数いらっしゃいました。高値安値予測は、未来の動きに対して比較的相関係数が出やすいため、それを利用するのは我々も想定しており、実際にそれを証明するような結果となったと思っています。一方で、オリジナルなトレードロジックを構築した方も多くいらっしゃり、大変楽しく拝見させていただきました。例えば、短期的な上昇率や長期的な上昇率を組み合わせて銘柄を購入する手法や、テクニカル分析を組み合わせた方法、5日間の株価変化率を利用した手法など、自分なりに様々な工夫をして作っていただいたことがわかり、興味深かったです。 両部門とも、参加者の皆様のおかげで大変盛り上がったコンペティションとなり、嬉しく思います。ここに改めて感謝の気持ちをお伝えし、総評とさせていただきます。ありがとうございました。」

総評2

北山氏の総評に続き、本コンペティションの運営を担ったSIGNATEからも総評がありました。同社の西氏の総括を持って、表彰式は無事閉幕となりました。西氏による総評は以下の通りです。

[059] Competition-Report-7

株式会社SIGNATE データサイエンティスト 西 惇宏 氏 「ニュース分析チャレンジは、期間別に4つのラウンドに分けて実施されたわけですが、ラウンド1で最も良かったモデルでも運用実績がマイナスになるという大波乱が起きました。このラウンド1での波乱がコンペティション全体を通して大きな影響を与えたのかなと見ています。そんな中で入賞された10のモデルを見てみても、20銘柄ぐらいでポートフォリオの銘柄を指定されている方や、50銘柄近く指定している方などばらつきがありました。入賞という結果を出したポートフォリオだけを見ても、これだけポートフォリオ組成の方針に違いがあるというのは、とても面白い結果になったと思っています。 ファンダメンタル分析チャレンジも同様に、さまざまな観点で分析をしていただいていました。それは解法だけでなく、フォーラムでのやりとりにも表れていて、興味深く拝見させていただきました。フォーラムは一般公開されていますので、気になる方は是非見ていただければと思います。以上、長時間にわたりご清聴ありがとうございました。」

まとめ

今回のコンペティションは株式投資が対象ということもあり、専門的なドメイン知識が必要とされるものなのだと思っていました。ドメイン知識が精度向上に寄与したという話もあり、実際に専門知識があった方が有利であったことは間違いなかったと思います。 しかし、そんな中でも、着眼点やアプローチを工夫することで事前知識面でのハンデをカバーして入賞している方がいることも分かりました。そうした部分も、AIやコンペティションの面白さなのかもしれません。 そんなコンペティションの醍醐味を感じながら作られた多くのモデルの中に、日本の金融業界を進化させるような貴重なアイディアが眠っているかもしれません。そんなアイディアが芽吹き、日本の経済が少しでも明るくなれば。そんな期待を抱きたくなるような表彰式でした。 <株式会社日本取引所グループ主催「J-Quants データ分析コンペティション」の入賞者レポートはこちら>

この記事をシェアする