お知らせ(2022.8.26):
アフターイベント第一部(入賞者プレゼン含む)の参加受付を開始いたしました。入賞者の解法プレゼンが聞ける貴重な機会ですので、下記リンクより是非皆様お申し込み下さい!!

【アフターイベント第一部の参加申し込みはこちら】


SIGNATE Student Cupは、データサイエンススキルを持った学生の発掘、および企業と学生の交流を支援するために、SIGNATEが定期的に開催している学生限定のコンペティションです。
「次世代を担う」学生が将来のキャリア形成に自身のスキルを生かし、企業とも活発に情報交換していく場として、コンペティションおよびアフターイベント(表彰式&入賞者プレゼン&協賛企業との交流)をオンラインで実施します。
参加条件は「学生であること」1点のみ。理系も文系も関係なく、平等にスキルを競い合えるコンペティションですので、興味がある学生の方はこの機会に是非チャレンジして下さい!!

▼開催部門

「予測部門」「インサイト部門」の2部門をご用意しています。

部門 予測部門 インサイト部門
課題 求人情報を用いた職種判別(4クラス分類)
データサイエンティストのスキル評価方法の探索
データ 海外求人情報(職務要件)のテキストデータ
予測部門のデータ + 外部データも利用可能
評価方法 予測精度による定量評価
審査員による定性評価
最終提出物 予測モデル(ソースコード、学習済みモデル等) レポート(PDF)
懸賞 1位:10万円, 2位:5万円, 3位:Amazonギフト券3万円分 1位:10万円, 2位:5万円, 3位:Amazonギフト券3万円分
Web記事賞 Amazonギフト券1万円分(最大4名)
本コンペに関連した教育効果の高い記事をブログ等でWeb上に執筆し、フォーラムにリンクを公開した方

※両部門への参加も可能です。

   


▼タスク説明【予測部門】

英語圏の求人情報に含まれるテキストデータ(職務内容に関する記述)をもとに、その職務内容が以下のどの職種に該当するかを判別するアルゴリズムを構築して頂きます。

①データサイエンティスト(DS)
②機械学習エンジニア(ML Engineer)
③ソフトウェアエンジニア(Software Engineer)
④コンサルタント(Consultant) 



▼タスク説明【インサイト部門】

データサイエンティストのスキルを定量的に評価するアルゴリズムの考案、およびそのアルゴリズムを説明するためのレポート作成に挑戦して頂きます。

STEP1: 予測部門の提供データや外部で公開されている各種データを自由に使い、データサイエンティストのスキルを評価するオリジナルのアルゴリズムを作成
(どのような評価軸で、どのように数値化して評価するかを考案して下さい)

STEP2: インサイト部門で提供する6人分のデータサイエンティストの「職務経歴データ」に対して、STEP1で考案した評価方法を適用した結果のレポートを作成
(STEP1の評価方法を用いて6人のスキルを可視化し、各人のスキルの特徴等を説明するレポートを作成して下さい)

提出レポートには以下を含めてください。

・データサイエンティストのスキルを定量的に評価するアルゴリズムの説明
・なぜそのアルゴリズムを選択したかに関する説明
・データサイエンティスト6人分の評価(評価軸、評価軸ごとの数値)の可視化結果



▼履歴書データのイメージ


※こちらのPDFはイメージです(氏名や性別はダミーです)


▼参加資格

・アフターイベント開催の2022年9月9日(金)時点で学生の方
・データダウンロード時に、コンペティション参加規約および本コンペティションにおける特約事項に同意すること
※小学生、中学生、高校生、高等専門学校生、専門学校生、大学生、大学院生(修士・博士課程)、外国籍の留学生を含む非就業の学生が対象です。社会人学生は対象外です。

▼入賞資格

・2022年9月9日(金)開催のアフターイベント第一部で、発表(オンラインでのプレゼン)が可能であること
※入賞者には、10分程度のプレゼンテーションを実施いただきます。
※チームで参加した場合は、原則としてチームメンバー全員による発表をお願いしますが、やむを得ない場合はアフターイベントに参加可能な方のみでの発表も可とします。

▼アフターイベント詳細

<第一部>
・2022年9月9日(金)にオンラインのアフターイベント(第一部)を開催します。
・当日は表彰式や入賞者による解法プレゼンテーション、審査委員による講評をリアルタイムで視聴できます。

<第二部>
・2022年9月12日以降に、協賛企業様によるオンラインの個別セミナーが開催されます。
・実際に現場で活躍しているデータサイエンティストの方々と交流し、インターンシップや就活に繋がる貴重な機会ですので、是非ご参加下さい!!

※アフターイベントには、コンペの参加規約に同意された学生の方のみご参加可能です。(申し込み方法は別途ご案内します。)

※第一部のみ、第二部のみの参加も可能です。
※協賛企業様によるセミナーの詳細は、日程等が確定次第お知らせいたします。


【予測部門】

▼評価関数
・精度評価は、評価関数「F1score」(マクロ平均)を使用します。
・評価値は0~1の値をとり、精度が高いほど大きな値となります。


▼最終順位の決定
1. コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。
 リーダーボードはコンテスト終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。

2. スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

3. 最終順位が上位の方を入賞候補者とし、事務局から連絡いたします。

4. 入賞候補者の方には以下を提出していただきます。
 ・モデルのソースコード
 ・学習済モデル
 ・予測結果の再現の為の手順書(前処理部分、学習部分、予測部分が分かるよう明記)
 ・実行環境(OSのバージョン、使用ソフトウェア及び解析手法) 
 ・乱数シード(Random Forest等の乱数を利用した手法の場合)
 ・各説明変数の予測モデルへの寄与度(寄与度の算出が可能な手法を用いた場合)
 ・データの解釈、工夫点、モデリングから得られる示唆等
 ※お送りするGoogleフォームにて回答いただきます。
 ※内容はデータとして配布していますので事前に目を通しておいてください。(ファイル名「入賞候補者_アンケート」)

5. 再現性検証期間中、入賞候補者及び、その提出モデルが下記いずれかに該当する場合は懸賞の獲得資格を失います。
 ・事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 ・参加条件やルールを満たしていない
 ・プログラムが動作しない
 ・学習済モデルから出力されるスコアと最終評価スコアが一致しない
 ・その他、事務局が不当と判断した場合

6.再現性を確認できた方から入賞者を選定します。


【インサイト部門】

審査員にて提出されたレポートを以下の観点で評価し、入賞者及び順位を決定します。

・評価軸がデータサイエンティストの能力を識別するのに相応しいか
・説明に一貫性があり、レポートの体裁をなしているか
・テキストデータを入力とし、結果を数値で表現するシステマチックなアルゴリズムであるか

インサイト部門では分析手法だけではなく、分析結果の説明のわかりやすさやアルゴリズムの独自性が評価ポイントとなります。アルゴリズムには必ずしも機械学習モデリングを使用する必要はありません。


Web記事賞

・本コンペに関連した教育効果の高い記事をブログ等でWeb上に執筆し、フォーラムの「[事務局より] Web記事投稿用スレッド」に記事のリンクを公開した方が対象です。
・コンペ終了後の8/30(火)23:59 までに投稿頂いた中から、事務局にて内容を確認し、授与対象者を決定します。
・スレッドは、予測部門・インサイト部門の両方に設定していますが、どちらに投稿いただいても構いません。

(参考)Student Cup 2021 秋 Web記事賞 https://matsuda-blog.info/1908/

【両部門共通】

参加の前提
・コンペで設定された目的を理解の上、実用性を意識した仕組みの構築をお願いします。ここで実用性とは、全自動処理であること、高精度、高速、低計算量(省HWコスト)、データ量に対してスケーラブル、モデル解釈性が高いこと、などを意味します。
・チート行為やルールを無視した方法による参加は認められません。
・他者に対する誹謗中傷や公序良俗に反する行為を禁止します。 事務局が悪質と判断したケースにおいては、入賞資格や会員資格の剥奪の可能性があることをを予めご了承のうえご参加ください。 

システムの利用 
・1人につき1アカウントのみ利用可能です。
・チーム人数は最大で5人、2022/8/11 まで作成可能です(チーム作成方法はこちら
チームの管理は各部門で独立しているため、それぞれで作成する必要があります。

情報の取り扱い 
コンペ開催期間中
・コード・学習済みモデル・データ分析結果の他者・チーム外への共有を禁止します。ただし、全ての参加者が参照可能であるフォーラムでの開示は可能です。
コンペ終了後 
・「情報公開ポリシー」ページを参照ください。


【予測部門のみ】

モデルの構築
・コンペで提供されたフォーマットによる新規データを入力した場合、同様なロジックで自動で予測結果が出力されるモデルのみが評価対象となります。
・追加費用を伴わない(有償の外部API等を使用しない)環境下で提案した手法が再現でき、かつ継続使用が可能な実装をお願いします。

データの利用

・手動でラベル付けした結果を提出することは禁止します。
・学習データのラベルを書き換えてモデルを学習することは禁止します。ただし、統計的かつ機械的な手法により学習用データを水増しして利用することは可能です。
・提供データ以外のデータを用いてモデルを学習することは禁止します。ただし、オープンかつ無料な学習済みモデル(BERT等)やライブラリは使用可能です。
 ※学習済みモデルを使用する際は、入賞時にソース(論文のリンク等)を明記してください。

ツールの利用
・オープンかつ無料なもの(python, tensorflow 等)に限定します。

実装方法
・前処理、学習、予測、の3つにコードを分け実装してください。

 ①Preprocessing「前処理」
  提供データを読み込み、前処理を施し、モデルに入力が可能な状態に変換するモジュール。
  get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義。
 ②Learning「学習」
  ①の出力を読み込み、モデルを学習し、学習済みモデルを出力するモジュール。
  学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数等を定義。
 ③Predicting「予測」
  ①で作成した評価要データ及び②で作成した学習済みモデルを読み込み、予測結果を出力するモジュール。


【インサイト部門のみ】

データの利用
・自ら取得した外部データを用いることは可能です。(予測部門のデータも利用可能です)

レポート要件
PDF形式レポートを提出して下さい。
・1ページ目には、「Student Cup 2022 インサイト部門」、任意のサブタイトル、SIGNATE登録のユーザー名を記載してください。
・ページ数は10ページ以内としてください。
・レポートの構成やレイアウトはご自由に設定ください。

レポートは複数回投稿できますが、最後に投稿したファイルが評価対象になりますのでご注意ください。

▼協賛企業

ゴールドスポンサー

     


   


ブロンズスポンサー

 


▼後援団体

   

Disclosure policy

As a general rule, in accordance with Article 4, Paragraph 1 of the terms of participation, diclosing any contents such as insights and deliverables transmitted through the information or data provided by our company in relation to this competition is not permitted, however, only after the completion of this competition and for non-commercial purposes, it will be possible to disclose the contents within the score of the table below
Model *1
Public
Analysis results *2
Public
Public : Posting to social media sites, blogs and source repositories, and citing to papers
Restricted : Using in a limited range from research, education to seminars, where many unspecified people cannot access
*1 Execution unit source code and learned models
*2 The insights obtained using the information and data provided, or the solutions including scripts and processed data such as summary statistics

※Notes

・SIGNATE Student Cupでは、ご自身の研究や論文投稿に本コンペティションのデータを活用していただくことを積極的に推奨しております。
引用元として本コンペティションを明記頂ける場合、研究や論文でのデータ使用に何ら制限はございません。
・また、コンペティション開催中も、本コンペティションのフォーラム上では公開が可能です。

▼本コンペ特約事項
株式会社SIGNATE(以下、「主催者」といいます。)は、データサイエンススキルを持つ学生に対し、キャリア意識の醸成及び協賛企業との交流機会提供を目的に、SIGNATE Student Cup 2022(以下、「本コンペティション」といいます。)を開催いたします。
これに伴い、主催者から協賛企業に対し、本コンペティション参加者の情報(SIGNATE.JP利用規約同意時に取得した情報及びSIGNATE.JP利用中に追加取得した戦績等を含みます)を提供いたします(協賛企業は当該提供情報を、参加者に対して採用に関する情報提供又はオファーに関する連絡等を行うことに限定して利用いたします)。 また、主催者から参加者に対して、本コンペティションのアフターイベントのご案内や関連メールマガジンの配信、協賛企業のインターンシップや新卒採用に関する情報提供又はオファーに関する連絡がなされる場合があります。
また、本コンペティションにおけるSIGNATEコンペティション参加規約第3条の「権利譲渡対象者」は主催者とします。但し、参加者が、自身で開発したアルゴリズム及びその他本コンペティションへの参加に関連して作成した資料等(最終提出物及び最終審査用提出物を含みます。)を自身のSNSやブログ等で公開することについては、公開時に本コンペティションへの参加に関連して作成したものであることを明記する場合においては、何ら制限しません。



Terms of Participation in SIGNATE Competition

In order to participate in the Competition, you are required to agree to these Terms, in addition to the Terms of Use of SIGNATE.JP Site (hereinafter referred to as the “Terms of Use”). You should participate in the Competition after reading carefully and agreeing to these Terms. These Terms, the matters that are displayed as “additional matters” that you have agreed to when participating in a Competition, the Terms of Use and other terms and conditions that you have agreed to (hereinafter collectively referred to as “these Terms, etc.”) shall all be binding on the Participant.


Article 1 Definitions

1. For the purpose of these Terms, the following terms shall be defined as follows:

(1) “Site” means the website “SIGNATE (https://signate.jp)” on which the Competitions are posted.
(2) “Competition” means any competition on AI development or data analysis on the Site as held by the Host.
(3) “Host” is the host(s) of the Competition. The Host may be SIGNATE, Inc. (hereinafter referred to as the “Company”) or the Company’s client companies, affiliated companies, schools or organizations, etc. (hereinafter referred to as the “Client(s)”).
(4) “Participant(s)” means the member(s) (which mean “member(s)” defined in the Terms of Use, and the same shall apply hereinafter) who participate in a Competition.
(5) “Submissions” means, collectively, the analysis and prediction results, prediction models and reports, etc. as submitted in the Competition.
(6) “Final Submissions” means the Submissions submitted by a Participant that the Participant has specified as a final submission on the prescribed page in the Site by the time of completion of a Competition.
(7) “Winner Candidate” means the Participant who has received a notice from the Company that he/she is nominated as a winner candidate.
(8) “Submissions for Final Judgment” means the Submissions and other items designated by the Company as submitted by a Winner Candidate pursuant to the instructions of the Company.
(9) “Final Judgment” means the acceptance inspection and judgment, including reproducibility verification, by the Company for the Final Submissions and Submissions for Final Judgment of a Winner Candidate.
(10) “Winner” means the Winner Candidate who is informed by the Company that he/she has won a prize.
(11) “OSS” means software licensed based on OSS License Terms.
(12) “OSS License Terms” means any of the following license terms
(1) Either the GNU General Public License or the GNU Lesser General Public License published by the Free Software Foundation, Inc.;
(2) License terms listed at www.opensource.org/licenses/ or derivatives thereof;
(3) License terms that regard the software as “free software” or “open source software”; and
(4) License terms or agreements similar to the license terms listed in each of the three preceding items which request the user to disclose, distribute or license to a third party, or not to exercise, etc., the licensed software, its derivatives and the intellectual property rights associated therewith in whole or in part.

Article 2 Competition

1. A member who desires to participate in a Competition shall be required to agree to these Terms, etc. and to satisfy the conditions for participation as specified in each such Competition. Any person who is not a member shall not participate in any Competition.
2. Participants shall participate in each Competition in the manner as advised by the Company and shall be obligated to comply with the rules as prescribed in each Competition.
3. Participants may submit the Submissions for the assignment of a Competition during the period of such Competition and submit as many proposals on the method of solving the problem as specified by the Company to the Host by the end of the period of the said Competition.
4. Participants may submit Submissions in the form specified in the Competition and specify those Submissions as a Final Submission on the prescribed page in the Site by the end time specified by the said Competition.
5. Participants’ Final Submissions shall be evaluated in accordance with the evaluation method specified in the Competition and the final ranking shall be determined based on such evaluation.
6. Participants may, as a general rule, check their own evaluation results and the evaluation results of each of the other Participants for Submissions that may be evaluated quantitatively on the Site.
7. Participants shall be solely liable for their own Submissions, including the legality and non-infringement of the Submission.
8. Participants shall not submit any Submissions that have no direct relationship to each Competition.
9. Unless otherwise provided for, Participants may not directly communicate to, consult with, make a request to, solicit or take any other actions with the Host in respect of the matters related to a Competition during the period of the said Competition.
10. Participants shall direct any questions or concerns regarding any Competition to the Company or the third party designated by the Company in accordance with the procedures prescribed by the Company as posted on the Site.
11. Participants shall produce Submissions in compliance with the OSS License Terms related to the OSS when using or incorporating OSS in a Submission. However, Participants shall not use or incorporate OSS for which commercial use is prohibited in a Submission.
12. The Host shall not be obligated to pay any remuneration or other consideration for any act of the Participants in a Competition under any pretext. And the Company shall not be obligated to pay any remuneration or other consideration other than those prescribed in the following Article for any act of the Participants in a Competition.

Article 3 Reward and Vesting of Rights

1. Unless otherwise provided for, any Participant shall satisfy the requirements set forth in the following items in order to be entitled to receive a reward in any Competition that offers a reward:

(1) To be a winner;
(2) To agree to transfer to the Host and the relevant transferee of rights in such Competition all transferable rights, such as copyrights (including the rights as prescribed in Article 27 and Article 28 of the Copyright Act, and the same shall apply hereinafter), rights to obtain patents and know-how, etc. in and to all analysis and prediction results, prediction models, reports, etc., written explanations on algorithms, source code and reproduction method, etc. (although not limited to these), and the Submissions contained in the Final Submissions and Submissions for Final Judgment (hereinafter referred to as the “Rights”) along with a guarantee that the Participant has the authority to transfer such Rights;
(3) To guarantee that any relevant transferee of rights may use the Rights contained in the Final Submissions and Submissions for Final Judgment for its own business and other purpose without any restriction and to agree to their exclusive use of such Rights;
(4) To agree not to exercise moral rights to the Rights against the relevant transferee of rights;
(5) To enter into an agreement for the transfer of the Rights with the relevant eligible transferee of rights, including the guarantee of and agreement to the matters in the preceding three (3) items and other reasonable provisions;
(6) To have the personal identity of such Participant verified by the Company; and
(7) Not to breach any provision of these Terms, etc.

2. Any Winner Candidate shall, after having received a notice from the Company that he/she is nominated as a winner candidate, submit the Submissions for Final Judgment on or before the designated date and communicate the matters requiring confirmation or response in relation to the Final Submissions and the Submissions for Final Judgment to the Company on or before the designated date, in accordance with the instructions of the Company. The Company shall carry out the final judgment based on such matters requiring confirmation or response. If the Company receives no confirmation or response satisfactory to the Company on or before the designated date, the Company may exclude such Winner Candidate from the subject of the final judgment and the Winner Candidate shall not raise any objection thereto.
3. If the Company considers that the Final Submissions or Submissions for Final Judgment need to be amended or modified, or there occur any additional matters requiring confirmation, in the course of the final judgment, any Winner Candidate shall take action or make response in relation to the matters that require amendment or modification, or the matters requiring confirmation, on or before the designated date in accordance with the instructions of the Company. If the Company receives no action or response satisfactory to the Company on or before the designated date, the Company may exclude such Winner Candidate from the final judgment and the Winner Candidate shall not raise any objection thereto.
4. The Company shall determine the Winner through the final judgment and inform the Winner to that effect.

Article 4 Confidentiality

1. Any Participant shall treat any information and data that they receive from the Company in relation to Competitions as well as knowledge and products, etc. obtained using such information and data (including Participant Submissions; hereinafter referred to as the “Company-Provided Information”) as confidential information and shall not disclose the same to any third party and use the same for any purpose other than for such Competition and purpose specified by the Company separately; provided, however, that the confidential information shall not include any information that falls under any of the following items:

(1) Information that is known to the public at the time it was received;
(2) Information that is already possessed by the Participant at the time it was received (only in the case where such Participant may demonstrate such fact by reasonable means);
(3) Information that becomes known to the public without the fault of the Participant after it was received;
(4) Information that is independently developed by the Participant without reference to any information received; or
(5) Information that is rightfully received from any third party having a right to disclose such information without the obligations of confidentiality (only in the case where such Participant may demonstrate such fact by reasonable means).

2. Any Winner shall handle his/her Final Submissions and Submissions for Final Judgment in the same manner as Company-Provided Information after receiving notification that they are a winner. And Participant Submissions other than the Winner’s Final Submissions and Submissions for Final Judgment shall not be included as Company-Provided Information after the Company has determined the Winner notwithstanding the provisions of the preceding paragraph.
3. Any Participant may publish any algorithms that they have developed as well as any other materials they have created in connection with their participation in a Competition (including Final Submissions and Submissions for Final Judgment) after that Competition in accordance with the Competition Information Disclosure Policy (hereinafter, "Information Disclosure Policy") posted on the Site. However, Participants shall observe the following matters when publishing information and may not publish any materials prohibited by the Information Disclosure Policy:

(1) Clarify that the materials were created in connection with participation in the Competition;
(2) Give credit in accordance with the notation method prescribed in the Information Disclosure Policy when the materials to be published contain part of a dataset; and
(3) Clarify the location accessible to all Participants (including but not limited to the Competition forum and other locations designated by the Company) where the materials are published (including links, etc.) if publishing materials outside the Competition forum.

4. Any Participant shall delete or return to the Company the Company-Provided Information (excluding the information prescribed in paragraph 3) immediately after the completion of a Competition.
5. If there is any separate arrangement in relation to the confidential information in a Competition, the provisions of such arrangement shall prevail over the provisions of these Terms.
6. If any dispute occurs between a third party and the Host or the Company due to the breach by any Participant of the provisions of this Article and such other party makes any claim against the Company or the Host, such Participant shall compensate for any damage, loss, expenses (including, but not limited to, attorneys’ fees), lost profits and lost revenues, etc. incurred by the Company and the Host.
7. The provisions of this Article shall survive the termination of the relevant Competition or the Participant’s completion of the procedures for withdrawal from all services provided by the Company, with respect to the Company-Provided Information and the Winner’s Final Submissions and Submissions for Final Judgment for a period of five (5) years thereafter.

Article 5 Prohibited Acts of Participants

1. The Company shall prohibit Participants from engaging in any of the following acts in any Competition:

(1) An act of cracking, cheating, spoofing and other misconduct;
(2) An act of redistributing data files included in the dataset;
(3) An act of directly communicating to, consulting with, making a request to, soliciting or responding to solicitation or other activities to other Participants or the Host (other than the Company) without the involvement of the Company for the purpose of furthering the Participant’s own interests;
(4) Any profitmaking activities using the Competition (including but not limited to solicitation or scouting activities, and use for a third party in educational business, etc.) without the prior approval of the Company in writing or any other manner specified by the Company;
(5) An Act of transferring, offering as collateral or otherwise disposing of the Participants’ standing, or the rights or obligations, as a Participant in any Competition (except with the prior written consent of the Company);
(6) Acts that infringe upon the intellectual property rights, trade secrets or any other rights of third parties; and
(7) Any other act in breach of these Terms, etc.

2. If the Company deems that a Participant has engaged in, or may engage in, any of the prohibited acts as prescribed in the preceding paragraph, the Company may, without prior notice to the Participant, disqualify the Participant from the Competition in which the Participant participates, temporarily suspend the Participant from using some or all of the services provided by the Company, withdraw the Participant’s membership, claim damages from the Participant or take any other measures deemed necessary by the Company.

Article 6 Modification of Terms

1. The Company may modify, add or delete any provisions of these Terms from time to time without the approval of Participants.

July 25, 2022