・データタブよりデータをダウンロードしてください。
・参加にあたっては、データのダウンロード時に表示される参加規約に同意の上、必要な個人情報をご入力ください。
・両部門にご参加される場合、同じ個人情報のご入力が2回必要となります。お手数ですがご協力をお願い致します。
・予測結果を投稿する際は、指定された形式に従ってください。(詳細はデータページを参照)


▼タスク説明

中古自動車の情報(車種・走行距離など)をもとに、中古車の価格を予測するアルゴリズムを構築して頂きます。


▼評価関数

  • 精度評価は、評価関数「MAPE」(Mean Absolute Persentage Error)を使用します。
  • 評価値は最低で0の値をとり、精度が小さいほど大きな値となります。


▼最終順位の決定

  1. コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。
    リーダーボードはコンテスト終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。
  2. スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。
  3. 最終順位が上位の方を入賞候補者とし、事務局から連絡いたします。
  4. 入賞候補者の方には以下を提出していただきます。
    • モデルのソースコード学習済モデル
    • 予測結果の再現の為の手順書(前処理部分、学習部分、予測部分が分かるよう明記)
    • 実行環境(OSのバージョン、使用ソフトウェア及び解析手法)
    • 乱数シード(Random Forest等の乱数を利用した手法の場合)
    • 各説明変数の予測モデルへの寄与度(寄与度の算出が可能な手法を用いた場合)
    • データの解釈、工夫点、モデリングから得られる示唆等
      • お送りするGoogleフォームにて回答いただきます。
      • 内容はデータとして配布していますので事前に目を通しておいてください。(ファイル名「入賞候補者_アンケート」)
  5. 再現性検証期間中、入賞候補者及び、その提出モデルが下記いずれかに該当する場合は懸賞の獲得資格を失います。
    • 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
    • 参加条件やルールを満たしていない
    • プログラムが動作しない
    • 学習済モデルから出力されるスコアと最終評価スコアが一致しない
    • その他、事務局が不当と判断した場合
  6. 再現性を確認できた方から入賞者を選定します。
※入賞候補者が入賞資格を失った場合は、最終スコアが次点の方が繰り上がり、新たな入賞候補となります。
※不正が発覚した場合は、SIGNATE独自の裁量により、メダル・ポイントが付与されない場合があります。

▼特別賞について

  1. コンペでの投稿のアクティビティをもとに2名選定します。
  2. Slackでのアクティビティをもとに1名選定します。(部門の括りなくSlackの参加者から選出)
  3. *評価基準は非公開とします。
    *入賞に該当する投稿がない場合は「該当者なし」とします。
    *審査結果の詳細についてはお応え出来かねます旨、予めご了承ください。

▼参加の前提

  • チート行為やルールを無視した方法による参加は認められません。
  • 他者に対する誹謗中傷や公序良俗に反する行為を禁止します。事務局が悪質と判断したケースにおいては、入賞資格や会員資格の剥奪の可能性があることを予めご了承のうえご参加ください。

▼システムの利用

  • 1人につき1アカウントのみ利用可能です。
  • チーム人数は最大で5人、2023/8/10 まで作成可能です(チーム作成方法はこちら
  • チームの管理は各部門で独立しているため、それぞれで作成する必要があります。

▼情報の取り扱い

  • コンペ開催期間中
    • データ分析結果・アイデアの、他者・チーム外への共有を禁止します。ただし、全ての参加者が参照可能であるSlackでの開示は可能です。
  • コンペ終了後
    • 「情報公開ポリシー」ページを参照ください。

▼モデルの構築

  • コンペで設定された目的を理解の上、実用性を意識した仕組みの構築をお願いします。ここで実用性とは、全自動処理であること、高精度、高速、低計算量(省HWコスト)、データ量に対してスケーラブル、モデル解釈性が高いこと、などを意味します。
  • コンペで提供されたフォーマットによる新規データを入力した場合、同様なロジックで自動で予測結果が出力されるモデルのみが評価対象となります。
  • 追加費用を伴わない(有償の外部API等を使用しない)環境下で提案した手法が再現でき、かつ継続使用が可能な実装をお願いします。

▼データの利用

  • 手動でラベル付けした結果を提出することは禁止します。
  • 学習データのラベルを書き換えてモデルを学習することは禁止します。ただし、統計的かつ機械的な手法により学習用データを水増しして利用することは可能です。
  • 提供データ以外のデータを用いてモデルを学習することは禁止します。
  • 学習済みモデルを使用する際は、入賞時にソース(論文のリンク等)を明記してください。
  • 評価用データを利用・参考にして、学習用データの修正・特徴量の追加を行い、モデルの学習・推論を行うことを禁じます。(下記、禁止の具体例)
    • 評価用データを参考に特徴量を作成し学習する。またその特徴量を用いて、別の特徴量を作成し学習する。
    • 評価用データを利用して、学習用データの数値を変換する(欠損値を埋める)

▼ツールの利用

  • オープンかつ無料なもの(python, tensorflow 等)に限定します。

▼実装方法

  • 前処理、学習、予測、の3つにコードを分け実装してください。
 ①Preprocessing「前処理」
  提供データを読み込み、前処理を施し、モデルに入力が可能な状態に変換するモジュール。
  get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義。
 ②Learning「学習」
  ①の出力を読み込み、モデルを学習し、学習済みモデルを出力するモジュール。
  学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数等を定義。
 ③Predicting「予測」
  ①で作成した評価要データ及び②で作成した学習済みモデルを読み込み、予測結果を出力するモジュール。

Disclosure policy

As a general rule, in accordance with Article 4, Paragraph 1 of the terms of participation, diclosing any contents such as insights and deliverables transmitted through the information or data provided by our company in relation to this competition is not permitted, however, only after the completion of this competition and for non-commercial purposes, it will be possible to disclose the contents within the score of the table below
Model *1
Public
Analysis results *2
Public
Public : Posting to social media sites, blogs and source repositories, and citing to papers
Restricted : Using in a limited range from research, education to seminars, where many unspecified people cannot access
*1 Execution unit source code and learned models
*2 The insights obtained using the information and data provided, or the solutions including scripts and processed data such as summary statistics

外部データについて

Q1:スクレイピングで取得した中古車データを学習データとして利用することは外部データに当たりますか?
A1:外部データに該当します。

Q2:geopyなどの地域から緯度・経度を取得できるライブライの使用は外部データに該当しますか?
A2:外部データに該当致しません。本コンペティションでは緯度・経度に限り利用可能としております。

Q3:地域(region)から州(state)を特定できることがわかりました。このためregionがどこのstateに属するかをインターネットで調べ、regionとstateの関係性を辞書にまとめstateの情報を修正しました。こちらは外部データ利用に該当しますか?
A3:外部データに該当致しません。こちら知見を用いて特徴量を作成したと判断します。

Q4:Q3が外部データに該当しない(知見を用いた特徴量作成行為)のであれば、stateごとの地価や気候などを調べ、新たに特徴量を追加することは知見を用いた行為であり外部データに該当しないのでしょうか?
A4:こちら知見を用いて特徴量を作成したと判断できますが、外部データに該当致します。

Q5:Q3とQ4で外部データに該当する・しないの違いは何でしょうか?
A5:Q3はregionからstateを特定しています。regionとstateはお互い配布データ内に特徴量として含まれているので、外部データの利用に抵触しません。
一方でQ4は「地価」や「気温」に該当する特徴量が配布データ内に含まれていないので、外部データに該当します。

Q6:toyota、nissanは日本車であるなどの製造メーカーの国に応じて新たな特徴量を作成したいです。ですが製造メーカーの国に関する特徴量は配布データにないことを踏まえると、特徴量は使用できないのでしょうか?
A6:利用できます。配布データ内での特徴量から、特徴量エンジニアリング・一定のロジック・アルゴリズムによって、新たな特徴量を作成できた場合、外部データの利用に該当致しません。ですが検証時に、新たな特徴量を作成したロジックが不明瞭で外部データの利用が疑われる場合、事務局から質問する場合がございます。回答の内容で疑いが解消されない場合、入賞を取り消す可能性がありますのでご注意ください。

Q7:配布データに外部データを追加し、EDAをする行為は外部データに該当しませんか?
A7:モデルの学習に外部データを利用していなければ、外部データを追加してEDAを行う行為はルールに違反しません。こちらルール違反となる根拠を事務局がつかめないためです。


外部データについて

Q1:「評価用データを利用・参考にして、学習用データの修正・特徴量の追加を行い、モデルの学習・推論を行うことを禁じます。」とありますが、訓練用データと評価用データの分布の違いやカテゴリの違いをなどを確認する行為はこのルールに抵触しますか?
A1:ルール違反に該当致しません。こちら事務局での判断が難しいためとなります。

Q2:評価用データと訓練用データの分布が異なるため、評価用データの分布を訓練用データの分布に合わせ加工し、推論する行為はルール違反に該当しますか?
A2:こちら該当致しません。反対に評価用データに合わせて学習用データを修正する行為はルール違反に該当致します。

Q3:訓練用データと評価用データを結合し特徴量を集約、集約したデータを特徴量として利用し学習する行為はルール違反に該当しますか?
A3:該当致します。

Q4:テストデータに予測値を加えたデータを追加データとして、モデルに学習させる行為(pseudo-labeling)は評価データの利用に該当しますか?
A4:こちら該当致しますので、ルール違反となります。

▼本コンペ特約事項
株式会社SIGNATE(以下、「主催者」といいます。)は、データサイエンススキルを持つ学生に対し、キャリア意識の醸成及び協賛企業との交流機会提供を目的に、SIGNATE Student Cup 2023以下、「本コンペティション」といいます。)を開催いたします。
これに伴い、主催者から協賛企業に対し、本コンペティション参加者の情報(SIGNATE.JP利用規約同意時に取得した情報及びSIGNATE.JP利用中に追加取得した戦績等を含みます)を提供いたします(協賛企業は当該提供情報を、参加者に対して採用に関する情報提供又はオファーに関する連絡等を行うことに限定して利用いたします)。 また、主催者または協賛企業から参加者に対して、本コンペティションのアフターイベントのご案内や関連メールマガジンの配信、協賛企業のインターンシップや新卒採用に関する情報提供又はオファーに関する連絡が届く場合があります。
本コンペティションにおいては、コミュニケーションツールとしてSlackを利用します。そのため、本コンペティションの参加規約に加えて、あらかじめSlackの利用規約にも同意する必要があります。
特にSlackはユーザ利用規約により16歳未満はサービス利用禁止である点にご注意ください。
また、本コンペティションにおけるSIGNATEコンペティション参加規約第3条の「権利譲渡対象者」は主催者とします。但し、参加者が、自身で開発したアルゴリズム及びその他本コンペティションへの参加に関連して作成した資料等(最終提出物及び最終審査用提出物を含みます。)を自身のSNSやブログ等で公開することについては、公開時に本コンペティションへの参加に関連して作成したものであることを明記した場合に限り、何ら制限されません。



Terms of Participation in SIGNATE Competition

In order to participate in the Competition, you are required to agree to these Terms, in addition to the Terms of Use of SIGNATE.JP Site (hereinafter referred to as the “Terms of Use”). You should participate in the Competition after reading carefully and agreeing to these Terms. These Terms, the matters that are displayed as “additional matters” that you have agreed to when participating in a Competition, the Terms of Use and other terms and conditions that you have agreed to (hereinafter collectively referred to as “these Terms, etc.”) shall all be binding on the Participant.


Article 1 Definitions

1. For the purpose of these Terms, the following terms shall be defined as follows:

(1) “Site” means the website “SIGNATE (https://signate.jp)” on which the Competitions are posted.
(2) “Competition” means any competition on AI development or data analysis on the Site as held by the Host.
(3) “Host” is the host(s) of the Competition. The Host may be SIGNATE, Inc. (hereinafter referred to as the “Company”) or the Company’s client companies, affiliated companies, schools or organizations, etc. (hereinafter referred to as the “Client(s)”).
(4) “Participant(s)” means the member(s) (which mean “member(s)” defined in the Terms of Use, and the same shall apply hereinafter) who participate in a Competition.
(5) “Submissions” means, collectively, the analysis and prediction results, prediction models and reports, etc. as submitted in the Competition.
(6) “Final Submissions” means the Submissions submitted by a Participant that the Participant has specified as a final submission on the prescribed page in the Site by the time of completion of a Competition.
(7) “Winner Candidate” means the Participant who has received a notice from the Company that he/she is nominated as a winner candidate.
(8) “Submissions for Final Judgment” means the Submissions and other items designated by the Company as submitted by a Winner Candidate pursuant to the instructions of the Company.
(9) “Final Judgment” means the acceptance inspection and judgment, including reproducibility verification, by the Company for the Final Submissions and Submissions for Final Judgment of a Winner Candidate.
(10) “Winner” means the Winner Candidate who is informed by the Company that he/she has won a prize.
(11) “OSS” means software licensed based on OSS License Terms.
(12) “OSS License Terms” means any of the following license terms
(1) Either the GNU General Public License or the GNU Lesser General Public License published by the Free Software Foundation, Inc.;
(2) License terms listed at www.opensource.org/licenses/ or derivatives thereof;
(3) License terms that regard the software as “free software” or “open source software”; and
(4) License terms or agreements similar to the license terms listed in each of the three preceding items which request the user to disclose, distribute or license to a third party, or not to exercise, etc., the licensed software, its derivatives and the intellectual property rights associated therewith in whole or in part.

Article 2 Competition

1. A member who desires to participate in a Competition shall be required to agree to these Terms, etc. and to satisfy the conditions for participation as specified in each such Competition. Any person who is not a member shall not participate in any Competition.
2. Participants shall participate in each Competition in the manner as advised by the Company and shall be obligated to comply with the rules as prescribed in each Competition.
3. Participants may submit the Submissions for the assignment of a Competition during the period of such Competition and submit as many proposals on the method of solving the problem as specified by the Company to the Host by the end of the period of the said Competition.
4. Participants may submit Submissions in the form specified in the Competition and specify those Submissions as a Final Submission on the prescribed page in the Site by the end time specified by the said Competition.
5. Participants’ Final Submissions shall be evaluated in accordance with the evaluation method specified in the Competition and the final ranking shall be determined based on such evaluation.
6. Participants may, as a general rule, check their own evaluation results and the evaluation results of each of the other Participants for Submissions that may be evaluated quantitatively on the Site.
7. Participants shall be solely liable for their own Submissions, including the legality and non-infringement of the Submission.
8. Participants shall not submit any Submissions that have no direct relationship to each Competition.
9. Unless otherwise provided for, Participants may not directly communicate to, consult with, make a request to, solicit or take any other actions with the Host in respect of the matters related to a Competition during the period of the said Competition.
10. Participants shall direct any questions or concerns regarding any Competition to the Company or the third party designated by the Company in accordance with the procedures prescribed by the Company as posted on the Site.
11. Participants shall produce Submissions in compliance with the OSS License Terms related to the OSS when using or incorporating OSS in a Submission. However, Participants shall not use or incorporate OSS for which commercial use is prohibited in a Submission.
12. The Host shall not be obligated to pay any remuneration or other consideration for any act of the Participants in a Competition under any pretext. And the Company shall not be obligated to pay any remuneration or other consideration other than those prescribed in the following Article for any act of the Participants in a Competition.

Article 3 Reward and Vesting of Rights

1. Unless otherwise provided for, any Participant shall satisfy the requirements set forth in the following items in order to be entitled to receive a reward in any Competition that offers a reward:

(1) To be a winner;
(2) To agree to transfer to the Host and the relevant transferee of rights in such Competition all transferable rights, such as copyrights (including the rights as prescribed in Article 27 and Article 28 of the Copyright Act, and the same shall apply hereinafter), rights to obtain patents and know-how, etc. in and to all analysis and prediction results, prediction models, reports, etc., written explanations on algorithms, source code and reproduction method, etc. (although not limited to these), and the Submissions contained in the Final Submissions and Submissions for Final Judgment (hereinafter referred to as the “Rights”) along with a guarantee that the Participant has the authority to transfer such Rights;
(3) To guarantee that any relevant transferee of rights may use the Rights contained in the Final Submissions and Submissions for Final Judgment for its own business and other purpose without any restriction and to agree to their exclusive use of such Rights;
(4) To agree not to exercise moral rights to the Rights against the relevant transferee of rights;
(5) To enter into an agreement for the transfer of the Rights with the relevant eligible transferee of rights, including the guarantee of and agreement to the matters in the preceding three (3) items and other reasonable provisions;
(6) To have the personal identity of such Participant verified by the Company; and
(7) Not to breach any provision of these Terms, etc.

2. Any Winner Candidate shall, after having received a notice from the Company that he/she is nominated as a winner candidate, submit the Submissions for Final Judgment on or before the designated date and communicate the matters requiring confirmation or response in relation to the Final Submissions and the Submissions for Final Judgment to the Company on or before the designated date, in accordance with the instructions of the Company. The Company shall carry out the final judgment based on such matters requiring confirmation or response. If the Company receives no confirmation or response satisfactory to the Company on or before the designated date, the Company may exclude such Winner Candidate from the subject of the final judgment and the Winner Candidate shall not raise any objection thereto.
3. If the Company considers that the Final Submissions or Submissions for Final Judgment need to be amended or modified, or there occur any additional matters requiring confirmation, in the course of the final judgment, any Winner Candidate shall take action or make response in relation to the matters that require amendment or modification, or the matters requiring confirmation, on or before the designated date in accordance with the instructions of the Company. If the Company receives no action or response satisfactory to the Company on or before the designated date, the Company may exclude such Winner Candidate from the final judgment and the Winner Candidate shall not raise any objection thereto.
4. The Company shall determine the Winner through the final judgment and inform the Winner to that effect.

Article 4 Confidentiality

1. Any Participant shall treat any information and data that they receive from the Company in relation to Competitions as well as knowledge and products, etc. obtained using such information and data (including Participant Submissions; hereinafter referred to as the “Company-Provided Information”) as confidential information and shall not disclose the same to any third party and use the same for any purpose other than for such Competition and purpose specified by the Company separately; provided, however, that the confidential information shall not include any information that falls under any of the following items:

(1) Information that is known to the public at the time it was received;
(2) Information that is already possessed by the Participant at the time it was received (only in the case where such Participant may demonstrate such fact by reasonable means);
(3) Information that becomes known to the public without the fault of the Participant after it was received;
(4) Information that is independently developed by the Participant without reference to any information received; or
(5) Information that is rightfully received from any third party having a right to disclose such information without the obligations of confidentiality (only in the case where such Participant may demonstrate such fact by reasonable means).

2. Any Winner shall handle his/her Final Submissions and Submissions for Final Judgment in the same manner as Company-Provided Information after receiving notification that they are a winner. And Participant Submissions other than the Winner’s Final Submissions and Submissions for Final Judgment shall not be included as Company-Provided Information after the Company has determined the Winner notwithstanding the provisions of the preceding paragraph.
3. Any Participant may publish any algorithms that they have developed as well as any other materials they have created in connection with their participation in a Competition (including Final Submissions and Submissions for Final Judgment) after that Competition in accordance with the Competition Information Disclosure Policy (hereinafter, "Information Disclosure Policy") posted on the Site. However, Participants shall observe the following matters when publishing information and may not publish any materials prohibited by the Information Disclosure Policy:

(1) Clarify that the materials were created in connection with participation in the Competition;
(2) Give credit in accordance with the notation method prescribed in the Information Disclosure Policy when the materials to be published contain part of a dataset; and
(3) Clarify the location accessible to all Participants (including but not limited to the Competition forum and other locations designated by the Company) where the materials are published (including links, etc.) if publishing materials outside the Competition forum.

4. Any Participant shall delete or return to the Company the Company-Provided Information (excluding the information prescribed in paragraph 3) immediately after the completion of a Competition.
5. If there is any separate arrangement in relation to the confidential information in a Competition, the provisions of such arrangement shall prevail over the provisions of these Terms.
6. If any dispute occurs between a third party and the Host or the Company due to the breach by any Participant of the provisions of this Article and such other party makes any claim against the Company or the Host, such Participant shall compensate for any damage, loss, expenses (including, but not limited to, attorneys’ fees), lost profits and lost revenues, etc. incurred by the Company and the Host.
7. The provisions of this Article shall survive the termination of the relevant Competition or the Participant’s completion of the procedures for withdrawal from all services provided by the Company, with respect to the Company-Provided Information and the Winner’s Final Submissions and Submissions for Final Judgment for a period of five (5) years thereafter.

Article 5 Prohibited Acts of Participants

1. The Company shall prohibit Participants from engaging in any of the following acts in any Competition:

(1) An act of cracking, cheating, spoofing and other misconduct;
(2) An act of redistributing data files included in the dataset;
(3) An act of directly communicating to, consulting with, making a request to, soliciting or responding to solicitation or other activities to other Participants or the Host (other than the Company) without the involvement of the Company for the purpose of furthering the Participant’s own interests;
(4) Any profitmaking activities using the Competition (including but not limited to solicitation or scouting activities, and use for a third party in educational business, etc.) without the prior approval of the Company in writing or any other manner specified by the Company;
(5) An Act of transferring, offering as collateral or otherwise disposing of the Participants’ standing, or the rights or obligations, as a Participant in any Competition (except with the prior written consent of the Company);
(6) Acts that infringe upon the intellectual property rights, trade secrets or any other rights of third parties; and
(7) Any other act in breach of these Terms, etc.

2. If the Company deems that a Participant has engaged in, or may engage in, any of the prohibited acts as prescribed in the preceding paragraph, the Company may, without prior notice to the Participant, disqualify the Participant from the Competition in which the Participant participates, temporarily suspend the Participant from using some or all of the services provided by the Company, withdraw the Participant’s membership, claim damages from the Participant or take any other measures deemed necessary by the Company.

Article 6 Modification of Terms

1. The Company may modify, add or delete any provisions of these Terms from time to time without the approval of Participants.

July 24, 2023