The 1st Big Data Analysis Contest
経済産業省・IoT推進ラボ
  • 締切: 2016年01月22日
  • 応募:2780件 / 127人
  • 総額¥1,000,000相当の賞金・副賞

〜IoTビッグデータから新たな物語を紡ぐのは誰だ?〜
コンテスト趣意
IoT/ビッグデータによる産業活性化を目的として、革新的なデータ分析事例・アイデアを広く公募します。

第一回のテーマは「観光」
2020年東京オリンピックにむけ、訪日外国人観光客の増加が予想され、大きな経済効果が期待されています。
また、地方活性化の点でも観光産業は重要なテーマです。
今回は過去の観光宿泊者数実績データ・SNSデータ・気象データ、ロケーション付きSNSデータ・為替データを中心に、複数部門の分析コンテストを開催いたします。
本コンテストでは、普段接触する機会の少ない産業界の実際的な課題・データを対象にデータ分析を行うことにより、優秀なデータサイエンティストの発掘や、優れた分析者の技術からの学びによる人材育成効果もあわせて期待します。


表彰部門
今回のコンテストでは、14都市全体の観光宿泊者数の予測精度を競う総合部門と、個別のテーマに沿った予測を競う個別部門3部門を設定いたしました。
※総合部門と個別部門に分かれていますが、応募自体は1度で全ての部門の評価が行われます

【総合部門】
総合部門では、予測精度を極限まであげることを目的とします。
全国の主要観光地14都市の観光宿泊者数予測を行っていただきます。
トップモデラーがどのようなアプローチで高精度モデルを構築するのか。
最先端技術の適用を期待します。

評価
・14都市(函館市・仙台市・金沢市・富山市・東京都中央区・箱根町・湯河原町・熱海市・伊勢市・京都市・出雲市・広島市・長崎市・石垣市)それぞれの観光宿泊者数に対する予測精度(A)の高さを評価します。
・想定として最高予測精度を達成した分析者1名を入賞とします。

【個別部門】
<個別部門1 : 地域部門>
本部門では、地域特性に即した予測モデル構築および説明変数の設計を目的とします。
日本全国に存在する観光地は、それぞれに独自の魅力を有し、訪れる人々の動機付けも様々です。
観光地が、より魅力的な価値を提供するために、観光の背景にデータで迫ることは重要と考えられます。
日本の代表的な観光エリア「伊豆・箱根エリア」の観光宿泊者数予測を通じて、同地域の持つどのような特性が観光客を魅了しているのかを解明することに挑戦します。

評価
・伊豆箱根エリア(箱根町・湯河原町・熱海市)の観光客宿泊者数の予測精度(A)およびモデリングアイデア(B)を評価します。
・想定として予測精度上位10名の中で、モデリングアイデアの優れた分析者1名を入賞とします。

<個別部門2 : 交通部門>
本部門では、交通特性に即した予測モデル構築および説明変数の設計を目的とします。
2016年3月に北海道新幹線新青森・新函館北斗間が開業することで注目されるエリア「道南エリア」。
道南エリアの観光需要予測を見据えて、今回は先輩「北陸エリア」の北陸新幹線延長後の観光宿泊者数予測を行っていただきます。
北陸新幹線延長により金沢・東京間は2時間台で接続。大きな経済効果をもたらしました。
一方で、開業前より北陸エリアへの観光数が減った都道府県も存在します。
このような交通がもたらす観光客数への影響を検討します。

評価
・金沢市・富山市への観光宿泊者数予測精度(A)およびモデリングアイデア(B)を評価します。
・想定として予測精度上位10名の中で、モデリングアイデアの優れた分析者1名を入賞とします。

<個別部門3 : インバウンド部門>
本部門では、インバウンド特性に即した予測モデル構築および説明変数の設計を目的とします。
オリンピックイヤー2020年に向け、訪日外国人客は2000万人を見込んでいます。
日本の経済成長・地方活性化の大きなチャンスと考えられます。
本部門では海外からの観光客数を正確に予測することで、機会損失を減らし、おもてなし度を高めるアプローチを期待します。
※インバウンド(inbound)とは、外から入ってくる旅行、一般的に訪日外国人旅行を指します

評価
・14都市への海外からの観光宿泊者数予測精度(A)およびモデリングアイデア(B)を評価します。
・想定として予測精度上位10名の中で、モデリングアイデアの優れた分析者1名を入賞とします。





本コンペティションに参加するためには、SIGNATE.JPサイト利用規約(以下「利用規約」といいます。)に加え、本規約にもご同意いただく必要があります。本規約を熟読し、ご同意のうえ、本コンペティションにご参加ください。ご同意いただいた場合、本規約、「追加事項」として本規約に追加された事項、利用規約及びその他のご同意いただいた規約は、すべて一体の文書として当事者を拘束するものとします。


第1条(定義)

1.本規約において次の各用語の定義は、それぞれ次に定めるとおりとします。

(1)「本サイト」とは、コンペティションを掲載するウェブサイト「SIGNATE(https://signate.jp)」をいいます。
(2)「コンペティション」とは、ホストが開催する本サイト上でのAI開発又はデータ分析の競技会をいいます。
(3)「ホスト」とは、コンペティションの主催者をいいます。ホストは、株式会社SIGNATE(以下、「当社」といいます。)又は当社の顧客企業・提携企業・学校・団体等(以下、「顧客企業等」といいます。)です。
(4)「参加者」とは、会員のうち、コンペティションに参加する方をいいます。
(5)「提出物」とは、コンペティションにおいて提出される分析・予測結果及びレポート等の総称をいいます。
(6)「最終提出物」とは、コンペティション終了時点までに参加者が本サイトの所定のページで指定した提出物をいいます。
(7)「入賞候補者」とは、当社より入賞候補の通知を受けた参加者をいいます。
(8)「最終審査用提出物」とは、当社の指示に従い、入賞候補者が提出する分析・予測モデル、学習データ等をいいます。
(9)「最終審査」とは、入賞候補者の最終提出物及び最終審査用提出物に対して当社が行う、再現性検証を含む検収及び審査をいいます。
(10)「入賞者」とは、当社より入賞の通知を受けた入賞候補者をいいます。
2.本規約において使用される利用規約で定義された用語は、本規約で特に定義されていない限り、利用規約で定義された意味を有するものとします。

第2条(コンペティション)

1.コンペティションに参加することを希望する会員は、本規約に同意の上、各コンペティションにおいて定められている参加条件を満たしている必要があります。会員でない方は、コンペティションに参加することはできません。
2.参加者は、当社がご案内する方法に従い、各コンペティションに参加するものとし、各コンペティションにおいて定められたルールを順守する義務があります。
3.参加者は、各コンペティション期間中に各コンペティションの問題に対する提出物を提出することができ、ホストに対して問題解決方法の提案を各コンペティションの終了期限まで行うことができます。
4.参加者は、各コンペティションで指定される形式に従い、各コンペティションで指定される時点までに最終提出物を提出できるものとします。
5.提出された最終提出物は、各コンペティションで定められた評価方法で評価され、その評価をもって最終順位が決定されるものとします。
6.参加者は、提出物が数量的に評価できるものについては、原則、本サイト上で自己及び他の各参加者の評価結果を確認できるものとします。
7.参加者は、自身の提出物について、その適法性を含め、一切の責任を負うものとします。
8.参加者は、各コンペティションに直接関係のない提出物を提出しないものとします。
9.参加者は、特段の定めがない限り、コンペティションに関わる内容について、コンペティション期間中にホストに対して直接連絡、相談、依頼、勧誘等の活動はできないものとします。
10.参加者は、コンペティションに関して不明点や疑問点がある場合、必ず本サイト上に掲載する当社所定の手続きを通し、当社又は当社が指定する者まで連絡をすることとします。
11.当社は、本条各項で定める参加者の行為に対して、次条に定めるものを除き、一切の報酬その他の対価を支払う義務を有しないものとします。

第3条(懸賞及び権利の帰属)

1.参加者は、懸賞が付与されているコンペティションにおいて懸賞獲得の権利を得るためには、特段の定めがない限り、下記条件を満たす必要があります。

(1)入賞者となること
(2)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及びレポート、分析・予測モデル・アルゴリズム・ソースコード・再現法等の説明書等、及び提出物に関する著作権、特許を受ける権利、ノウハウ等すべての譲渡可能な権利(著作権法第27条及び第28条に定める権利及び特許を受ける権利を含み、以下、「本件権利」といいます。)のホストその他の当該コンペティションにおける権利譲渡対象者への譲渡に同意すること
(3)最終提出物及び最終審査用提出物に含まれるノウハウを権利譲渡対象者が何ら制限なく自らの事業及びその他目的に利用できる権利を専有することに合意すること
(4)権利譲渡対象者に対し、本件権利の著作者人格権を行使しないことに同意すること
(5)前3号への同意その他の合理的な条項を含む、本件権利の譲渡のための契約を権利譲渡対象者と締結すること
(6)当社による当該参加者の本人確認が完了すること
(7)本規約及び利用規約の規定に違反していないこと

2.入賞候補者は、当社より入賞候補の通知を受け取った後、当社の指示に従い、最終審査用提出物を指定期日までに当社に提出し、また、最終提出物及び最終審査用提出物に関する確認・回答事項を指定期日までに当社まで連絡するものとします。当社は、かかる確認・回答事項を前提に、最終審査を行います。指定期日までに当社が満足する確認・回答事項が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあります。
3.入賞候補者は、最終審査の過程で、最終提出物又は最終審査用提出物に修正又は変更の必要があると当社が判断、もしくは追加で確認事項が発生した場合、当社の指示に従い、修正等の必要な項目や確認事項の詳細情報について、指定期日までに対処し又は回答するものとします。指定期日までに当社が満足する対処・回答が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあります。
4.当社は、最終審査を経て入賞者を決定し、その旨の通知をするものとします。

第4条(秘密保持)

1.参加者は、各コンペティションに関して当社から受領する情報やデータ(以下「当社提供情報」といいます。)を秘密情報として取り扱い、第三者には開示しないものとし、かつ、当該コンペティション及び別途当社が指定した目的以外に使用することができないものとします。但し、以下の各号に定める情報は、秘密情報には含まれないものとします。

(1)開示の時点において公知となっていた情報
(2)開示の時点において、既に参加者が所有していた情報(当該参加者が合理的な手段で証明することができる場合に限ります。)
(3)開示の後に、参加者の責めによらず公知となった情報
(4)開示されたいかなる情報にもよらずに独自に開発した情報(入賞対象者の評価対象提出物を除く)
(5)何ら秘密保持義務を負担することなく開示権限ある第三者から合法的に開示された情報(当該参加者が合理的な手段で証明することができる場合に限ります。)

2.参加者は、各コンペティションの終了後、直ちに当社提供情報を消去又は当社に返還するものとします。
3.入賞者は、自己の最終提出物及び最終審査用提出物についても、第1項に定める取扱いと同様の取扱いをするものとします。
4.各コンペティションにおいて、別途秘密情報に関する取り決めがなされる場合は、当該取り決めの規定が本規約の規定に優先するものとします。
5.参加者が本条の規定に違反したことによりホストその他の第三者と当社の間で紛争が生じ、その他当該第三者が当社に対して請求を行った場合、当該参加者は当社が被る一切の損害、損失、費用(弁護士費用を含むがこれに限定されない。)、逸失利益、逸失収入などを補償するものとします。
6.本条規定は、当社提供情報並びに入賞者の最終提出物及び最終審査用提出物に関し、当該コンペティション終了後及び参加者が当社サービスの退会手続きを完了した後5年間は有効に存続します。

第5条(参加者の禁止行為)

1.当社は、コンペティションにおいて、参加者に対し、次に掲げる行為を禁止します。

(1)クラッキングやチート行為、なりすまし等の不正行為
(2)当社が関与しない形で行う、他の参加者又はホスト(当社以外の者に限る。)に対する直接連絡、相談、依頼、勧誘、勧誘対応等の活動
(3)書面その他当社が指定する方法による事前の承諾を得ることなく行う、コンペティションを利用した一切の営利活動(勧誘・スカウト行為、教育事業における第三者への利用等を含む)
(4)参加者としての地位又は参加者としての権利義務の移転、担保設定その他の処分(当社の書面による同意がある場合を除く。)
(5)その他、利用規約に違反する行為

2.参加者が前項に規定する禁止行為を行ったと当社が認める場合、当社は、当該参加者に事前に通知することなく、当該参加者のコンペティションにおける失格処分、当社サービスの一時利用停止、退会処分、損害賠償請求その他当社が必要と判断した措置をとることがあります。

第6条(本規約に基づくサービス提供の変更・中断・終了)

1.当社は、会員に事前の通知をすることなく本規約に基づき提供するサービスの変更又は一時的な中断を行うことができます。
2.当社は、1ヵ月の予告期間をもって会員に通知の上、本規約に基づき提供するサービスの長期的な中断もしくは終了を行うことができます。
3.当社は、本条に基づき当社が行った措置により生じた結果及び損害について、一切の責任を負わないものとします。

第7条(本規約の変更)

1.当社は、会員の了承を得ることなく、本規約を随時変更、追加、削除することができます。

2018年4月1日 制定

以下の各部門テーマにおいて
A:定量評価、B:定性評価
によるデータ分析コンテストを開催します。

A. 定量評価

評価関数
・精度評価は、評価関数「Mean Absolute Scaled Error(MASE)」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。
・目的変数は、各地の宿泊者数となります。





B. 定性評価(レポート)
・レポートでは説明性・納得性を重視します。
・外部データの利用、説明変数の解釈、変数寄与率の解釈、モデリングのストーリー性、探索的分析、可視化表現等を評価します。

各部門テーマと評価指標
■総合部門
  テーマ:総合観光宿泊者数予測
  評価指標:A
■個別部門
  個別部門1 : 地域部門
    テーマ:伊豆箱根エリア観光宿泊者数予測
    評価指標:A、B
  個別部門2 : 交通部門
    テーマ:新幹線開業後観光宿泊者数予測
    評価指標:A、B
  個別部門3 : インバウンド部門
    テーマ:訪日外国人観光客宿泊者数予測
    評価指標:A、B
 
 個別部門については、予測精度上位10位以内で、モデリングアイデアの優れた分析者1名様を審査のうえ入賞者といたします。

心構え
・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨むこと。

システムの利用
・利用アカウントは1人につき1つまで。ただし、アカウントが1つであればチームでの参加も可能。

情報の取り扱い
・同じチーム以外の参加者と本コンテストの予測に関連するデータ・ソースコードを共有する行為は禁止。

データの利用
・第三者の権利を侵害しない、無償で誰でも手に入るオープンなデータに限り、利用可能。
・ある時点を予測をする時は、その時点以前に確定している情報のみ使用可能。
・但し、予測対象日当日の情報は利用可能とします。

実装方法
・ソースコードは、以下のように、前処理、学習、予測、の3つに分け、それぞれを実行すれば処理が進むように実装すること。
 ①Preprocessing
  提供データを読み込み、データに前処理を施し、モデルに入力が可能な状態でファイル出力するモジュール。get_train_dataやget_test_dataのように、学習用と評価用を分けて、前処理を行う関数を定義してください。
 ②Learning
  ①で作成したファイルを読み込み、モデルを学習するモジュール。学習済みモデルや特徴量、クロスバリデーションの評価結果を出力する関数も定義してください。
 ③Predicting
  ①で作成したテストデータ及び②で作成したモデルを読み込み、予測結果をファイルとして出力するモジュール。
2015年12月15日(火)コンペ開始
2016年1月22日(金)コンペ終了

応募の流れ


定量評価フォーマット
・部門毎に分かれていますが、応募フォームは1つのみです。
・特定の部門だけに応募をしたい場合も、日付と全ての予測値が揃ったフォーマット(全29カラム)でご応募下さい。(該当カラムのみに数値をいれ、他カラムは適当な値とする等)
・提出ファイルにおける各部門に対応するカラムは以下です。

 総合部門:1~14カラム
 個別部門1(地域部門):4,5,8カラム
 個別部門2(交通部門):6,7カラム
 個別部門3(インバウンド部門):15~28カラム

※詳しい提出フォーマットについては、ダウンロードページをご参照下さい。


レポート
・個別部門での評価においては、モデリングアイデアを評価するため、モデリングに関するレポートを提出いただきます。
・コンペ開催期間中に、最低1回のレポートを提出いただかないと、個別部門の審査対象となりません。
・レポートファイルの拡張子は .ppt .pptx .doc .docx .pdf です。
・レポートのフォーマットは基本的に自由ですが、データダウンロードページにある、提出レポート概要(report.pdf)を参考に作成し応募してください。


■各部門賞 各部門入賞者1名にいずれか1つの賞が授与されます。

<総合部門>
【デジタルマーケティング賞】
 ・協賛:ソフトバンク株式会社
 ・賞金10万円

<個別部門1(地域)>
【観光予報プラットフォーム賞】
 ・協賛:観光予報プラットフォーム
 ・神奈川県湯河原温泉、お好きな旅館に2名様ご招待
 ※対象は宿泊代(1泊2食)に限り、上限は税込で総額10万円までとなります。
 ※宿泊代以外、交通費・飲み物代などはお客様の負担となります。
 ※対象期間は受賞日から2016年4月25日までの期間となります。
 ※希望日が満室の場合があります。

<個別部門2(交通)>
【トレジャーデータ賞】
 ・協賛:トレジャーデータ株式会社
 ・IoT分野におけるセンサーデータや各種ログデータを蓄積・分析するためのプラットフォーム、
  トレジャーデータサービス スタンダードプラン1年間分を無償にてご提供、ご利用いただけます。
 ・賞金10万円

<個別部門3(インバウンド)>
【OBC賞】
 ・協賛:株式会社オービックビジネスコンサルタント
 ・Surface Pro 4 - 128GB / Intel Core i5
 ・Surface Pro 4 Type Cover (ブラック)


■入賞者賞 入賞者全員に賞が授与されます。
※産総研AIセンター賞は入賞者とAIセンターとの希望・調整・検討により決定します。

【さくらインターネット賞】
 ・協賛:さくらインターネット
 ・「さくらのクラウド」30万円分(約3ヶ月間相当)を無償提供
 ※手続きの詳細は、コンテスト終了後、該当する方々にご連絡いたします。

【マイクロソフト賞】
 ・協賛:日本マイクロソフト株式会社
 ・開発に必要な開発ツールやクラウド環境、技術サポートを
  3年間無償で提供するプログラム「BizSpark」を提供
 ・3年間で最大27,000USドル分の Microsoft Azure を無償提供
 ・70万円相当の Visual Studio Enterprise with MSDN を無償提供

【プロフェッショナルデータサイエンティスト賞】
 ・協賛:株式会社オプトホールディング
 ・プロフェッショナルデータサイエンティスト認定(DA Certificated Professional Data Scientist)
 ・賞金:5万円

【産総研AIセンター賞】
 ・協賛:国立研究開発法人 産業技術総合研究所 人工知能研究センター
 ・産業技術総合研究所人工知能研究センターの計算資源・人的資源・データ・プログラムが活用可能
 ・産業技術総合研究所人工知能研究センターによる技術サポート (*注)
 ・客員研究員・技術研修員のポジションを検討
  *注:(国)産業技術総合研究所の技術相談、技術研修等の制度を用いて技術サポートを行う予定です。
     具体的にどのような受入形態・期間等になるかは、受賞 者と人工知能センターとの相談により決定します。