The 3rd Big Data Analysis Contest
IoT推進ラボ、経済産業省、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)
  • 締切: 2017年12月21日
  • 応募:2153件 / 131人
  • 総額¥1,700,000相当の賞金・商品

コンテスト趣意

IoT/ビッグデータによる産業活性化を目的として、革新的なデータ分析事例・アイデアを広く公募します。

第3回のテーマは「電力・気象」

日本の主要なエネルギー資源である石油、石炭などの化石燃料は「限りある」資源です。一方、太陽光や風力、地熱などの再生可能エネルギー資源は環境にやさしいだけでなく、枯渇の心配がないものとして注目されています。

しかし、再生可能エネルギーの発電量は気象条件に左右されます。そのため、電力会社は常に発電量を正確に予測し、再生可能エネルギーの利用促進と電力の安定供給を実現しなければなりません。

今回、分析の対象となるのは、全国3カ所の太陽光発電の発電量及び天気予報やアメダスなどの気象データです。

本コンテストでは、これらのデータを基に、電力の安定供給・効率利用を目的とした太陽光発電の発電量予測にチャレンジしてもらいます。また新しい試みとして、ビッグデータ分析で重要な技術である「可視化」の課題も設定しました。

普段接触する機会の少ない産業界の実際の課題・データを対象に分析することにより、優秀なデータサイエンティストの発掘や優れた分析者の技術からの学びによる人材育成効果も合わせて期待します。


開催部門
「①予測部門」と「②可視化部門」の2部門を開催します。いずれか1部門のみでの参加も可能です。

部門①予測部門②可視化部門
課題太陽光発電所の発電量の予測データの可視化を活用したストーリーテリング
データ発電量・気象情報発電量・気象情報(+独自に収集したデータ)
懸賞/賞金精度賞
金:賞金20万円*1+家電10万円相当*2
+トロフィー*12
銀:賞金20万円*3
銅:賞金10万円+家電*4
アイデア賞
金:賞金20万円*5
+トロフィー*12
銀:賞金20万円*6
銅:賞金10万円*7
インフォグラフィック賞
金:賞金20万円*8+トロフィー*12
銀:賞金20万円*9
銅×2:賞金10万円*10 *11
提出物予測モデル + レポートHTMLファイルやポスター等
評価精度精度上位 + レポートの審査成果物の審査


*1:京セラ株式会社/*2:シャープ株式会社 /*3:株式会社日立製作所/*4:三菱電機株式会社/*5:パナソニック株式会社/*6:さくらインターネット株式会社 /*7:株式会社NTTドコモ/*8:株式会社ウェザーニューズ/*9:ウイングアーク1st株式会社/*10:Tableau Japan株式会社/*11:日本オラクル株式会社/*12:株式会社オプトホールディング

応募方法コンテスト開催期間中
1.サイトの説明や利用規約を読み、目的やルールを理解しましょう。会員登録がまだの方は、まずは会員登録しましょう。
2.「データをダウンロード」ボタンから、データを取得しましょう。
3.分析が完了したら、サイト内に設置された各ボタンから結果をアップロードしましょう。
   ①予測部門の予測結果・・・「解析結果を送信」ボタン
    ※1日5回まで。何度も挑戦しましょう。
   ①予測部門のレポート・・・「①予測部門 レポートを送信」ボタン
    ※コンテスト終了までに作成し、投稿しましょう。
    ※複数回投稿できますが、最後に投稿した1つのみが評価対象になります。
   ②可視化部門の成果物・・・「②可視化部門 成果物を送信」ボタン
    ※複数回投稿できますが、最後に投稿した1つのみが評価対象になります。

コンテスト終了後
1.予測部門・精度賞の入賞候補者には通知が届きます。通知がきたら、期日内に必要書類等を提出しましょう。
  モデルの再現性が確認できないと入賞取り消しとなる場合があるので、パラメータなどはこまめにメモしておきましょう。
2.審査にて決定した全入賞者には、入賞通知・表彰式の案内が届きます。
  表彰式では、金賞の受賞者には、分析内容のプレゼンテーションを行っていただきます。

①予測部門
本部門は、太陽光発電所の発電量の予測モデル構築及び説明変数の設計を目的とします。

気象情報(アメダス観測値、地上気象観測値、気象予報)や過去の発電量を学習データとして、3箇所の太陽光発電所(浮島発電所、扇島発電所、米倉山発電所)の、2016/1/1~2017/3/31の30分単位の発電量(kWh)を予測していただきます。

ただし、ある日を予測をする時は、予測したい日の前日20時に確定している情報のみ使用できます。
(例)2016年8月23日を予測する場合
   ・発電量データ   ・・・インデックスが2016年8月22日20時以前のデータが使用可
   ・アメダスデータ  ・・・インデックスが2016年8月22日20時以前のデータが使用可
   ・地上気象観測データ・・・インデックスが2016年8月22日20時以前のデータが使用可
   ・気象予報データ  ・・・インデックスが2016年8月23日以前のデータが使用可
    ※気象予報データのインデックスは予報の対象日を表し、予報は前日17時(2016年8月22日17時)に発表されるため

レポート
・レポートの提出は必須です。未提出の場合は、精度賞においても評価の対象外となりますのでご注意ください。

②可視化部門
本部門は、データの可視化を活用したストーリーテリングを目的とします。

読み手の共感を得ることを意識し、データを俯瞰した上で取り組む対象の問題を設定し、因果推論等の分析結果やそこから得られた示唆や価値等、データから得られた一連のストーリーを、可視化を活用して分かりやすく視覚的に表現してください。

提出物
ブラウザで閲覧可能なHTMLファイル(関連ファイル一式)、またはPPTやPDFなどによるポスターやレポート等、特別な環境を用意することなく閲覧が可能なものであれば、表現方法は自由です。ただし、作品タイトル、コンセプト、利用データ、メッセージ、は提出物に含めてください。

テーマの例
・ゲリラ豪雨はいかにして発生しどのような影響を及ぼすか
・熱中症を引き起こす地理的環境・気象コンディションの可視化と予防策の検討
・キャベツの育成に適した条件及び価格に影響を及ぼす気象状況の解明
・企業業績や株価等と気象との関係性の考察

ツールについて
コンテスト期間中に利用できるビジュアル分析ツールもご用意していますので、是非ご活用下さい。
利用方法は、データのダウンロードページ の最下部に記載しています。

Oracle Data Visualization Desktop(提供:日本オラクル株式会社)
Tableau Public(提供:Tableau Japan株式会社)
MotionBoard(提供:ウイングアーク1st株式会社)

提供データ概要
分析用データとして、以下が与えられます。(※項目等の詳細はデータのダウンロードページで確認できます。)

データ種別概要提供元
発電量データ浮島発電所、扇島発電所、米倉山発電所での発電量(kwh)を10分単位で統計したデータ(2012/1/1~2015/12/31)東京電力ホールディングス株式会社
気象予報データ神奈川東部、山梨中・西部の気象予報(2012/1/1〜2017/3/31)気象庁
アメダスデータ全国1252地点のアメダスでの観測値を10分単位で統計したデータ(2012/1/1〜2017/3/31)及び観測所の地点情報気象庁
地上気象観測データ全国155地点の気象観測所での観測値を10分単位で統計したデータ(2012/1/1〜2017/3/31)及び観測所の地点情報気象庁


各太陽光発電所の概要


施設名浮島発電所扇島発電所米倉山発電所
所在地神奈川県川崎市川崎区浮島町神奈川県川崎市川崎区扇島山梨県甲府市下向山町
最大出力7,000kW13,000kW10,000kW
敷地面積約11ha約23ha約12.5ha
太陽電池 種類単結晶シリコン多結晶シリコンCIS薄膜化合物




本コンペティションに参加するためには、SIGNATE.JPサイト利用規約(以下「利用規約」といいます。)に加え、本規約にもご同意いただく必要があります。本規約を熟読し、ご同意のうえ、本コンペティションにご参加ください。ご同意いただいた場合、本規約、「追加事項」として本規約に追加された事項、利用規約及びその他のご同意いただいた規約は、すべて一体の文書として当事者を拘束するものとします。


第1条(定義)

1.本規約において次の各用語の定義は、それぞれ次に定めるとおりとします。

(1)「本サイト」とは、コンペティションを掲載するウェブサイト「SIGNATE(https://signate.jp)」をいいます。
(2)「コンペティション」とは、ホストが開催する本サイト上でのAI開発又はデータ分析の競技会をいいます。
(3)「ホスト」とは、コンペティションの主催者をいいます。ホストは、株式会社SIGNATE(以下、「当社」といいます。)又は当社の顧客企業・提携企業・学校・団体等(以下、「顧客企業等」といいます。)です。
(4)「参加者」とは、会員のうち、コンペティションに参加する方をいいます。
(5)「提出物」とは、コンペティションにおいて提出される分析・予測結果及びレポート等の総称をいいます。
(6)「最終提出物」とは、コンペティション終了時点までに参加者が本サイトの所定のページで指定した提出物をいいます。
(7)「入賞候補者」とは、当社より入賞候補の通知を受けた参加者をいいます。
(8)「最終審査用提出物」とは、当社の指示に従い、入賞候補者が提出する分析・予測モデル、学習データ等をいいます。
(9)「最終審査」とは、入賞候補者の最終提出物及び最終審査用提出物に対して当社が行う、再現性検証を含む検収及び審査をいいます。
(10)「入賞者」とは、当社より入賞の通知を受けた入賞候補者をいいます。
2.本規約において使用される利用規約で定義された用語は、本規約で特に定義されていない限り、利用規約で定義された意味を有するものとします。

第2条(コンペティション)

1.コンペティションに参加することを希望する会員は、本規約に同意の上、各コンペティションにおいて定められている参加条件を満たしている必要があります。会員でない方は、コンペティションに参加することはできません。
2.参加者は、当社がご案内する方法に従い、各コンペティションに参加するものとし、各コンペティションにおいて定められたルールを順守する義務があります。
3.参加者は、各コンペティション期間中に各コンペティションの問題に対する提出物を提出することができ、ホストに対して問題解決方法の提案を各コンペティションの終了期限まで行うことができます。
4.参加者は、各コンペティションで指定される形式に従い、各コンペティションで指定される時点までに最終提出物を提出できるものとします。
5.提出された最終提出物は、各コンペティションで定められた評価方法で評価され、その評価をもって最終順位が決定されるものとします。
6.参加者は、提出物が数量的に評価できるものについては、原則、本サイト上で自己及び他の各参加者の評価結果を確認できるものとします。
7.参加者は、自身の提出物について、その適法性を含め、一切の責任を負うものとします。
8.参加者は、各コンペティションに直接関係のない提出物を提出しないものとします。
9.参加者は、特段の定めがない限り、コンペティションに関わる内容について、コンペティション期間中にホストに対して直接連絡、相談、依頼、勧誘等の活動はできないものとします。
10.参加者は、コンペティションに関して不明点や疑問点がある場合、必ず本サイト上に掲載する当社所定の手続きを通し、当社又は当社が指定する者まで連絡をすることとします。
11.当社は、本条各項で定める参加者の行為に対して、次条に定めるものを除き、一切の報酬その他の対価を支払う義務を有しないものとします。

第3条(懸賞及び権利の帰属)

1.参加者は、懸賞が付与されているコンペティションにおいて懸賞獲得の権利を得るためには、特段の定めがない限り、下記条件を満たす必要があります。

(1)入賞者となること
(2)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及びレポート、分析・予測モデル・アルゴリズム・ソースコード・再現法等の説明書等、及び提出物に関する著作権、特許を受ける権利、ノウハウ等すべての譲渡可能な権利(著作権法第27条及び第28条に定める権利及び特許を受ける権利を含み、以下、「本件権利」といいます。)のホストその他の当該コンペティションにおける権利譲渡対象者への譲渡に同意すること
(3)最終提出物及び最終審査用提出物に含まれるノウハウを権利譲渡対象者が何ら制限なく自らの事業及びその他目的に利用できる権利を専有することに合意すること
(4)権利譲渡対象者に対し、本件権利の著作者人格権を行使しないことに同意すること
(5)前3号への同意その他の合理的な条項を含む、本件権利の譲渡のための契約を権利譲渡対象者と締結すること
(6)当社による当該参加者の本人確認が完了すること
(7)本規約及び利用規約の規定に違反していないこと

2.入賞候補者は、当社より入賞候補の通知を受け取った後、当社の指示に従い、最終審査用提出物を指定期日までに当社に提出し、また、最終提出物及び最終審査用提出物に関する確認・回答事項を指定期日までに当社まで連絡するものとします。当社は、かかる確認・回答事項を前提に、最終審査を行います。指定期日までに当社が満足する確認・回答事項が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあります。
3.入賞候補者は、最終審査の過程で、最終提出物又は最終審査用提出物に修正又は変更の必要があると当社が判断、もしくは追加で確認事項が発生した場合、当社の指示に従い、修正等の必要な項目や確認事項の詳細情報について、指定期日までに対処し又は回答するものとします。指定期日までに当社が満足する対処・回答が得られない場合、当社は、当該入賞候補者を最終審査の対象外とすることがあります。
4.当社は、最終審査を経て入賞者を決定し、その旨の通知をするものとします。

第4条(秘密保持)

1.参加者は、各コンペティションに関して当社から受領する情報やデータ(以下「当社提供情報」といいます。)を秘密情報として取り扱い、第三者には開示しないものとし、かつ、当該コンペティション及び別途当社が指定した目的以外に使用することができないものとします。但し、以下の各号に定める情報は、秘密情報には含まれないものとします。

(1)開示の時点において公知となっていた情報
(2)開示の時点において、既に参加者が所有していた情報(当該参加者が合理的な手段で証明することができる場合に限ります。)
(3)開示の後に、参加者の責めによらず公知となった情報
(4)開示されたいかなる情報にもよらずに独自に開発した情報(入賞対象者の評価対象提出物を除く)
(5)何ら秘密保持義務を負担することなく開示権限ある第三者から合法的に開示された情報(当該参加者が合理的な手段で証明することができる場合に限ります。)

2.参加者は、各コンペティションの終了後、直ちに当社提供情報を消去又は当社に返還するものとします。
3.入賞者は、自己の最終提出物及び最終審査用提出物についても、第1項に定める取扱いと同様の取扱いをするものとします。
4.各コンペティションにおいて、別途秘密情報に関する取り決めがなされる場合は、当該取り決めの規定が本規約の規定に優先するものとします。
5.参加者が本条の規定に違反したことによりホストその他の第三者と当社の間で紛争が生じ、その他当該第三者が当社に対して請求を行った場合、当該参加者は当社が被る一切の損害、損失、費用(弁護士費用を含むがこれに限定されない。)、逸失利益、逸失収入などを補償するものとします。
6.本条規定は、当社提供情報並びに入賞者の最終提出物及び最終審査用提出物に関し、当該コンペティション終了後及び参加者が当社サービスの退会手続きを完了した後5年間は有効に存続します。

第5条(参加者の禁止行為)

1.当社は、コンペティションにおいて、参加者に対し、次に掲げる行為を禁止します。

(1)クラッキングやチート行為、なりすまし等の不正行為
(2)当社が関与しない形で行う、他の参加者又はホスト(当社以外の者に限る。)に対する直接連絡、相談、依頼、勧誘、勧誘対応等の活動
(3)書面その他当社が指定する方法による事前の承諾を得ることなく行う、コンペティションを利用した一切の営利活動(勧誘・スカウト行為、教育事業における第三者への利用等を含む)
(4)参加者としての地位又は参加者としての権利義務の移転、担保設定その他の処分(当社の書面による同意がある場合を除く。)
(5)その他、利用規約に違反する行為

2.参加者が前項に規定する禁止行為を行ったと当社が認める場合、当社は、当該参加者に事前に通知することなく、当該参加者のコンペティションにおける失格処分、当社サービスの一時利用停止、退会処分、損害賠償請求その他当社が必要と判断した措置をとることがあります。

第6条(本規約に基づくサービス提供の変更・中断・終了)

1.当社は、会員に事前の通知をすることなく本規約に基づき提供するサービスの変更又は一時的な中断を行うことができます。
2.当社は、1ヵ月の予告期間をもって会員に通知の上、本規約に基づき提供するサービスの長期的な中断もしくは終了を行うことができます。
3.当社は、本条に基づき当社が行った措置により生じた結果及び損害について、一切の責任を負わないものとします。

第7条(本規約の変更)

1.当社は、会員の了承を得ることなく、本規約を随時変更、追加、削除することができます。

2018年4月1日 制定

①予測部門

評価関数
・精度評価は、評価関数「weighted mean absolute error(WMAE:重み付き平均絶対誤差)」を使用します。
・評価値は0以上の値をとり、精度が高いほど小さな値となります。
・重みは、浮島、扇島、米倉山それぞれで、およそ0.4、0.3、0.3 としています(発電量に応じた補正)。
・アイデア評価では、変数の設計やモデリングの工夫点等を厳正な審査により評価します。 




最終順位の決定
1.コンペ最終日までの評価(暫定評価)は評価用データセットの一部で評価し、コンペ終了後の評価(最終評価)は評価用データセットの残りの部分で評価します。
 スコアボードはコンペ終了時に自動的に最終評価に切り替わり、それを元に最終順位を決定します。このため、開催中と終了後では順位が大きく変動する場合もあります。

2.スコアが同値の場合は、早い日時でご応募いただいた参加者を上位とします。

3.コンペ終了後、入賞候補者には以下を提出していただきます。
 - 予測モデルのソースコード
 - 学習済モデル
 - 解説書(実行環境、実行時間*1、予測結果の再現手順*1、乱数シード*2、特徴量の説明や寄与度*3、モデリング手法、工夫点、得られた示唆等)
   *1 : 前処理部分、学習部分、予測部分それぞれに対して明記
   *2 : Random Forest等の乱数を利用した手法を用いた場合
   *3 : 算出が可能な手法を用いた場合
 - アンケート(参加の動機、費やした時間、ご意見・感想等)

4.再現性検証期間中、以下いずれかに該当する場合は入賞資格を失います。このため、提出前に必ず問題がないことを確認してください。
 - 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
 - 参加条件やルールを満たしていない
 - プログラムが動作しない
 - 最終提出した予測値と学習済モデルから出力される予測値が一致しない

5.入賞候補者が入賞資格を失った場合は、スコアが次点の方が繰り上がり、新たな入賞候補となります。全入賞者の確定をもって、それを最終順位とします。


②可視化部門
着眼点、表現力、デザイン、納得性等を厳正な審査により評価します。

審査員の紹介(敬称略、五十音順)
越塚 登
気象ビジネス推進コンソーシアム 会長, 東京大学大学院情報学環 教授
小林 功
東京電力ホールディングス株式会社 リニューアブルパワー・カンパニー カンパニープレジデント
小山田 耕二
京都大学 学術情報メディアセンター コンピューティング研究部門 教授, 自然科学研究機構 客員教授, 産業技術総合研究所 人工知能研究センター 客員研究員, 日本学術会議会員
齊藤 秀
株式会社オプト 最高解析責任者CAO, 筑波大学人工知能科学センター客員教授, 理化学研究所 革新知能統合研究センター 客員研究員, 国立がん研究センター研究所 客員研究員, 統計数理研究所 客員准教授
杉山 将
理化学研究所 革新知能統合研究センター センター長, 東京大学 大学院新領域創成科学研究科 複雑理工学専攻 教授, 産業技術総合研究所 人工知能研究センター 客員研究員
竹内 義明
気象庁総務部参事官
辻井 潤一
産業技術総合研究所 フェロー, 産業技術総合研究所 人工知能研究センター研究センター長
樋口 知之
情報・システム研究機構 理事, 統計数理研究所長, 総合研究大学大学院統計科学専攻 教授

心構え
・企業課題の達成、社会問題の解決、研究成果の共有等、大前提となる目的に合わせ、実用性を意識したアプローチで臨むこと。

システムの利用
・利用アカウントは1人につき1つまで。ただし、アカウントが1つであればチームでの参加も可能。

情報の取り扱い
・同じチーム以外の参加者と本コンペの予測に関連するデータ・ソースコードを共有する行為は禁止。

データの利用
・(①予測部門)提供するデータ以外のデータを用いてモデルを学習することは禁止。ただし、時間的な概念から得られる曜日等の自然情報や、上記各太陽光発電所の概要、発電所の立地や特性から導出・入手が可能な一般情報は利用可能。
・(②可視化部門)独自にデータを収集し、提供データと組み合わせて利用することは可能。ただし、第三者の権利を侵害しない、オープンに取得可能なデータのみ。

実装方法
・モデルの学習に利用するツールは、オープン且つ無料なもの(python, R 等)に限定。
・未来の情報は利用禁止。ある日を予測をする時は、予測したい日の前日20時に確定している情報のみ利用可。 
・提案した方法が一般的な環境において追加費用負担を伴わず、再現及び継続使用可能であることを保証すること。
 同じフォーマットで、異なるデータを入力した場合にも同様なロジックで予測できなければなりません。
 例えば、根拠無く局所的に予測値を修正することは禁止となります。
 (基準について不安がある場合は、事務局までお問い合わせください)
2017年10月2日(月) コンテスト開始
2017年12月21日(木) コンテスト終了
2017年12月25日(月) 予測モデルの提出締切 ※連絡を受け取った方
2018年2月8日(木) 検収・審査にて入賞者を決定
2018年3月6日(火) 入賞者表彰@ベルサール東京日本橋(中央区日本橋2-7-1東京日本橋タワー)

主催:IoT推進ラボ、経済産業省、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)
後援:文部科学省、気象庁、一般社団法人太陽光発電協会、気象ビジネス推進コンソーシアム、筑波大学 人工知能科学センター