COVID-19 Challenge

日本国内のCOVID-19罹患者と患者間の関係データに関する、マシンリーダブルかつデータ分析に適した最大規模のデータセットの構築と、
そのデータの分析により導かれる感染実態等のインサイト抽出を目指すプロジェクト

What is "COVID-19 Challenge"?

現在、新型コロナウイルス感染症(COVID-19)が世界中で猛威を振るい、私たちの暮らしや経済活動に深刻な影響を及ぼしています。
感染症対策には、罹患者に関するデータを迅速に収集し公開することが極めて重要です。
現時点における日本国内のCOVID-19に関する情報は、国や自治体などで配信方針がバラバラであり、
テキスト形式やPDF形式、画像形式などの非構造データで配信されているものも多く、
一元的・網羅的でマシンリーダブルかつデータ分析可能な状態になっていないのが実情です。

また、罹患者数などの統計データだけではなく、罹患者一人一人に関する感染背景や症状など、
できるだけ詳細な情報を網羅的に収集し、データ分析が可能な状態で共有することは、爆発的感染の抑止対策に有用であると考えられます。
しかしながら、医療システムの崩壊を避けるべく厚生労働省や自治体、専門家の方々が日々、私たちのために尽力いただいている中、
しかも、過去に例を見ない感染症対応の渦中に最適な情報配信方式をデザインし実行することは、現実問題として非常に難しいのではないでしょうか?
平素、SIGNATEでは、AI・データサイエンスの知見や技術を持つ多数の方々にご登録いただき、技術課題にチャレンジいただいております。

そこで、市民科学としてデータ分析の力でCOVID-19の収束に少しで役に立つ活動ができればと考え「COVID-19チャレンジ」を企画しました。
データの収集・分析を通じて、COVID-19の実態把握や気づきを得ること、みんなで自分の行動が世の中を変えることを実感できれば理想的です。
本プロジェクトにおいて、どこまで有用なインサイトが得られるかは未知ですが、
活動を通じて今後のパンデミック対策に有用なデータの持ち方やあるべき配信フォーマットの議論につながればと考えます。
皆様のご協力をいただければ幸いです。

Phase 1Phase 2

データセットの構築

日本国内のCOVID-19罹患者数と患者間の関係データに関する、マシンリーダブルかつデータ分析可能な最大規模のデータセットの構築を目指します。

参加する
記入済み罹患者数 記入セル数

Phase 2Phase 2

感染実態に迫るインサイト抽出

フェーズ2では、フェーズ1のデータセットを用い、様々な統計学的手法によるデータ分析を実施し、感染実態に迫るインサイト抽出を目指します。

参加する
SIGNATE COVID-19 Challenge 基本統計ダッシュボード

SIGNATE COVID-19 Challenge 基本統計ダッシュボード

Phase 3Phase 2

国内全体の累積罹患者数予測

フェーズ3では、フェーズ1で構築されたデータと、フェーズ2で得られた知見やダッシュボードを活用し、有用な罹患者数推移予測手法の検討、および予測に有効な特徴の探索を目指します。
予測対象期間を2週間毎に設定し、図のように数ラウンドに分けて継続的に開催する予定です。各ラウンドでは、終了日の2週間先までを予測し、その後発表された実際の新規罹患者数を元に評価を確定します。

参加する
SIGNATE COVID-19 Phase3 schedule

※ 各ラウンドの日程は予告なく変更される場合があります。

COVID-19 ChallengeはCOVID-19の
日本国内収束(新規罹患者が 0 または 社会的受容)まで行います

本分析に用いたデータセット signate covid-19 datasetは、現在、収集途中のものであり、データの正確性を保証するものではありません。

また、本データセットは基本的に厚労省・自治体等の報道における症例データに基づいて作成されており、
各機関が発表している統計データと一致しないことがあります。予めご了承ください。

Sponsors&Partners

協賛企業

  • ウェザーニューズ
  • 観光予報プラットフォーム
  • connectome.design
  • ジャッグジャパン株式会社
  • Data Roboto
  • Ledge.ai
  • AINOW

Contributors

貢献いただいた方

貢献いただいた方の人数:214

Forum

フォーラム