趣意

「Flattening the curve」(曲線をたいらにする)とは、感染症患者のオーバーシュート(爆発的拡大)を防ぎ、感染者数のピークを抑えることで医療システムの崩壊を避けるスローガンです。急激な感染者数の増加に伴い多数の人々が一気に病院に押しかけてしまうと、病院の対応能力を越えてしまい、感染症以外の患者さんへの対応も含め医療システムが崩壊する可能性があります。イタリアでの死者数が多いのもこの現象によるものです。医療機関で受け入れ可能な感染規模を維持し続けることにより、治療薬やワクチン開発の時間を稼ぐことができます。


オーバーシュート対策として有効な考え方が「social distancing」(社会距離戦略)です。社会距離戦略は、ウィルス感染を防ぐために人と人の間に安全な距離をとる方策を意味します。

例えば
・人が集まるイベントを自粛
・学校を休校にする
・在宅勤務に切り替える
・人混みを避け、人との接触を避ける
などがあります。

海外、特にヨーロッパでは、外出禁止令が出されるなど、厳しい対応もみられます。日本では、強制力はないものの「不要不急」の外出を控えるよう自粛要請がなされています。さらに、外出をする場合は、3つの「密」を避けるように呼びかけています。
・換気の悪い密閉場所
・多数が集まる密集場所
・間近で会話や発声をする密接場所

すでに、ライブハウスやスポーツジムなど、クラスター発生の実績がよく知られている場所については、実施の自粛や注意して利用することで対応が可能です。しかし、あまり知られていない潜在的なリスクを持つ場所や逆に安全にも関わらず過度に自粛する状況が起きている可能性があります。各人が正しく判断し行動に移すためには、現状のような曖昧な状態ではなく、具体的な事実を俯瞰して理解することが重要と考えます。

そこで、Phase2では、Phase1で得られたデータをもとに、社会距離戦略の意思決定に資する(少なくとも議論の題材になる)データ分析を目指します。データ分析の過程における、不足データや分析困難なフィールドについては、Phase1にフィードバックし、データ収集や構造化を進めていきます。ただし、報道ベースのデータ収集では情報精度に限界がありますので、確実に実施可能(新規データ追加に関しては収集可能であることが確認されているもの)なもののみフィードバック願います。

また、Phase1のデータ設計・収集は継続して進行中です。マスターデータ等の整理や外部データとの統合を検討しています。よって、データ構造が予告なく変更になることがあります。予めご了承願います。
Phase1 SIGNATE COVID-2019 Dataset
※アクセス負荷の軽減等を目的に、データセットのスナップショット(閲覧専用)も毎日0:00-1:00の間に取得しています。分析の際に、必要に応じてこちらも活用ください。

分析結果の外部公開に際しては以下を記載いただくか、URL<https://signate.jp/competitions/261#misc>を引用願います。

本分析に用いたデータセットsignate covid-19 datasetは、現在、収集途中のものであり、データの正確性を保証するものではありません。また、本データセットは基本的に厚労省・自治体等の報道における症例データに基づいて作成されており、各種機関が発表している統計データと一致しないことがあります。予めご了承ください。

データ分析に際しては、外部データやツールの活用も検討願います。SIGNATE COVID-19 Challengeに協賛いただいている組織はコチラになります。通常有償のデータやツールも本チャレンジのために無償でご提供いただいております。ご活用ください。


期待する分析例:感染状況の把握

【基礎統計】
都道府県別、年代別、性別、職業、各種フラグ、濃厚接触者等、またその組み合わせによる各種統計実態(総数や一人当たり)およびトランザクションによる時間的推移を検討。可視化による情報の俯瞰的理解、層別比較や海外データとの比較によるインサイトを抽出。
・罹患者数
・死亡者数
・医療機関受診回数
・検査回数(COVID-19、インフルエンザ、CT、etc)
・自宅待機日数
・利用した公共交通分布
・クラスターサイズ
・体温分布
・症状分布
・発熱観察日、受診日、 公表日、回復日、死亡日による期間分析
・海外由来、国内感染の状況
など

【罹患者関係性】
感染者同士や場所、感染経路と拡大など、罹患者属性や地理的属性、時間的推移を検討。可視化による情報の俯瞰的理解、層別比較や海外データとの比較によるインサイトを抽出。
・罹患者ネットワーク
・罹患者と場所のネットワーク
・ネットワークトポロジー、時間的変化
など

【インサイト】
上記のような分析の結果、得られたインサイトや仮説、そこから導かれるアクション等を検討願います。目的は感染者爆発の抑制に貢献するインサイト抽出です。必ずしも高度な可視化技術・統計解析技術を求めません(もちろん、それらも大歓迎です)。また、直接課題解決につながらなくても、できる範囲で分析を蓄積していきたいと考えます。
例えば、非常に簡単な分析例「日本においても海外と同様、新型コロナウィルスの罹患者・死者は男性の方が女性よりも多い。」をフォーラムに示します。気軽に参加しましょう!

【ギャラリー】
SIGNATE COVID-19 Challengeの取り組みで創作された分析例(可視化・ダッシュボード、インサイト・仮説など)はこちらにリストしていきます。

<可視化>
・SIGNATE:SIGNATE COVID-19 Challenge 基本統計ダッシュボード
・Naoko Ozakiさん:SIGNATE #COVID19 Cases Dashbord
・Su Weiさん:クラスターネットワーク
・渡辺 知恵美さん:クラスタの連鎖状況の可視化
・Yuki Nakamuraさん:都道府県別の感染者傾向

<インサイト>
・SIGNATE:日本においても海外と同様、新型コロナウィルスの罹患者・死者は男性の方が女性よりも多い。


<主催>
●株式会社SIGNATE
https://signate.jp/covid-19-challenge/

※以下の企業・団体様のご協力、応援に心より感謝申し上げます。


<データ・ツール協力>※敬称略
●株式会社ウェザーニューズ
株式会社ウェザーニューズはこの活動を応援しています。また、当社も、ウィルスの活動度と気象に関係性を調べる方向けにデータを公開しておりますので、ぜひご活用ください。
https://weathernews.jp/s/covid19-weather/

観光予報プラットフォーム推進協議会
観光予報プラットフォーム推進協議会はこの活動を応援しています。また、私たちも、「訪日外国人の宿泊者の推移」ダッシュボード等を公開しておりますので、ぜひご覧ください。
・観光予報:https://kankouyohou.com/
・観光予報DS:https://learning-steam-ds.kankouyohou.com/
・経済産業省「未来の教室」:https://www.learning-innovation.go.jp/covid_19/kankouyohou/

●ジャッグジャパン株式会社
ジャッグジャパン株式会社はこの活動を応援しています。また、私たちも、「都道府県別新型コロナウイルス感染者数マップ」を公開しておりますので、ぜひご覧ください。
https://gis.jag-japan.com/covid19jp/

●DataRobot, Inc.
DataRobotはこの活動を応援しており、「DataRobot AutoMLの無料ライセンス提供」を実施しております。ぜひご活用ください。
COVID-19 分析官向け無料プログラム
分析官向け無料プログラムオンラインセミナー


<紹介・分析協力>※敬称略
connectome.design株式会社
コネクトーム・デザイン株式会社はSIGNATEの考え方に賛同し、この活動を応援します。多くの技術者に活動を紹介するとともに、解析のお手伝いを致します。
COVID-19チャレンジへの協力について
COVID-19 Data Exploration Tool

●株式会社リコー(リコー経済社会研究所)
http://blog.ricoh.co.jp/RISB/technology/post_542.html

●筑波大学大学院 サービス工学学位プログラム/筑波大学システム情報系社会工学域 岡田幸彦研究室
https://www.sk.tsukuba.ac.jp/PPS/

COVID-19 ENGR
イベント開催「30分でランチ勉強!コロナ関連情報一元化!SIGNATE COVID-19 チャレンジのご紹介」
https://power-covid19.connpass.com/event/173277/
(公式URL)https://www.covid19engr.com/


<メディア協力>
※敬称略
Ledge.aihttps://ledge.ai/covid-19-challenge/
AINOWhttps://ainow.ai/2020/03/20/192930/

情報公開ポリシー

本チャレンジの成果物は営利・非営利を問わずご利用いただけます。成果物を改変したものも共有いただけますが、下記のライセンスを継承するものとします。

Creative Comons 表示 - 継承 4.0 国際
クリエイティブ・コモンズ・ライセンス


本成果物の利用時には以下を引用願います。また、利用内容の概要とともにこちらまでご利用の旨、ご連絡いただければと存じます。
データ名:SIGNATE COVID-19 Dataset
URL:https://bit.ly/signate_covid-19_dataset

分析結果の外部公開に際しては以下を記載願います。

本分析に用いたデータセットsignate covid-19 datasetは、現在、収集途中のものであり、データの正確性を保証するものではありません。また、本データセットは基本的に厚労省・自治体等の報道における症例データに基づいて作成されており、各種機関が発表している統計データと一致しないことがあります。予めご了承ください。