お知らせ
2021年12月23日17時をもって、本チャレンジのデータ更新を停止いたしました(データセットの閲覧は可能です)。ご参加いただきました皆様には、多大なるご尽力をいただき誠にありがとうございました。
コンペティション自体は2020年12月31日を持って終了扱いとなりますが、COVID-19チャレンジのサイト(データ収集・分析)は今後も継続提供します。
趣意
「Flattening the curve」(曲線をたいらにする)とは、感染症患者のオーバーシュート(爆発的拡大)を防ぎ、感染者数のピークを抑えることで医療システムの崩壊を避けるスローガンです。急激な感染者数の増加に伴い多数の人々が一気に病院に押しかけてしまうと、病院の対応能力を越えてしまい、感染症以外の患者さんへの対応も含め医療システムが崩壊する可能性があります。イタリアでの死者数が多いのもこの現象によるものです。医療機関で受け入れ可能な感染規模を維持し続けることにより、治療薬やワクチン開発の時間を稼ぐことができます。
オーバーシュート対策として有効な考え方が「social distancing」(社会距離戦略)です。社会距離戦略は、ウィルス感染を防ぐために人と人の間に安全な距離をとる方策を意味します。
例えば
・人が集まるイベントを自粛
・学校を休校にする
・在宅勤務に切り替える
・人混みを避け、人との接触を避ける
などがあります。
海外、特にヨーロッパでは、外出禁止令が出されるなど、厳しい対応もみられます。日本では、強制力はないものの「不要不急」の外出を控えるよう自粛要請がなされています。さらに、外出をする場合は、3つの「密」を避けるように呼びかけています。
・換気の悪い密閉場所
・多数が集まる密集場所
・間近で会話や発声をする密接場所
すでに、ライブハウスやスポーツジムなど、クラスター発生の実績がよく知られている場所については、実施の自粛や注意して利用することで対応が可能です。しかし、あまり知られていない潜在的なリスクを持つ場所や逆に安全にも関わらず過度に自粛する状況が起きている可能性があります。各人が正しく判断し行動に移すためには、現状のような曖昧な状態ではなく、具体的な事実を俯瞰して理解することが重要と考えます。
そこで、Phase2では、Phase1で得られたデータをもとに、社会距離戦略の意思決定に資する(少なくとも議論の題材になる)データ分析を目指します。データ分析の過程における、不足データや分析困難なフィールドについては、Phase1にフィードバックし、データ収集や構造化を進めていきます。ただし、報道ベースのデータ収集では情報精度に限界がありますので、確実に実施可能(新規データ追加に関しては収集可能であることが確認されているもの)なもののみフィードバック願います。
また、Phase1のデータ設計・収集は継続して進行中です。マスターデータ等の整理や外部データとの統合を検討しています。よって、データ構造が予告なく変更になることがあります。予めご了承願います。
Phase1 SIGNATE COVID-2019 Dataset
※アクセス負荷の軽減等を目的に、データセットのスナップショット(閲覧専用)も毎日0:00-1:00の間に取得しています。分析の際に、必要に応じてこちらも活用ください。
分析結果の外部公開に際しては以下を記載いただくか、URL<https://signate.jp/competitions/261#misc>を引用願います。
データ分析に際しては、外部データやツールの活用も検討願います。SIGNATE COVID-19 Challengeに協賛いただいている組織はコチラになります。通常有償のデータやツールも本チャレンジのために無償でご提供いただいております。ご活用ください。
本チャレンジに貢献いただいた方は、著者メンバーの一員としてクレジットされます。皆様のご協力をいただければ幸いです。
期待する分析例:感染状況の把握
【基礎統計】
都道府県別、年代別、性別、職業、各種フラグ、濃厚接触者等、またその組み合わせによる各種統計実態(総数や一人当たり)およびトランザクションによる時間的推移を検討。可視化による情報の俯瞰的理解、層別比較や海外データとの比較によるインサイトを抽出。
・罹患者数
・死亡者数
・医療機関受診回数
・検査回数(COVID-19、インフルエンザ、CT、etc)
・自宅待機日数
・利用した公共交通分布
・クラスターサイズ
・体温分布
・症状分布
・発熱観察日、受診日、 公表日、回復日、死亡日による期間分析
・海外由来、国内感染の状況
など
【罹患者関係性】
感染者同士や場所、感染経路と拡大など、罹患者属性や地理的属性、時間的推移を検討。可視化による情報の俯瞰的理解、層別比較や海外データとの比較によるインサイトを抽出。
・罹患者ネットワーク
・罹患者と場所のネットワーク
・ネットワークトポロジー、時間的変化
など
【インサイト】
上記のような分析の結果、得られたインサイトや仮説、そこから導かれるアクション等を検討願います。目的は感染者爆発の抑制に貢献するインサイト抽出です。必ずしも高度な可視化技術・統計解析技術を求めません(もちろん、それらも大歓迎です)。また、直接課題解決につながらなくても、できる範囲で分析を蓄積していきたいと考えます。
例えば、非常に簡単な分析例「日本においても海外と同様、新型コロナウィルスの罹患者・死者は男性の方が女性よりも多い。」をフォーラムに示します。気軽に参加しましょう!
【ギャラリー】
SIGNATE COVID-19 Challengeの取り組みで創作された分析例(可視化・ダッシュボード、インサイト・仮説など)はこちらにリストしていきます。
<可視化>
・SIGNATE:SIGNATE COVID-19 Challenge 基本統計ダッシュボード
・Naoko Ozakiさん:SIGNATE #COVID19 Cases Dashbord
・Su Weiさん:クラスターネットワーク
・渡辺 知恵美さん:クラスタの連鎖状況の可視化
・Yuki Nakamuraさん:都道府県別の感染者傾向
<インサイト>
・SIGNATE:日本においても海外と同様、新型コロナウィルスの罹患者・死者は男性の方が女性よりも多い。