本コンペティションは招待制となっております。
皆様から多数のご応募を頂きましたので、現在は参加受付を終了しております。
あらかじめご了承いただけますようよろしくお願い申し上げます。
参加者の皆様へのお知らせ(2019年2月12日)
本コンペティションの規約追加事項(「情報の公開」部分)について、リーダーボード及びプロフィールページでの表示内容が当該事項に抵触するのではないかとのご指摘がありましたので、ご説明させて頂きます。
当該事項は、本コンペティション主催者との取り決めにより、テーマの秘匿性から、参加者自身による参加者以外への情報公開を限定することを目的に設定されております。
参加者の方々におかれましては、SNS等を通じて本コンペティションに関する情報発信を行わないよう、ご理解いただきたく存じます。
なお、リーダーボード及びプロフィールページ等での当該情報に関する表示につきましては、主催者の同意のもと弊社が主体となり実施しているものであり、参加者の皆様が本規約に抵触することはございません。
背景
糖尿病は全透析患者の原因の36.6%、冠動脈疾患と脳卒中の発症率は一般の約3倍、2倍と健康寿命に大きく関わり、その予備群は成人の10%を超え大きな社会的問題となっています。一方で、現状の糖尿病実態調査は、糖尿病専門施設での一部の患者データに基づき、日本全体での実態を必ずしも反映しないのが実情です。そこで、診療録直結型全国糖尿病データベース事業(J-DREAMS)では、患者さんを匿名化した上で、各病院のデータのフォーマットを統一し収集システムを構築することで、大規模な患者データベースの構築を進めています。 このデータベースにより糖尿病治療の実態を把握し、「どのような患者さんが多いのか」「どういう患者さんに対して、どういう治療をするのが最適なのか」などを調べることで、将来の日本の糖尿病治療の質を高める方法の確立が期待されています。現在、J-DREAMSでは、全国の医療機関からデータを収集し、各施設で管理されている検査データを臨床検査項目分類コード第10版(JLAC10)に準拠し分類しています。しかし、その分類には医学的な知見が求められ、大量のデータ整備に多大な労力が必要となっています。
そこで、今回は複数の医療施設における検査項目名および検査値から対応するJLAC10コードを推定するアルゴリズムの構築にチャレンジいただきます。分類業務の効率化により日本の糖尿病治療の向上を目指します。
タスク説明
過去複数の医療施設において実施された血液・尿検査項目名および検査値の実績、それらの同時検査の履歴とJLAC10マスター情報に基づき、新規の医療施設から提供される同様のデータにおけるJLAC10コードの推定ロジックを構築していただきます。
最終的な推定結果は、各検査IDに対する所与のJLAC10コードとの対応確率を記載いただきます。
特に運用性・拡張性を鑑みた実装を期待します。すなわち、提供データのみを利用し、機械的な処理に基づく推定を前提とし、人間の判断に依存しない処理フローを期待します。本コンペが終了した後も、新しい医療施設における未知の検査項目名、その測定値、(同時)測定履歴が一定数蓄積した段階で、実行可能なアルゴリズムである必要があります。
※各データには匿名化およびノイズ付加処理がされており、医療施設における実際のデータとは異なるものが使用されています。
※JLAC10コードは5つの要素区分からなり、
(1)分析物コード5桁 (2)識別コード4桁 (3)材料コード3桁 (4)測定法コード3桁 (5)結果識別コード2桁
の17桁で構成されます。