プラットフォームとは

概要

AMEDデータ利活用プラットフォーム

AMEDデータ利活用プラットフォーム(CANNDs)は、健康・医療 分野におけるデータ連携の基盤として、AMED事業全体から生み出されたデータを格納する複数のデータベース等を連携し、横断検索機能を有するとともに、産業界も含めた研究開発にデータを扱う場(データを持ち込み扱えるセキュリティが担保されたVisiting利用環境)を広く提供します。

AMEDデータ利活用プラットフォーム概念図

令和6年度は、3大バイオバンク(東北メディカル・メガバンク計画、ナショナルセンター・バイオバンクネットワーク、バイオバンク・ジャパン)の全ゲノムデータのメタデータの横断検索と、研究計画の立案を支援するアレル頻度情報の検索(連携基盤)、及び全ゲノムデータを処理する計算処理環境(連携拠点におけるシステム)、並びに遺伝型インピュテーションサービスを提供します。
メタデータの横断検索からデータの処理までワンストップで実行可能なサービスを提供することで、ゲノムデータ利活用を推進する役割を果たします。令和6年度は、3大バイオバンクの全ゲノムデータのメタデータの横断検索、アレル頻度情報等を用いた研究計画の立案を可能とする連携基盤と、連携拠点におけるシステム(計算ノードとストレージ)によって構成されます。

連携拠点

連携拠点一覧

※五十音順

利用できるデータについて

AMEDでは医療分野の研究開発を推進しており、そこから生み出されたデータは個人情報を含むデータです。AMEDデータ利活用プラットフォームは、個人情報を含むデータを我が国の法令と指針に則り、セキュリティとプライバシーに十分に配慮した利用が可能となる仕組みを備えています(AMEDデータ利活用プラットフォームで利活用する個人情報を含むデータを「利活用個人データ」と呼んでいます)。

令和6年度に利用できる利活用個人データ

令和6年度には、AMED研究で生み出された3大バイオバンク(東北メディカル・メガバンク計画、ナショナルセンター・バイオバンクネットワーク、バイオバンク・ジャパン)の全ゲノムデータセットの約2万検体のシークエンスデータ(FASTQファイル、CRAMファイル、GVCFファイル)、及びこのメタデータをご利用できます。全ゲノムデータの利用には、データ利用審査会での承認が必要です。
上記の全ゲノムデータのメタデータとして、JGAスキーマデータと、臨床基本4属性(年齢階層(10歳単位)、性別、居住地または出生地、疾患名及び疾病コード(ICD-10)を、連携基盤を用いて横断検索できます。

※ICD:International Statistical Classification of Diseases and Related Health Problems(疾病及び関連保健問題の国際統計分類)の略称

本プラットフォーム上で利用できるゲノムデータについて

概要:
一般住民及び各種疾患患者から得られた全ゲノムデータセットのシークエンスデータ

全ゲノムデータの概要:

全ゲノムデータに紐付く臨床情報の利用について

全ゲノムデータに紐付く詳細な臨床情報(臨床基本4属性情報の範囲を超えるもの)及び生体試料の利用を希望する場合は、各データ提供機関(バイオバンク)にご連絡いただき、臨床情報及び生体試料の利用についてご相談の上、必要な手続きをお取りください。
利用したい情報及び試料を保有するデータ提供機関が不明な場合は、AMEDデータ利活用プラットフォーム事務局にご相談ください。
なお、各データ提供機関からの情報及び試料の提供は、各データ提供機関の運用規則等に則り、各データ提供機関が判断するものとなります。

各データ提供機関から公開されている臨床情報項目(以下のリンク先)を参考にしてください。