본문바로가기

이 누리집은 대한민국 공식 전자정부 누리집입니다.

메뉴

보건의료자원정보센터(CODA)

수정일
2024-10-08
SHARE 링크연결 공유 인쇄
개요
  • 보건의료연구자원정보센터 시스템(Clinical & Omics Data Archive, 이하 CODA)은 2016년에 국립보건연구원에서 설립하였으며, 국가연구개발사업에서 축적된 보건의료 연구데이터와 자발적 정보 제공자로부터 수집하여 공유 확산을 위한 국가 보건의료연구자원정보 수집·공유 및 활용 플랫폼입니다.
내용
  • 국가연구개발사업 등 다양한 연구과제로부터 등록․기탁된 보건의료 연구자원*을 연구자들에게 분양하여 활용할 수 있도록 지원하고 있습니다.

    * 임상·역학정보, 오믹스정보, 건강기록, 이미지 데이터 등

  • CODA에서는 연구자들을 위해 보건의료 연구데이터를 활용할 수 있는 고성능 분석 인프라를 제공하여 인프라 사각지대에 있는 연구자들의 연구 편의를 지원합니다.
주요자원현황
  • 공개자원 현황
    • 질환, 감염병, 일반인, 암, 만성질환 등 176개 DB를 수집·정제하여 고품질 보건의료 연구데이터 약 77만건(약 3PB)를 공개 중입니다.
    공개자원 현황 연번 DB명 공개년월 정보유형로 구성
    연번 DB명 공개년월 정보유형
    1 KoGES 전장유전체 DB ’22.8., ’23.4. KoGES 5,000명의 임상·역학변수(1차 199개, 2차 202개), 유전체정보(FASTQ, BAM, gVCF, VCF) 569.8TB
    2 대장암 DB ’22.8., ’23.6. 대장암 322명의 임상·역학변수(1차 88개, 2차 95개), 유전체정보(BAM, VCF) 48.17TB
    3 자페증 DB ’22.8., ’23.5. 자폐증 892명의 임상·역학변수(1차 69개, 2차 73개), 유전체정보(BAM, gVCF, VCF) 42.4TB
    4 희귀질환 DB ’22.9., ’23.5. 희귀질환 14,905명의 임상·역학변수(1차 19개, 2차 23개, 추가 26개), 유전체정보(FASTQ, BAM, gVCF, VCF) 1,860.97TB
    5 울산게놈 DB ’22.12., ’23.4. 울산시 일반인 2,504명의 임상·역학변수(1차 112개, 2차 117개), 유전체정보(BAM, gVCF, VCF) 94.84TB
    6 K-MASTER DB ’23.4. 고형암 7,305명의 임상·역학변수(128개), 유전체정보(FASTQ, BAM, VCF) 48TB
    7 폐암 DB ’23.7. 폐암 84명의 임상·역학변수(19개), 유전체정보(VCF) 1.4GB
    8 치매 DB ’23.7. 치매 995명의 임상·역학변수(139개), 유전체정보(BAM, BAI, VCF) 48.58TB
    9 코로나19 DB ’23.8. 코로나 19 확진자 659명의 임상·역학변수(2020 245개, 2021 320개), 유전체정보(WGS, Cytokine, COVID-seq, HLA typing, Bulk TCR-seq, Bulk BCR-seq, scRNA-seq, SNP array) 118.13TB
    10 간호사 건강 연구(KNHS) DB ’23.9. 간호사 20,613명의 임상·역학변수(404개)
    11 KoGES 지역사회기반 코호트 ’24.2. 10,030명의 임상·역학변수(기반 2,479개, 1차 2,310개, 2차 3,023개, 3차 2,627개, 4차 2,989개, 5차 3,141개, 6차 2,930개, 7차 2,395개, 8차 2,482개, 9차 2,545개)
    12 KoGES 농촌기반 코호트 28,337명의 임상·역학변수(기반 1,578개, 1차 1,405개, 2차 1,405개, 3차 1,404개, 4차 746개)
    13 KoGES 도시기반 코호트 173,195명의 임상·역학변수(기반 2,401개, 1차예비 959개, 1차 1,606개)
    14 KoGES 기반조사 통합자료 211,562명의 임상·역학변수(201개)
    15 KoGES 추적조사 통합자료 10,030명의 임상·역학변수(502개)
    16 KoGES 쌍둥이 및 가족코호트 3,202명의 임상·역학변수(1,221개)
    2,030명의 임상·역학변수(1,048개)
    17 미진단 희귀질환 DB ’24.5. 56명의 임상·역학변수(9개), 유전체정보(WES VCF) 194MB
  • 활용 현황
    • CODA는 임상・역학정보, 오믹스정보 등을 보건의료 연구자에게 제공하고 있으며, 데이터 활용 연구 수요는 계속 증가 추세입니다.
      활용 연도 임상·역학정보 오믹스정보 활용 과제 로 구성
      연도 임상·역학정보 오믹스정보 활용 과제
      2022 31,971 160,569 3,049,941
      2023 44,055 174,821 90,465
      2024.7월 현재 14 23 25
  • CODA 분석 인프라
    • CODA에서는 보건의료 연구자들에게 정보분석을 위한 분석 인프라와 웹 분석 서비스를 지원하고 있습니다. 분석 인프라는 CODA 분양 승인 후 신청하여 사용할 수 있으며, 웹 분석 서비스는 별도의 승인 절차 없이 활용이 가능합니다. 이용을 원하시는 분께서는 CODA 홈페이지를 통해 분석 인프라 사용 신청을 하시길 바랍니다.
    • ❶ 한국인 임퓨테이션 서비스
      • - 한국인 임퓨테이션 서비스 (Korean Imputation Service, 이하 KIS)는 웹 기반 임퓨테이션 서비스입니다. 임퓨테이션이란 유전체 칩 정보를 전염기서열정보 수준으로 확장하여 정보 활용을 극대화하는 방법입니다. 국립보건연구원에서 구축한 한국인 4,799명의 전염기서열정보로 한국인 참조패널을 지원하여 한국인 유전체 연구의 정확도 향상을 지원하고 있으며, 슈퍼컴퓨터 기반으로 분석하여 빠르게 분석 결과를 얻을 수 있습니다. 또한, 웹 기반 임퓨테이션 서비스를 통해 쉽게 분석을 진행할 수 있습니다.
    • ❷ 국립보건연구원 피웹(PheWeb) 서비스
      • - 국립보건연구원 피웹 (Korea National Institute of Health Phenome-Wide Association Study Web Service, 이하 KNIH PheWeb)은 다양한 질병 및 표현형에 대한 연관성 분석 결과 공유 및 검색 기능을 제공하는 웹 서비스입니다. 연구자가 관심 있는 유전변이나 유전자, 특정 질병 등으로 검색하여 다양한 질병 및 표현형과의 연관성을 확인 할 수 있습니다. 또한, 연관성 분석 결과를 맨하튼 플롯*, 지역 플롯** 등 시각적으로 제공하여 연구자가 쉽고 빠르게 직관적으로 해석이 가능한 장점이 있습니다. 검색 결과와 제공하고 있는 연관성 분석 결과를 받아 통합 분석을 수행할 수 있어 다양한 연구에 활용할 수 있습니다.
이용안내
  • 등록 • 기탁 절차
    • 연구데이터를 등록․기탁 하기를 원하시는 연구자께서는 CODA 홈페이지의 등록․기탁 신청 메뉴를 통하여 신청해주시기 바랍니다. 신청 후 승인 절차를 거쳐 CODA에 등록․기탁이 완료되게 됩니다.
      01로그인 02신청 03등록기탁검토 04 등록기탁완료
  • 분양 신청
    • 연구데이터를 분양하기 원하시는 연구자께서는 분양 신청 메뉴를 통하여 데이터 분양 신청을 하시기 바랍니다. 분양 신청 이후 분양심의를 거쳐 연구자께 데이터가 분양됩니다.
      01로그인 02검색 03신청 04 분양 심의 05데이터 분양 06데이터 폐기 07성과물 등록
  • 분석 인프라 신청
    • CODA는 연구자들에게 정보분석을 위한 분석 인프라를 지원하고 있습니다. 분석 인프라는 CODA 데이터 분양 승인 후 분석 인프라 신청 절차에 따라 이용할 수 있습니다.
      01로그인 02신청 03관리자 승인 04 데이터 분석 05데이터 반출
connect