ICS 35.240.80
C 07
团体标准
T/CHIA 20-2021
人类基因测序原始数据汇交元数据标准
Specification of m etadata for the submission of human genetic sequencing raw
data
2021-07-11发布 2021-08-01实施
中国卫生信息与健康医疗大数据学会
发布
全国团体标准信息平台
T/CHIA 20-2021
I
目 次
前言 ................................ ................................ ................................ ................................ .................. II
引言 ................................ ................................ ................................ ................................ ................. III
1 范围 ................................ ................................ ................................ ................................ ............... 1
2 规范性引用文件 ................................ ................................ ................................ ........................... 1
3 术语和定义 ................................ ................................ ................................ ................................ ... 1
4 缩略语 ................................ ................................ ................................ ................................ ........... 2
5 数据元属性 ................................ ................................ ................................ ................................ ... 2
5.1 数据元公用属性 ................................ ................................ ................................ .................... 2
5.2 数据元专用属性 ................................ ................................ ................................ .................... 2
5.3 数据元值域代码 ................................ ................................ ................................ .................. 17
全国团体标准信息平台
T/CHIA 20-2021
II
前 言
本文件按照 GB/T 1.1-2020给出的规则起草。
本文件由中国科学院北京基因组研究所(国家生物信息中心)提出 ,由中国卫生信息
与健康大数据学会 归口。
本文件起草单位:中国科学院北京基因组研究所(国家生物信息中心)、 中国科学院
生物物理研究所、 浙江大学、复旦大学、清华大学、中国人民解放军总医院、 北京蛋白质
组研究中心、中国科学院微生物研究所、 北京大学人民医院、中国科学院上海 营养与健康
研究所、中南大学 、空军军医大学(第四军医大学)。
本文件主要起草人: 方向东、赵文明、陈润生、金力、何昆仑、李亦学、张学工、 何顺
民、段会龙、周水庚、王彦青、渠鸿竹、王霞、 吕旭东、朱云平、马俊才、杨忠、石乐明、
吴松峰、吴林寰、王振、陈先来、贾志龙、张昭军、娄晓敏、阮修艳、单广乐 。
全国团体标准信息平台
T/CHIA 20-2021
III
引 言
《人类基因测序原始数据汇交元数据标准 》为人类基因测序 领域产生的测序数据的原
始数据向国家基因组科学数据中心汇交 时, 数据提交方需要 提供的元数据元素集 ( metadata
element set ),包括必选和可选的元数据元素及其规范化描述。
本文件参照 国际核酸序列共享联盟( International Nucleotide Sequence Database
Collaboration, INSDC )的数据标准及数据库建设标准制定人类 基因测序 原始数据 汇交元数
据的标准,对 基因测序 原始数据的属性进行了详细的描述,其目的是为精准医学大数据的
汇交注册提供统一 著录规范 。
全国团体标准信息平台
T/CHIA 20-2021
1
人类基因测序 原始数据 汇交元数据标准
1 范围
本标准规定了人类 基因测序 原始数据向国家基因组科学数据中心汇交中涉及的元数据
及其属性。
本标准适用于人类 基因测序 原始数据汇交。
2 规范性引用文件
下列文件对于文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用
于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
WS/T 305卫生信息数据集元数据 规范
WS/T 303 卫生信息数据元标准化规则
WS 370卫生信息基本数据集编制规范
GB/T 2260 中华人民共和国行政区划代码
3 术语和定义
3.1
数据提交者 data submit ter
数据集的提交者信息。
3.2
研究 study
产生本数据集的研究的信息。
3.3
项目 bioproject
数据集相关的项目信息。
3.4
数据管理 者 data access manager (DAM)
数据集的数据管理 人员,负责对受控访问数据发布后 的数据申请进行审核。
3.5
个体 individual
测序数据来源受检测的个体。
3.6
样本 sample
测序数据来源样本。
3.7
实验 experiment
测序数据的实验信息。
全国团体标准信息平台
T/CHIA 20-2021
2
3.8
测序反应 run
测序反应信息。
4 缩略语
下列缩略语适用于本文件。
NCBI:美国国家生物信息中心( National Center for Biotechnology Information )
EMBL -EBI:欧洲分子生物学实验室 -欧洲生物信息研究所( The European Molecular
Biology Laboratory - The European Bioinformatics Institute )
DDBJ:日本 DNA序列资料库( DNA Data Bank of Japan )
BAM:二进制比对( Binary Alignment/Map )
DOI:数字对象唯一标识( digital object identifier )
5 数据元属性
5.1 数据元公用属性
数据元公用属性描述见表 1。
表1 数据元公用属性
属性种类 数据元属性 名称 属性值
标识类 版 本 V1.0
注册机构 中国卫生信息与健康医疗大数据学会卫生信息标准
专业委员会
相关环境 人类基因测序原始数据汇交
关系类 分类模式 分类法
管理类 主管机构 中国卫生信息与健康医疗大数据学会卫生信息标准
专业委员会
注册状态 标准状态
提交机构 中国科学院北京基因组研究所(国家生物信息中心)
5.2 数据元专用属性
5.2.1 数据提交者
T-CHIA 20—2021 人类基因测序原始数据汇交元数据标准
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2022-12-13 11:53:30上传分享