FASTQ 格式说明

FASTQ是高通量测序数据的标准格式,用于存储核酸序列及其质量信息。每条序列由四行描述:ID信息、序列、描述信息和质量评价。序列ID包含唯一标识,质量评价与序列字符一一对应。

FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。

目前几乎是高通量测序数据的标准格式。

FASTQ格式每四行描述一条测序序列信息:

第一行由'@'开始,后面跟着序列的ID信息,这点跟FASTA格式是一样的。

第二行是序列。

第三行由'+'开始,后面也可以跟着序列的描述信息。

第四行是第二行测序序列的质量评价,字符数跟第二行的序列是相等的,一一对应。



注:序列的ID信息,是这条序列的唯一标识,包含信息如下:

例1:@HWUSI-EAS100R:6:73:941:1973#0/1

HWUSI-EAS100Rthe unique instrument name
6flowcell lane
73tile number within the flowcell lane
941'x'-coordinate of the cluster within the tile
1973'y'-coordinate of the cluster within the tile
#0index number for a multiplexed sample (0 for no indexing)
/1the member of a pair, /1 or /2 (paired-end or mate-pair reads only)

例2:@EAS139:136:FC706VJ:2:2104:15343:197393 1:Y:18:ATCACG

EAS139the unique instrument name
136the run id
FC706VJthe flowcell id
2flowcell lane
2104tile number within the flowcell lane
15343'x'-coordinate of the cluster within the tile
197393'y'-coordinate of the cluster within the tile
1the member of a pair, 1 or 2 (paired-end or mate-pair reads only)
YY if the read fails filter (read is bad), N otherwise
180 when none of the control bits are on, otherwise it is an even number
ATCACGindex sequence

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值