二代靶向测序的分析流程-质控

本文介绍了在生物信息学中,如何通过fastqc进行原始fastq文件的快速质量控制,fastp进行数据过滤和修整,以及Trimmomatic和Cutadapt等工具在去除接头和低质量碱基的应用。质量评估重点关注fastqc的ERROR和WARN级别,以确保数据的准确性对后续分析影响。

质量评估包括

  • 对下机的原始数据fastq进行质控
  • 对比对后的bam文件进行质控

一. fastq质控

常用工具:

  1. fastqc:只评估原始数据,不对原数据进行过滤
  2. fastp:可以执行数据过滤和修建
1.fastqc的使用

fastqc -t 12 -o outputdir/ sample_1.fq.gz sample_2.fq.gz #双端测序
-t 线程数12 -o 定义输出目录

2.fastqc的输出

输出文件包括zip压缩文件和网页格式的文件,html格式的文件便于在本都网页端可视化
压缩文件解压后

  • summary.txt 对输入的测序质量评估
    有ERROR的时候需要注意测序的质量是否合格,WARN一般影响不大,但还是需要查看具体情况,可能会影响后续的变异分析
    在这里插入图片描述
  • fastqc_data.txt :summary.txt指标中的详细信息
    在这里插入图片描述
    二. Fastp的使用
    fastp的功能包括:去掉低质量的碱基、去除接头等
    具体使用可以参考: 使用fastp进行数据质控
    三.其它工具
    Trimmomatic、Cutadapt:可以去除接头
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值