数据的质量控制软件----fastQC

本文介绍了基于Java的高通量测序数据质控工具FastQC。先说明了其安装需用到Conda,接着阐述在服务器用命令行运行FastQC的方法及常用参数,还提及脚本后台运行方式。最后详细解读了FastQC报告各项指标,如碱基质量、GC含量等。

一、前言

FastQC的基本介绍:

FastQC是一款基于Java的软件,它可以快速地对测序数据进行质量评估,其官网为:Babraham Bioinformatics - FastQC A Quality Control tool for High Throughput Sequence Data

  • 高通量测序数据的高级质控工具
  • 输入FastQ,SAM,BAM文件,输出对测序数据评估的网页报告

二、安装

这里需要安装Conda (这是一款用于安装多数生物信息分析软件的管理软件,重要的是可以解决软件依赖问题)

conda install fastqc

三、使用fastqc

1.介绍fastqc

我们在服务器上用命令行来运行fastQC:

fastqc -t 12 -o out_path sample1_1.fq sample1_2.fq

运行结束后生成两个文件一个.html网页文件,一个是.zip压缩文件。

 常用参数:

-o 用来指定输出文件的所在目录,生成的报告的文件名是根据输入来定的,注意是不能自动新建目录的。输出的结果是.zip文件,默认不解压缩,命令里加上--extract则压缩。

-f       用来强制指定输入文件格式,默认自动检测。支持fastq、bam、sam极相应的gz压缩格式

-c      污染物选项,输入的是一个文件,格式是Name[Tab] Sequence,#开头的行是注释,里面是可能的污染序列,如果有这个选项,FastQC会在计算时候评估污染的情况,并在统计的时候进行分析。

-q      会进入沉默模式,指定这个选项的时候,程序不会实时报告运行的状况,即不出现下面的提示:

1.参数大小写敏感

2.参数两种形式

• 长参数

• 短参数

【更详细的使用说明书可以看官网哦】

Index of /projects/fastqc/Helpicon-default.png?t=N7T8http://www.bioinformatics.babraham.ac.uk/projects/fastqc/Help/

 2.运行数据质控fastqc

目标:使用fastqc对原始数据进行质量评估


                
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值