一、前言
FastQC的基本介绍:
FastQC是一款基于Java的软件,它可以快速地对测序数据进行质量评估,其官网为:Babraham Bioinformatics - FastQC A Quality Control tool for High Throughput Sequence Data
- 高通量测序数据的高级质控工具
- 输入FastQ,SAM,BAM文件,输出对测序数据评估的网页报告
二、安装
这里需要安装Conda (这是一款用于安装多数生物信息分析软件的管理软件,重要的是可以解决软件依赖问题)
conda install fastqc
三、使用fastqc
1.介绍fastqc
我们在服务器上用命令行来运行fastQC:
fastqc -t 12 -o out_path sample1_1.fq sample1_2.fq
运行结束后生成两个文件一个.html网页文件,一个是.zip压缩文件。

常用参数:
-o 用来指定输出文件的所在目录,生成的报告的文件名是根据输入来定的,注意是不能自动新建目录的。输出的结果是.zip文件,默认不解压缩,命令里加上--extract则压缩。
-f 用来强制指定输入文件格式,默认自动检测。支持fastq、bam、sam极相应的gz压缩格式
-c 污染物选项,输入的是一个文件,格式是Name[Tab] Sequence,#开头的行是注释,里面是可能的污染序列,如果有这个选项,FastQC会在计算时候评估污染的情况,并在统计的时候进行分析。
-q 会进入沉默模式,指定这个选项的时候,程序不会实时报告运行的状况,即不出现下面的提示:

1.参数大小写敏感
2.参数两种形式
• 长参数
• 短参数
【更详细的使用说明书可以看官网哦】
Index of /projects/fastqc/Help
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/Help/
2.运行数据质控fastqc
目标:使用fastqc对原始数据进行质量评估

本文介绍了基于Java的高通量测序数据质控工具FastQC。先说明了其安装需用到Conda,接着阐述在服务器用命令行运行FastQC的方法及常用参数,还提及脚本后台运行方式。最后详细解读了FastQC报告各项指标,如碱基质量、GC含量等。

1416

被折叠的 条评论
为什么被折叠?



