蛋白质数据库与序列分析全解析
在蛋白质研究领域,数据库的运用和序列分析是关键的研究手段。下面将详细介绍非冗余PDB结构数据库、PDB相关数据库、蛋白质结构分类数据库、文献数据库,以及蛋白质序列分析中的序列比对方法。
非冗余PDB结构数据库
在分析蛋白质结构特征时,包含多个相似结构的数据集会影响数据的特征,导致结果出现偏差。因此,使用非冗余蛋白质数据集进行分析是很有必要的。不同数据库提供了不同的获取非冗余蛋白质数据集的方式。
- ASTRAL数据库 :该数据库提供了PDB代码和氨基酸序列,有小于40%和95%序列同一性两个截断值可供选择,并且还能从10% - 100%中自定义截断值。以选择25%序列同一性的非冗余蛋白质数据集为例,可选择该截断值对应的PDB标识符来展示结果,也能获取这些蛋白质结构的序列。此外,ASTRAL还能获取带有e值、折叠、超家族等信息的序列。其网址为:http://astral.berkeley.edu/ 。
- PISCES数据库 :由Wang和Dunbrack在2005年开发,它使用PSI - BLAST和基于结构的比对组合来确定序列同一性。用户输入带有链信息的PDB代码以及其他条件,如序列同一性百分比、分辨率、R因子、是否包含非X射线结构、氨基酸残基数量等,结果将通过电子邮件发送。输出包含四个文件:原始ID、筛选后的ID、FASTA格式序列和相似性日志。其网址为:http://dunbrack.fccc.edu/pisces/ 。
- PDB - REPRDB数据库 :由Noguchi和Akiyama在2003年开发,具有分辨率、R
超级会员免费看
订阅专栏 解锁全文

2891

被折叠的 条评论
为什么被折叠?



