📅  最后修改于: 2023-12-03 15:25:47.631000             🧑  作者: Mango
如果你是做生物学或者计算生物学方向的程序员,那么你一定会涉及到生物学软件包的使用,其中 Dynamo 是一个功能强大的 Python 生物学软件包,它提供了各种生物信息学分析工具,包括生物序列分析、多序列比对、蛋白质结构预测等等。
这里介绍执行命令 dynamo civid
的用法。
执行命令 dynamo civid
主要是为了得到蛋白质序列的保守性指标,以辅助分析序列的功能、结构和进化等方面的问题。
执行命令 dynamo civid
的参数如下:
dynamo civid [-d DATABASE] [-o OUTPUT] [-t THRESHOLD] fastafile
-d
, --database
:指定用于计算保守性指标的数据库,默认为 Swiss-Prot。-o
, --output
:指定结果输出文件,默认为 fastafile.civid
.-t
, --threshold
:指定保守性指标的阈值,默认为 0.9。fastafile
:需要分析的蛋白质序列文件,必须是 fasta 格式。以一个名为 myprotein.fasta
的 fasta 文件为例,执行以下命令:
dynamo civid myprotein.fasta
将会在当前目录下生成一个名为 myprotein.fasta.civid
的结果文件。结果文件的格式为:
position aa num ncons score
1 M 160 1.0 1.0
2 L 154 1.0 1.0
3 H 155 1.0 1.0
...
其中,position
表示蛋白质序列的位置,aa
表示对应位置的氨基酸,num
表示在数据库中找到的相同氨基酸数量,ncons
表示保守性指标,score
表示适应度分数。
指定其他参数,如使用 Uniprot 数据库和指定输出文件名,可以参考以下命令:
dynamo civid -d uniprot -o myprotein.civid -t 0.8 myprotein.fasta
这样,就会生成一个名为 myprotein.civid
的结果文件,其中使用的数据库为 Uniprot,保守性指标阈值为 0.8。
通过执行命令 dynamo civid
,可以得到蛋白质序列的保守性指标以辅助序列的分析,它是 Dynamo 提供的众多生物信息学分析工具之一。各种参数的用法和示例也在本文中得到了介绍,希望对正在使用 Dynamo 的程序员有所帮助。