📝 Biopython教程
22篇技术文档📅  最后修改于: 2020-11-09 04:56:14        🧑  作者: Mango
Biopython是主要用于生物信息学领域的开源Python工具。本教程介绍了Biopython软件包的基础知识,生物信息学概述,序列操作和绘图,种群遗传学,聚类分析,基因组分析,与BioSQL数据库的连接,最后总结了一些示例。本教程是为有志于使用Python作为编程工具的生物信息学编程领域的专业人士而准备的。本教程旨在使您熟悉Biopython概念及其各种功能。先决条件在继续本教程中给出的各种类...
📅  最后修改于: 2020-11-09 04:56:39        🧑  作者: Mango
Biopython是用于Python的最大,最受欢迎的生物信息学软件包。它包含许多用于常规生物信息学任务的不同子模块。它由Chapman和Chang开发,主要使用Python编写。它还包含C代码,以优化软件的复杂计算部分。它可以在Windows,Linux,Mac OS X等操作系统上运行。基本上,Biopython是Python模块的集合,这些模块提供处理DNA,RNA和蛋白质序列操作的功能,例...
📅  最后修改于: 2020-11-09 04:57:03        🧑  作者: Mango
本节说明如何在您的计算机上安装Biopython。它非常容易安装,并且不会超过五分钟。第1步-验证Python安装Biopython旨在与Python 2.5或更高版本一起使用。因此,必须首先安装Python 。在命令提示符中运行以下命令-它定义如下-如果安装正确,它将显示Python的版本。否则,请下载最新版本的Python,进行安装,然后再次运行命令。第2步-使用pip安装Biopython在...
📅  最后修改于: 2020-11-09 04:57:36        🧑  作者: Mango
让我们创建一个简单的Biopython应用程序以解析生物信息学文件并打印内容。这将帮助我们了解Biopython的一般概念,以及它在生物信息学领域的帮助。步骤1-首先,创建一个示例序列文件“ example.fasta”,并将以下内容放入其中。fasta扩展名是指序列文件的文件格式。 FASTA源于生物信息学软件FASTA,因此得名。 FASTA格式具有多个顺序排列的序列,每个序列将具有自己的ID...
📅  最后修改于: 2020-11-09 04:58:23        🧑  作者: Mango
序列是一系列字母,用于表示生物体的蛋白质,DNA或RNA。它由Seq类表示。 Seq类在Bio.Seq模块中定义。让我们在Biopython中创建一个简单的序列,如下所示-在这里,我们已经创建了一个简单的蛋白质序列AGCT和每个字母表示Alanine,G甜菜碱,Cysteine和Threonine。每个Seq对象都有两个重要的属性-数据-实际序列字符串(AGCT)字母-用于表示序列的类型。例如,D...
📅  最后修改于: 2020-11-09 04:58:58        🧑  作者: Mango
在本章中,我们将讨论Biopython提供的一些高级序列功能。补码和反补码核苷酸序列可以反向互补以获得新序列。同样,互补序列可以反向互补以获得原始序列。 Biopython提供了两种方法来实现此功能-互补和reverse_complement。的代码在下面给出-在这里,complement()方法允许互补DNA或RNA序列。 reverse_complement()方法对结果序列进行补充,并从左向...
📅  最后修改于: 2020-11-09 04:59:48        🧑  作者: Mango
Biopython提供了一个模块Bio.SeqIO来分别从文件(和任何流)读取和写入序列。它支持生物信息学中几乎所有可用的文件格式。大多数软件为不同的文件格式提供了不同的方法。但是,Biopython有意识地遵循一种方法来通过其SeqRecord对象向用户显示已解析的序列数据。在下一节中,让我们了解有关SeqRecord的更多信息。SeqRecordBio.SeqRecord模块提供SeqReco...
📅  最后修改于: 2020-11-09 05:00:48        🧑  作者: Mango
序列比对是按特定顺序排列两个或多个(DNA,RNA或蛋白质序列的)序列以鉴定它们之间相似区域的过程。识别相似区域使我们能够推断出许多信息,例如物种之间保守的性状,遗传上不同物种的接近程度,物种如何进化等。Biopython为序列比对提供了广泛的支持。让我们学习本章中Biopython提供的一些重要功能-解析序列比对Biopython提供了一个模块Bio.AlignIO来读取和写入序列比对。在生物信...
📅  最后修改于: 2020-11-09 05:02:05        🧑  作者: Mango
BLAST代表基本局部路线搜索工具。它找到生物学序列之间的相似区域。 Biopython提供了Bio.Blast模块来处理NCBI BLAST操作。您可以在本地连接或Internet连接上运行BLAST。让我们在下一节中简要了解这两个连接-通过互联网运行Biopython提供了Bio.Blast.NCBIWWW模块来调用BLAST的在线版本。为此,我们需要导入以下模块-NCBIWW模块提供qbla...
📅  最后修改于: 2020-11-09 05:02:46        🧑  作者: Mango
Entrez是NCBI提供的在线搜索系统。它通过集成的全局查询(支持布尔运算符和字段搜索)提供对几乎所有已知分子生物学数据库的访问。它从所有数据库返回结果,并提供诸如每个数据库的命中数,带有原始数据库链接的记录等信息。下面列出了一些可以通过Entrez访问的流行数据库-Pubmed中央酒吧核苷酸(GenBank序列数据库)蛋白质(序列数据库)基因组(整个基因组数据库)结构(三维高分子结构)分类学(...
📅  最后修改于: 2020-11-09 05:03:22        🧑  作者: Mango
Biopython提供了Bio.PDB模块来操纵多肽结构。 PDB(蛋白质数据库)是在线上最大的蛋白质结构资源。它具有许多不同的蛋白质结构,包括蛋白质-蛋白质,蛋白质-DNA,蛋白质-RNA复合物。为了加载PDB,请键入以下命令-蛋白质结构文件格式PDB以三种不同的格式分布蛋白质结构-Biopython不支持基于XML的文件格式pdb文件格式,这是一种特殊格式的文本文件PDBx / mmCIF文件...
📅  最后修改于: 2020-11-09 05:03:46        🧑  作者: Mango
序列基序是核苷酸或氨基酸序列模式。序列基序是由可能不相邻的氨基酸的三维排列形成的。 Biopython提供了一个单独的模块Bio.motifs来访问序列基序的功能,如下所示-创建简单的DNA图案让我们使用以下命令创建一个简单的DNA基序序列-要计算序列值,请使用以下命令-使用以下代码按顺序计算’A’-如果要访问计数列,请使用以下命令-创建序列徽标现在我们将讨论如何创建序列徽标。考虑以下顺序-您可以...
📅  最后修改于: 2020-11-09 05:04:48        🧑  作者: Mango
BioSQL是一种通用数据库模式,主要用于存储所有RDBMS引擎的序列及其相关数据。它的设计方式可以保存来自所有流行的生物信息学数据库(如GenBank,Swissport等)的数据。它也可以用于存储内部数据。BioSQL当前为以下数据库提供特定的架构-MySQL(biosqldb-mysql.sql)PostgreSQL(biosqldb-pg.sql)甲骨文(biosqldb-ora / *。...
📅  最后修改于: 2020-11-09 05:05:16        🧑  作者: Mango
种群遗传学在进化论中起着重要的作用。它分析了物种之间以及同一物种内两个或多个个体之间的遗传差异。Biopython提供了用于人口遗传学的Bio.PopGen模块,并主要支持`GenePop,这是由Michel Raymond和Francois Rousset开发的流行遗传学软件包。一个简单的解析器让我们编写一个简单的应用程序来解析GenePop格式并理解其概念。-下载通过Biopython队中的链...
📅  最后修改于: 2020-11-09 05:05:44        🧑  作者: Mango
基因组是完整的DNA集合,包括其所有基因。基因组分析是指研究单个基因及其在遗传中的作用。基因组图基因组图将遗传信息表示为图表。 Biopython使用Bio.Graphics.GenomeDiagram模块表示GenomeDiagram。 GenomeDiagram模块需要安装ReportLab。创建图的步骤创建图的过程通常遵循以下简单模式-为要显示的每个单独的功能集创建一个FeatureSet,...