📜  生物信息学中生物数据库的类型

📅  最后修改于: 2021-08-29 02:34:04             🧑  作者: Mango

生物数据库

  • 这些是由生物学数据(如蛋白质测序,分子结构,DNA序列等)组成的数据库。
  • 那里有几种计算机工具可以处理生物数据,例如更新,删除,插入等。来自世界各地的科学家,研究人员将他们的实验数据输入并保存在生物数据库中,以便更广泛的受众使用。
  • 生物数据库是免费使用的,并且包含大量的各种生物数据。

生物数据库的用途:

  • 它可以帮助研究人员研究可用数据并形成新的论文,抗病毒,有用的细菌,药物等。
  • 它可以帮助科学家了解生物现象的概念。
  • 数据库充当信息的存储。
  • 它有助于消除数据冗余。

生物数据库的类型:

基本上有3种类型的生物学数据库如下。

1.主要数据库:

  • 它也可以称为档案数据库,因为它可以存档科学家提交的实验结果。主数据库中填充有实验得出的数据,例如基因组序列,大分子结构等。此处输入的数据仍未整理(对数据不做任何修改)。
  • 它获得了从实验室获得的独特数据,这些数据可供普通用户使用,而无需进行任何更改。
  • 当数据输入数据库时,将为其指定登录号。以后可以使用登录号检索相同的数据。登录号唯一地标识每个数据,并且永远不变。

例子 –

  • 主数据库的示例-核酸数据库是GenBank和DDBJ
  • 蛋白质数据库包括PDB,SwissProt,PIR,TrEMBL,Metacyc等。

2.二级数据库:

  • 这些类型的数据库中存储的数据是主数据库的分析结果。计算算法被应用于主数据库,有意义的信息性数据存储在辅助数据库内部。
  • 此处的数据经过高度整理(在将数据显示在数据库中之前先对其进行处理)。与主数据库相比,辅助数据库更好,并且包含更多有价值的知识。

例子 –

辅助数据库的示例如下。

  • InterPro(蛋白质家族,基序和结构域)
  • UniProt知识库(有关蛋白质的序列和功能信息)

3.复合数据库:

  • 首先比较在这些类型的数据库中输入的数据,然后根据所需标准进行过滤。
  • 初始数据取自主数据库,然后根据某些条件将它们合并在一起。
  • 它有助于快速搜索序列。复合数据库包含非冗余数据。

例子 –

组合数据库的示例如下。

  • 复合数据库-OWL,NRD和Swissport + TREMBL