生物数据库:
- 这些是由生物学数据(如蛋白质测序,分子结构,DNA序列等)组成的数据库。
- 那里有几种计算机工具可以处理生物数据,例如更新,删除,插入等。来自世界各地的科学家,研究人员将他们的实验数据输入并保存在生物数据库中,以便更广泛的受众使用。
- 生物数据库是免费使用的,并且包含大量的各种生物数据。
生物数据库的用途:
- 它可以帮助研究人员研究可用数据并形成新的论文,抗病毒,有用的细菌,药物等。
- 它可以帮助科学家了解生物现象的概念。
- 数据库充当信息的存储。
- 它有助于消除数据冗余。
生物数据库的类型:
基本上有3种类型的生物学数据库如下。
1.主要数据库:
- 它也可以称为档案数据库,因为它可以存档科学家提交的实验结果。主数据库中填充有实验得出的数据,例如基因组序列,大分子结构等。此处输入的数据仍未整理(对数据不做任何修改)。
- 它获得了从实验室获得的独特数据,这些数据可供普通用户使用,而无需进行任何更改。
- 当数据输入数据库时,将为其指定登录号。以后可以使用登录号检索相同的数据。登录号唯一地标识每个数据,并且永远不变。
例子 –
- 主数据库的示例-核酸数据库是GenBank和DDBJ
- 蛋白质数据库包括PDB,SwissProt,PIR,TrEMBL,Metacyc等。
2.二级数据库:
- 这些类型的数据库中存储的数据是主数据库的分析结果。计算算法被应用于主数据库,有意义的信息性数据存储在辅助数据库内部。
- 此处的数据经过高度整理(在将数据显示在数据库中之前先对其进行处理)。与主数据库相比,辅助数据库更好,并且包含更多有价值的知识。
例子 –
辅助数据库的示例如下。
- InterPro(蛋白质家族,基序和结构域)
- UniProt知识库(有关蛋白质的序列和功能信息)
3.复合数据库:
- 首先比较在这些类型的数据库中输入的数据,然后根据所需标准进行过滤。
- 初始数据取自主数据库,然后根据某些条件将它们合并在一起。
- 它有助于快速搜索序列。复合数据库包含非冗余数据。
例子 –
组合数据库的示例如下。
- 复合数据库-OWL,NRD和Swissport + TREMBL