📜  生物数据的特征(基因组数据管理)

📅  最后修改于: 2021-09-09 11:21:36             🧑  作者: Mango

生物数据有很多特点。所有这些特性使生物信息的管理成为一个特别具有挑战性的问题。在这里,我们将主要关注生物信息学的特点和称为生物信息学的多学科领域。生物信息学,现在已经出现了好几所大学的研究生学位课程。

生物信息的特点:

  • 数据的数量和范围都很大。
    生物系统应该具有灵活性,以便它可以处理数据类型和值。对数据类型的约束必须限制在如此广泛的可能数据值范围内。当排除这些值时,可能会丢失信息。
  • 不同生物学家对相同数据的表示会有差异。
    这甚至可以使用相同的系统来完成。有多种方法可以对任何给定实体进行建模,其结果通常反映了科学家的特定关注点。
    模式网络中应该有数据元素的链接。

  • 定义复杂的查询对生物学家也很重要。
    复杂的查询必须得到生物系统的支持。普通用户需要数据结构的知识,因为在这些知识的帮助下,普通用户可以自己构建跨数据集的复杂查询。为此,系统必须提供一些工具来构建这些查询。
  • 与大多数其他领域或应用程序相比,生物数据变得非常复杂。
    此类数据必须确保在生物数据建模过程中不会丢失任何信息,并且此类数据必须能够表示数据的复杂子结构以及关系。用于解释信息的生物数据的结构提供了额外的上下文。
  • 生物数据库的模式发生了快速变化。
    应该支持模式演化和数据对象迁移,以便可以在数据库的几代或版本之间改进信息流。
    关系数据库系统支持扩展模式和生物环境中频繁出现的能力。
  • 大多数生物学家不太可能了解数据库的内部结构或模式设计。
    用户需要一种信息,该信息可以以适用于他们试图解决的问题的方式显示。此外,数据结构应以简单易懂的方式反映。由于关系模式的失败,没有向用户提供关于模式含义的信息。当前的搜索界面由网络界面提供,这可能会限制对数据库的访问。

  • 生物数据的用户不需要对数据库进行写访问,而只需要读访问。
    对称为 curators 的特权用户的写访问权限存在限制。只有少数用户需要写访问权限,但用户生成了对数据库的各种读访问模式。
  • 在验证先前报告的结果时,生物数据的用户最常需要访问数据的“旧”值。
    因此,档案系统必须支持对数据库中数据值的更改。访问最新版本的数据值及其先前版本在生物领域都很重要。
  • 附加的含义由数据在生物学应用中的使用上下文给出。
    在适当的时候,必须维护上下文并将其传达给用户。为了最大限度地解释生物数据值,应该可以整合尽可能多的上下文。