生物数据的特征（基因组数据管理）

生物数据有很多特点。所有这些特性使生物信息的管理成为一个特别具有挑战性的问题。在这里，我们将主要关注生物信息学的特点和称为生物信息学的多学科领域。生物信息学，现在已经出现了好几所大学的研究生学位课程。

生物信息的特点：

数据的数量和范围都很大。
生物系统应该具有灵活性，以便它可以处理数据类型和值。对数据类型的约束必须限制在如此广泛的可能数据值范围内。当排除这些值时，可能会丢失信息。
不同生物学家对相同数据的表示会有差异。
这甚至可以使用相同的系统来完成。有多种方法可以对任何给定实体进行建模，其结果通常反映了科学家的特定关注点。
模式网络中应该有数据元素的链接。
定义复杂的查询对生物学家也很重要。
复杂的查询必须得到生物系统的支持。普通用户需要数据结构的知识，因为在这些知识的帮助下，普通用户可以自己构建跨数据集的复杂查询。为此，系统必须提供一些工具来构建这些查询。
与大多数其他领域或应用程序相比，生物数据变得非常复杂。
此类数据必须确保在生物数据建模过程中不会丢失任何信息，并且此类数据必须能够表示数据的复杂子结构以及关系。用于解释信息的生物数据的结构提供了额外的上下文。
生物数据库的模式发生了快速变化。
应该支持模式演化和数据对象迁移，以便可以在数据库的几代或版本之间改进信息流。
关系数据库系统支持扩展模式和生物环境中频繁出现的能力。
大多数生物学家不太可能了解数据库的内部结构或模式设计。
用户需要一种信息，该信息可以以适用于他们试图解决的问题的方式显示。此外，数据结构应以简单易懂的方式反映。由于关系模式的失败，没有向用户提供关于模式含义的信息。当前的搜索界面由网络界面提供，这可能会限制对数据库的访问。
生物数据的用户不需要对数据库进行写访问，而只需要读访问。
对称为 curators 的特权用户的写访问权限存在限制。只有少数用户需要写访问权限，但用户生成了对数据库的各种读访问模式。
在验证先前报告的结果时，生物数据的用户最常需要访问数据的“旧”值。
因此，档案系统必须支持对数据库中数据值的更改。访问最新版本的数据值及其先前版本在生物领域都很重要。
附加的含义由数据在生物学应用中的使用上下文给出。
在适当的时候，必须维护上下文并将其传达给用户。为了最大限度地解释生物数据值，应该可以整合尽可能多的上下文。