Local as View (LAV)是基于视图的数据集成系统 (VDIS) 用于执行数据集成的方法,即搜索和组合来自各种来源的数据。它将每个本地模式描述为全局模式上的函数。这里数据源被定义为对提供的架构的视图。 Schema 的设计方式使其即使在某些数据源加入或离开集成系统时也能保持稳定性。因此,LAV 允许独立于其他来源向集成系统添加或减少来源。
一个简短的历史 :
LAV 映射的概念主要由 Alon Y. Levy、Anand Rajaraman、Joann J. Ordille 引入,以克服传统数据集成视图的缺点。 LAV 映射的思想是,局部模式的每个关系符号都是针对全局模式定义的。
早期的 VDIS 遵循全局视图 (GAV) 方法,其中根据本地模式描述全局模式。由于全局模式是根据源来表示的,因此全局关系不能表示至少在单个源中不存在的任何信息。此外,基于 GAV 的系统不允许独立于其他源向系统添加源。
因此,为了克服 GAV 方法的局限性,研究人员提出了 LAV 方法。
应用:
- 它用于实际的数据集成系统。
- 它用于恢复检查。
这个怎么运作 ?
通过描述源中存在全局数据库的哪些数据,LAV 可以被认为是源所有者对系统的看法。本地模式即源使用各种表达式根据全局模式进行描述。 Source 提供表达式以从全局模式片段生成信息。在 Mediator 的帮助下,整理这些表达式以找到所有可能的方式来回答被触发的查询。
LAV 遵循双重方法,其中局部关系被定义为对全局关系的看法。目的是以这样的方式描述全局模式:除了涉及更改的源定义之外,当数据源加入或离开集成系统时,单个定义不会更改。该系统的质量是根据我们对来源进行表征的程度来衡量的。
在 LAV 中,本地到全局的对应关系可以表示为一组映射:
其中 R i是本地模式的任何关系,U i是对全局模式的查询,而 I 是返回 R i 的所有属性的查询。
这可以通过以下示例来说明:
这里,
MovieGenres(Title, Genre) ⊆ Movie(Title, Dir, Year, Genre)
MovieDirectors(Title, Dir) ⊆ Movie(Title, Dir, Year, Genre)
MovieYears(Title, Year) ⊆ Movie(Title, Dir, Year, Genre)
ActorDirectors(Actor, Dir) ⊆ Movie(Title, Dir, Year, Genre),
Actors(Title, Name)
遵循 LAV 方法的数据集成系统示例:
- 信息流形 –
Information Manifold (IM) 是用于浏览和查询众多网络信息源的系统。 - DWQ –
DWQ 集成架构遵循 LAV 方法,并根据全局模式定义数据仓库表和源表。它在扩展实体关系(ER)数据模型的概念级别使用丰富的建模语言。因此,它与各种概念建模工具完全兼容。 - 照片 –
Picsel 是建立在分散且可能异构的源上的信息集成系统。
好处 :
- 由于源的映射不引用系统中的其他源,因此各种源可以相互独立地注册。
- 当参与的数据源频繁变化时,局部和全局关系之间存在松散耦合,这增强了数据集成系统的灵活性和健壮性。
- LAV 映射可以非常详细地描述数据源的内容。
缺点:
- 无法对全局模式中不存在信息的源进行建模。因此,LAV 系统必须经常处理部分答案。
- 现有的 LAV 查询重写器仅管理 NP 完全的联合查询。
- LAV 系统的声明性使查询回答变得非常重要。因此,为了获得针对全局模式的已触发查询的答案,必须将其转换为针对本地模式的相应查询。这种问题称为使用视图重写查询。
- 遵循 LAV 方法的数据集成系统比使用 GAV 方法的数据集成系统相对复杂。