基于视图的本地视图(LAV)是基于视图的数据集成系统(VDIS)用于执行数据集成(即搜索和组合来自各种来源的数据)的方法。它将每个本地模式描述为对全局模式的函数。在这里,数据源被定义为在提供的架构上的视图。模式的设计方式使其即使在某些数据源加入或离开集成系统时也可以保持稳定性。因此,LAV允许将其他资源自动添加或减少到集成系统中。
一个简短的历史 :
LAV映射的概念主要由Alon Y. Levy,Anand Rajaraman,Joann J. Ordille引入,以克服传统视图进行数据集成的缺点。 LAV映射的思想是定义与全局架构有关的本地架构的每个关系符号。
早期的VDIS遵循全局视图(GAV)方法,其中全局模式是根据本地模式来描述的。由于全局方案是根据源来表示的,因此全局关系不能表示至少在单个源中不存在的任何信息。此外,基于GAV的系统不允许向其他系统独立添加源。
因此,为克服GAV方法的局限性,研究人员提出了LAV方法。
应用范围:
- 它用于实际的数据集成系统。
- 用于恢复检查。
这个怎么运作 ?
通过描述源中存在全局数据库的数据,可以将LAV视为源所有者对系统的看法。使用各种表达式根据全局模式描述本地模式,即源。 Source提供了一些表达式,以从全局模式中生成信息。在Mediator的帮助下,可以对这些表达式进行整理,以找到所有可能的方式来回答被触发的查询。
LAV遵循双重方法,即将本地关系定义为对全球关系的看法。目的是以这样一种方式描述全局模式,即除了涉及变更的数据源的定义之外,当数据源加入或离开集成系统时,各个定义都不会改变。该系统的质量是根据我们对来源的描述程度来衡量的。
在LAV中,局部到全局的对应关系可以表示为一组映射:
其中R i是局部模式的任何关系,U i是在全局模式上的查询,而I是返回R i的所有属性的查询。
可以通过以下示例对此进行说明:
这里,
MovieGenres(Title, Genre) ⊆ Movie(Title, Dir, Year, Genre)
MovieDirectors(Title, Dir) ⊆ Movie(Title, Dir, Year, Genre)
MovieYears(Title, Year) ⊆ Movie(Title, Dir, Year, Genre)
ActorDirectors(Actor, Dir) ⊆ Movie(Title, Dir, Year, Genre),
Actors(Title, Name)
遵循LAV方法的数据集成系统示例:
- 信息集成块–
信息歧管(IM)是用于浏览和查询众多联网信息源的系统。 - DWQ –
DWQ集成体系结构遵循LAV方法,并根据全局架构定义了数据仓库表和源表。它在概念级别使用丰富的建模语言来扩展Entity-Relationship(ER)数据模型。因此,它与各种概念建模工具完全兼容。 - Picsel –
Picsel是一种信息集成系统,它建立在分散且可能是异构的源上。
好处 :
- 各种源可以彼此独立注册,因为源的映射不引用系统中的其他源。
- 当参与的数据源频繁更改时,局部和全局关系之间存在松散耦合,从而增强了数据集成系统的灵活性和健壮性。
- LAV映射可以对数据源的内容进行非常详细的描述。
缺点:
- 无法对全局模式中不存在其信息的源进行建模。因此,LAV系统必须经常处理部分答案。
- 现有的LAV查询重写器仅管理NP完整的联合查询。
- LAV系统的声明性使查询回答工作变得轻而易举。因此,要获得针对针对全局架构的激发查询的答案,必须将其转换为针对本地架构的对应查询。这种问题称为使用视图重写查询。
- 遵循LAV方法的数据集成系统要比使用GAV方法的数据集成系统更为复杂。