发现企业数据源是一项耗时的挑战,通常是基于部落知识的。数据目录现在使数据发现变得简单。数据目录是一项完全托管且可扩展的数据发现和元数据管理服务,使组织能够快速发现,理解和管理Google Cloud中的所有数据。在本文中,我们将使用数据目录来处理数据发现。
数据发现通常从一个问题开始。我们供应链中最慢的环节是什么?用户花费大量的时间和精力来发现,验证和访问正确的数据集和源,并能够回答他们的问题。但是,由于采用了支持Gmail和云端硬盘的相同技术,因此,数据目录提供了一个简单易用的用户界面,并具有强大的结构化搜索功能,可以快速轻松地查找数据资产。
现在,让我们来看一下它的作用。使用数据目录顶部的搜索栏,您可以搜索BigQuery和Cloud Pub / Sub中的所有数据资产。
Google将来会添加其他数据源,包括内部部署。数据目录还提供多方面的搜索,使用户可以在数百万个数据资产中按类型,列和标签进行搜索。
在搜索栏之外,您可以查看流行的表格,这些表格涵盖了过去30天内查询最多和查看过的BigQuery表格。您还可以浏览“发布/子主题”以及表格和视图,并开始创建标签模板。 Data Catalog的优点在于它具有内置的访问级别控件,这些控件可兑现源ACL,从而使用户能够以无缝,更安全的方式开始进行数据探索。