📅  最后修改于: 2020-11-28 12:57:08             🧑  作者: Mango
数据分析是分析原始数据以收集相关信息以做出更好决策的过程。它主要在许多组织中用于制定业务决策。好吧,大数据分析涉及大量数据,并且此过程非常复杂,因此公司使用不同的策略。
例如,Facebook是全球领先的数据驱动和最大的数据仓库公司之一。 Facebook仓库数据存储在Hadoop中以进行大规模计算。后来,当仓库数据增长到PB时,他们决定开发一种低延迟的新系统。在2012年,Facebook团队成员设计了“ Presto”用于交互式查询分析,即使有PB级数据也可以快速运行。
Apache Presto是一个分布式并行查询执行引擎,针对低延迟和交互式查询分析进行了优化。 Presto可以轻松地运行查询,并且可以在不停机的情况下进行扩展,甚至从数GB到PB也可以。
一个Presto查询可以处理来自多个来源的数据,例如HDFS,MySQL,Cassandra,Hive和更多数据源。 Presto用Java内置,并且易于与其他数据基础架构组件集成。 Presto功能强大,Airbnb,DropBox,Groupon和Netflix等领先公司正在采用它。
Presto包含以下功能-
这是Apache Presto提供的好处的列表-
Presto支持当今大多数最佳工业应用。让我们看一些著名的应用程序。
Facebook -Facebook为数据分析需求而构建了Presto。 Presto可轻松扩展大规模数据。
Teradata -Teradata在大数据分析和数据仓库中提供端到端解决方案。 Teradata对Presto的贡献使更多公司更容易满足所有分析需求。
Airbnb -Presto是Airbnb数据基础架构的组成部分。好吧,每天都有数百名员工使用该技术运行查询。
Presto支持标准的ANSI SQL,这使得数据分析师和开发人员非常容易。尽管它是用Java内置的,但它避免了与内存分配和垃圾回收有关的Java代码的典型问题。 Presto具有Hadoop友好的连接器体系结构。它允许轻松地插入文件系统。
Presto可在多个Hadoop发行版上运行。此外,Presto可以从Hadoop平台联系查询Cassandra,关系数据库或其他数据存储。这种跨平台的分析功能使Presto用户能够从千兆字节到PB的数据中提取最大的业务价值。