📝 Apache Storm教程

14篇技术文档
  Apache Storm教程

📅  最后修改于: 2020-12-02 05:53:33        🧑  作者: Mango

Storm最初是由Nathan Marz及其BackType团队创建的。 BackType是一家社交分析公司。后来,Storm被Twitter收购并开源。在短时间内,Apache Storm成为分布式实时处理系统的标准,使您可以处理类似于Hadoop的大量数据。 Apache Storm用Java和Clojure编写。它继续成为实时分析的领导者。本教程将探讨Apache Storm的原理,分布式消...

  Apache Storm-简介

📅  最后修改于: 2020-12-02 05:53:58        🧑  作者: Mango

什么是Apache Storm?Apache Storm是一个分布式实时大数据处理系统。 Storm设计为以容错和水平可伸缩方法处理大量数据。它是具有最高摄取速率能力的流数据框架。尽管Storm是无状态的,但它通过Apache ZooKeeper管理分布式环境和集群状态。这很简单,您可以并行对实时数据执行各种操作。Apache Storm继续成为实时数据分析的领导者。 Storm易于设置,操作,并...

  Apache Storm-核心概念

📅  最后修改于: 2020-12-02 05:54:27        🧑  作者: Mango

Apache Storm从一端读取实时数据的原始流,并将其通过一系列小型处理单元,然后在另一端输出已处理的/有用的信息。下图描述了Apache Storm的核心概念。现在让我们仔细看看Apache Storm的组件-ComponentsDescriptionTupleTuple is the main data structure in Storm. It is a list of ordered...

  Apache Storm-集群体系结构

📅  最后修改于: 2020-12-02 05:54:49        🧑  作者: Mango

Apache Storm的主要亮点之一是它是一种容错的,快速的,没有“单一故障点”(SPOF)分布式应用程序的应用程序。我们可以根据需要在许多系统中安装Apache Storm,以增加应用程序的容量。让我们看一下Apache Storm集群的设计方式及其内部架构。下图描述了集群设计。Apache Storm具有两种类型的节点:Nimbus(主节点)和Supervisor(工作节点)。 Nimbus...

  Apache Storm-工作流程

📅  最后修改于: 2020-12-02 05:55:09        🧑  作者: Mango

正常运行的Storm集群应具有一个灵气和一个或多个主管。另一个重要的节点是Apache ZooKeeper,它将用于在灵气和主管之间进行协调。现在让我们仔细看看Apache Storm的工作流程-最初,灵气将等待“风暴拓扑”被提交给它。提交拓扑后,它将处理该拓扑并收集所有要执行的任务以及任务执行的顺序。然后,灵气将把任务平均分配给所有可用的主管。在特定的时间间隔内,所有主管都将向心律图发送心跳,以...

  Storm-分布式消息系统

📅  最后修改于: 2020-12-02 05:55:33        🧑  作者: Mango

Apache Storm处理实时数据,输入通常来自消息队列系统。外部分布式消息传递系统将提供实时计算所需的输入。 Spout将从消息传递系统中读取数据,并将其转换为元组,然后输入到Apache Storm中。有趣的事实是,Apache Storm在内部使用其自己的分布式消息传递系统进行其灵气与主管之间的通信。什么是分布式消息传递系统?分布式消息传递基于可靠消息队列的概念。消息在客户端应用程序和消息...

  Apache Storm-安装

📅  最后修改于: 2020-12-02 05:56:06        🧑  作者: Mango

现在让我们看看如何在您的计算机上安装Apache Storm框架。这里有三个majo步骤-如果尚未安装Java,请在系统上安装它。安装ZooKeeper框架。安装Apache Storm框架。步骤1-验证Java安装使用以下命令检查系统上是否已安装Java。如果Java已经存在,那么您将看到其版本号。否则,请下载最新版本的JDK。步骤1.1-下载JDK使用以下链接下载最新版本的JDK:www.or...

  Apache Storm-工作示例

📅  最后修改于: 2020-12-02 05:57:19        🧑  作者: Mango

我们已经了解了Apache Storm的核心技术细节,现在是时候编写一些简单的场景了。方案–移动呼叫日志分析器移动呼叫及其持续时间将作为Apache Storm的输入,Storm将处理和分组同一呼叫者和接收者之间的呼叫及其总呼叫数。壶嘴创作Spout是用于数据生成的组件。基本上,喷口将实现IRichSpout接口。 “ IRichSpout”界面具有以下重要方法-开放式-为壶嘴提供执行环境。执行者...

  Apache Storm-三叉戟

📅  最后修改于: 2020-12-02 05:58:34        🧑  作者: Mango

三叉戟是Storm的扩展。像暴风雨一样,Trident也由Twitter开发。开发Trident的主要原因是在Storm之上提供高级抽象以及状态流处理和低延迟分布式查询。Trident使用喷嘴和螺栓,但是这些低级组件在执行之前由Trident自动生成。 Trident具有功能,过滤器,联接,分组和聚合。Trident将流作为一系列批处理(称为事务)进行处理。通常,这些小批量的大小将取决于输入流,成...

  Twitter中的Apache Storm

📅  最后修改于: 2020-12-02 05:59:24        🧑  作者: Mango

在本章的此处,我们将讨论Apache Storm的实时应用程序。我们将看到如何在Twitter中使用Storm。推特Twitter是一种在线社交网络服务,提供了发送和接收用户推文的平台。注册用户可以阅读和发布推文,但未注册用户只能阅读推文。 Hashtag用于通过在相关关键字之前附加#来按关键字对推文进行分类。现在,让我们以实时场景为例,查找每个主题使用最多的主题标签。壶嘴创作喷口的目的是尽快获得...

  Yahoo!中的Apache Storm!金融

📅  最后修改于: 2020-12-02 05:59:55        🧑  作者: Mango

雅虎!财经是互联网上领先的商业新闻和金融数据网站。它是Yahoo!的一部分!并提供有关金融新闻,市场统计数据,国际市场数据以及其他任何人均可访问的金融资源的信息。如果您是注册的Yahoo!用户,则可以自定义Yahoo!财务可以利用其某些产品。雅虎! Finance API用于查询Yahoo!的财务数据。该API显示的数据与实时数据相比延迟了15分钟,并且每1分钟更新一次其数据库,以访问当前与库存相...

  Apache Storm-应用程序

📅  最后修改于: 2020-12-02 06:00:11        🧑  作者: Mango

Apache Storm框架支持当今许多最佳的工业应用程序。在本章中,我们将简要介绍Storm的一些最著名的应用程序。克鲁特Klout是一个应用程序,使用社交媒体分析通过Klout Score(介于1到100之间的数字值)基于在线社交影响力对其用户进行排名。Klout使用Apache Storm的内置Trident抽象来创建流数据的复杂拓扑。天气频道天气频道使用Storm拓扑来获取天气数据。它已与...

  Apache Storm-有用的资源

📅  最后修改于: 2020-12-02 06:00:28        🧑  作者: Mango

以下资源包含有关Apache Storm的其他信息。请使用它们来获得有关该主题的更深入的知识。关于Apache Storm的有用链接Apache Storm-Apache StormApache Storm Wiki-有关Apache Storm的维基百科参考关于Apache Storm的有用书籍要在此页面上注册您的网站,请发送电子邮件至...

  讨论Apache Storm

📅  最后修改于: 2020-12-02 06:00:42        🧑  作者: Mango

Storm最初由BackType的Nathan Marz及其团队创建。 BackType是一家社交分析公司。后来,Storm被Twitter收购并开源。在短时间内,Apache Storm成为分布式实时处理系统的标准,使您可以处理类似于Hadoop的大量数据。 Apache Storm用Java和Clojure编写。它继续成为实时分析的领导者。本教程将探讨Apache Storm的原理,分布式消息...