📅  最后修改于: 2023-12-03 14:59:20.557000             🧑  作者: Mango
Apache Kafka是一种分布式的消息系统,由LinkedIn公司开发,被广泛应用于大数据领域。它是一种高吞吐量、低延迟的消息队列,可用于解耦系统、扩展系统和构建实时数据流。
首先,需要在Apache Kafka官网上下载Kafka,然后解压并配置环境变量。Kafka运行需要一个ZooKeeper实例来管理和协调Kafka集群的节点。
安装和启动ZooKeeper:
# 下载ZooKeeper
wget https://downloads.apache.org/zookeeper/zookeeper-3.6.3/apache-zookeeper-3.6.3-bin.tar.gz
# 解压
tar -xf apache-zookeeper-3.6.3-bin.tar.gz
# 配置ZooKeeper
cd apache-zookeeper-3.6.3-bin/conf
cp zoo_sample.cfg zoo.cfg
# 启动
cd ..
./bin/zkServer.sh start
Kafka采用生产者-消费者模型,生产者向Kafka发送消息,消费者从Kafka接收消息。以下是一个发送消息的例子:
from kafka import KafkaProducer
producer = KafkaProducer(bootstrap_servers=['localhost:9092'])
producer.send('test-topic', b'Hello, World!')
此代码使用KafkaProducer
类创建生产者实例并指定Kafka集群的地址。然后使用send
方法向名为test-topic
的主题发送一条消息。
以下是一个接收消息的例子:
from kafka import KafkaConsumer
consumer = KafkaConsumer('test-topic', bootstrap_servers=['localhost:9092'])
for message in consumer:
print(message.value.decode())
此代码使用KafkaConsumer
类创建消费者实例并指定要消费的主题和Kafka集群的地址。然后使用for
循环从消费者实例中获取消息并打印消息的值。
Apache Kafka是一个功能强大的分布式消息系统,它可以用于解耦系统、扩展系统和构建实时数据流。本文介绍了如何安装和配置Kafka,以及如何使用Python代码发送和接收消息。