Kafka深度解析

作者：禅与计算机程序设计艺术

1.简介

2011年3月，LinkedIn公司推出了分布式计算系统Kafka。它是一个开源分布式流处理平台，由Scala开发而成，最初被设计用于处理实时数据流。它能够处理具有低延迟、高吞吐量的实时数据，并可用于传输各种数据，如日志、网站点击流、交易等。
在过去的一段时间里，Kafka社区已然成为一个活跃的社区，社区经验丰富的成员也积极参与到Kafka的讨论中，共同构建Kafka的生态圈。Apache基金会近年来也在不断吸引着越来越多的大公司加入到Kafka的阵营当中。包括Yahoo、Twitter、LinkedIn、Facebook、Pinterest、Uber等大型公司都纷纷加入到了Kafka社区。其中包括UC Berkeley AMPLab（人类面相工程实验室）、Databricks、Stripe、Cloudera、Confluent、IBM等知名技术企业。
本文将详细阐述关于Kafka背后的理论知识以及一些具体操作技巧，还将以Spark Streaming为代表的另一种流处理框架与Kafka进行比较，并对比其异同点。最后，本文还将给出一些常见问题及相应的解答。

2.基本概念术语说明

2.1 什么是Kafka？

Kafka是分布式流处理平台，它是一个开源项目，由Apache Software Foundation开发，提供基于发布-订阅模式的消息传递服务。Kafka可以作为一个分布式的数据管道来源，作为缓冲存储器来存储数据，也可以作为消息代理来分发消息。Kafka是用Scala语言编写的，基于Zookeeper作为协调者实现分布式协调。

2.2 为什么需

标签：自然语言处理人工智能语言模型

本文转载自: https://blog.csdn.net/universsky2015/article/details/132158159
版权归原作者 禅与计算机程序设计艺术 所有，如有侵权，请联系我们删除。

1.简介

2.基本概念术语说明

2.1 什么是Kafka？

2.2 为什么需

发表评论

“Kafka深度解析”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航