Kafka权威指南:初识 Kafka
初识 Kafka
Kafka 是一款基于发布与订阅的消息系统。它一般被称为“分布式提交日志”或者“分布式流平台”。
Kafka 的数据单元被称为消息。为了提高效率,消息被分批次写入 Kafka。批次就是一组消息,这些消息属于同一个主题和分区。批次越大,单位时间内处理的消息就越多,单个消息的传输时间就越长。
Kafka 的消息通过主题进行分类。主题就好比数据库的表,或者文件系统的文件夹。主题可以被分成若干个分区,一个分区就是一个提交日志。消息以追加的方式写入分区,然后以先入先出的顺序读取。要注意,由于一个主题一般包含几个分区,因此无法在整个主题范围内保证消息的顺序,但可以保证消息在单个分区的顺序。
Kafka 通过分区来实现数据冗余和伸缩性。分区可以分布在不同的服务器上,也就是说,一个主题可以横跨多个服务器。

我们通常使用流这个词来描述 Kafka 这类系统的数据。很多时候,人们把一个主题的数据看成一个流,不管他有多少个分区。流是一组从生产者移动到消费者的数据。
This chapter requires login to view full content. You are viewing a preview.
Login to View Full Content