存储架构 2018-04-10

Apache Flink 分布式执行

Flink 的分布式执行过程包含两个重要的角色,master 和 worker,参与 Flink 程序执行的有多个进程,包括 Job Manager,Task Manager 以及 Job Client,下图展示了 Flink ……
综合技术 2018-01-06

Apache Flink:Keyed Window与Non-keyed Window

Apache Flink中,Window操作在流式数据处理中是非常核心的一种抽象,它把一个无限流数据集分割成一个个有界的Window(或称为Bucket),然后就可以非常方便地定义作用于Wi……
存储架构 2017-11-30

Learning Apache Flink(API)

本文是参考Apache Flink v1.3官方文档,本文所使用的是scala版本的API,基础架构参见 《Learning Apache Flink(BASIC)》 业务场景 Flink接kafka的数据,然后通过……
综合编程 2017-09-27

Apache Spark vs. Apache Flink

If you look at this image with a list of Big Data tools it may seem that all possible niches in this field are already occupied. With so much competition it ……