CSharpFlink 实时计算引擎,增加一个窗口或表达式计算任务支持多个算子实例

更新内容:

1.计算任务增加ResultId,用于保存(Sink)数据的时候标识计算结果。

2.窗口或表达式计算任务支持多个算子实例,应用场景,例如:一个窗口的数据,可以同时计算和值、均值或最大值等。

CSharpFlink

a real-time computing framework

官方网址 http://www.ineuos.net/

技术博客 https://www.cnblogs.com/lsjwq/

gitee地址: https://gitee.com/wxzz/CSharpFlink

1 项目背景

我们有一个全国性质的面向工业的公有云平台,通过专线或4G的链路方式实时向平台传输数据,每天处理1亿条左右的数据量,为现场用户提供实时的在线服务和离线数据分析服务。现在已经上线稳定运行有将近3年的时间。同时也为工业企业提供私有云建设服务。

我们计划使用Flink作为云平台后台的实时计算部分,基本实现数据点的聚合计算、表达式规则计算等业务,进一步实现机器学习或自定义复杂算法的需求。

我们经过将近一年左右时间的研究及开发,已经基本实现了聚合和逻辑等业务,但是感觉Flink比较重,并且应用和运维的水平要求比较高。

基于上述情况,我们自主使用 NET 5.0 开发一套 CSharpFlink 实时计算组件,支持自定义数据源、计算和存储的基本要求。

2 应用场景

主要面向物联网、工业互联网私有云或公有云平台建设过程中的数据点实时聚合和表达式计算。应用场景包括:

  • 数据点的实时时间窗口范围内聚合计算,例如:最大值、最小值、平均值、和值、众数、方差、中位数等,可以自定义二次开发。
  • 数据点的历史延迟窗口的一段时间范围内数据补充或更新的重新计算。
  • 数据点的表达式计算,支持自定义C#脚本进行编辑,实时预警或数据深度加工处理。
  • 主从结构的分布式部署,主节点负责计算任务分发,工作节点负责任务计算及结果存储。

3 框架特点

主要特点主要是根据我们多年的物联网、工业项目经验的提炼和总结,满足实现应用场景,特点包括:

  • 使用最新的NET 5.0进行开发,完全跨平台。
  • 实时数据窗口范围外的数据补发或更新的重新计算,例如:当前5秒的实时数据窗口,支持5秒以前的数据补充和更新,并且进行重新计算及更新到数据存储单元。
  • 实时数据表达式计算支持定时计算或数据值改事件变触发计算,满足实时表达式或周期性计算。
  • C#语言的二次开发,对接多种数据源,自定义算子和多种方式数据存储等。
  • 单节点或分布式部署。
开源中国
我还没有学会写个人说明!
上一篇

2021年电视盒子性能排行榜,高端配置电视盒子如何选择

下一篇

一些科学家担心新冠疫苗对病毒新变种的有效性会降低

你也可能喜欢

评论已经被关闭。

插入图片