关注

流批一体计算引擎-20-Table API和SQL两种声明式API的应用对比

1 Flink的核心API

Flink提供了两个核心的API来处理流数据和批数据:DataStream API和Table API。它们各有侧重,开发者可以根据需求选择,甚至在同一个程序中混合使用。

1.1 DataStream API精细控制的命令式编程

DataStream API是Flink的核心,它是一个低级别、命令式的API。
1、编程范式:你需要明确地定义每一步的数据处理逻辑,例如使用map、filter、keyBy、window等算子来构建数据处理流水线。
2、适用场景
(1)需要对时间、状态、窗口等流处理原语进行精细控制的复杂逻辑。
(2)需要实现自定义的低层级操作,如处理定时器、访问底层状态等。
(3)对性能有极致要求,需要手动优化数据流处理过程。
3、优点:灵活性极高,几乎可以实现任何复杂的流处理逻辑。

1.2 Table API结构化数据处理的声明式编程

Table API提供了更高层次的抽象,它是一个声明式的、关系型API。
1、编程范式:你只需关注“想要什么”(即业务逻辑),而不是“如何实现”(即执行细节)。它使用类似SQL的语法来操作数据,例如 select、groupBy、join等。
2、适用场景
(1)处理结构化数

转载自CSDN-专业IT技术社区

原文链接:https://blog.csdn.net/qq_20466211/article/details/158265382

评论

赞0

评论列表

微信小程序
QQ小程序

关于作者

点赞数:0
关注数:0
粉丝:0
文章:0
关注标签:0
加入于:--