Flink 使用Table Api 读取文件数据并写出到文件中

最新推荐文章于 2023-05-17 00:00:00 发布

原创最新推荐文章于 2023-05-17 00:00:00 发布 · 8.6k 阅读

标签

#flink #大数据

flink 入门到精通专栏收录该内容

40 篇文章 ¥15.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何使用Flink的Table API从CSV文件读取数据，进行过滤操作后，将结果输出到新的CSV文件。通过实例展示了在实际ETL流程中，Flink如何处理文件数据并进行转换。前置准备包括准备CSV源文件，最终程序成功运行会在resources目录下生成新文件，包含过滤后的数据。

前言

在上一篇我们演示了如何使用Flink 的Table Api 读取文件数据，并过滤特定字段的数据，本篇在上一篇的基础上，将从CSV文件中读取的数据重新输出到一个新的CSV文件中；

在实际业务场景下，也有不少类似的操作，即源文件放在某个文件目录下，通过flink程序读取，然后按照业务规则对读取进来的数据做适当的转换等类似ETL的操作，之后再输出到其他的地方，可以是文件系统，或者数据库、kafka、es等；

本例演示将数据写出到一个新的CSV文件中；

前置准备

准备一个CSV格式的文件，内容如下：

核心代码如下：

import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.DataTypes;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.java.StreamTableEnvironment;

了解本专栏

超级会员免费看