前言
在上一篇我们演示了如何使用Flink 的Table Api 读取文件数据,并过滤特定字段的数据,本篇在上一篇的基础上,将从CSV文件中读取的数据重新输出到一个新的CSV文件中;
在实际业务场景下,也有不少类似的操作,即源文件放在某个文件目录下,通过flink程序读取,然后按照业务规则对读取进来的数据做适当的转换等类似ETL的操作,之后再输出到其他的地方,可以是文件系统,或者数据库、kafka、es等;
本例演示将数据写出到一个新的CSV文件中;
前置准备
准备一个CSV格式的文件,内容如下:

核心代码如下:
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.DataTypes;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.java.StreamTableEnvironment;
本文介绍了如何使用Flink的Table API从CSV文件读取数据,进行过滤操作后,将结果输出到新的CSV文件。通过实例展示了在实际ETL流程中,Flink如何处理文件数据并进行转换。前置准备包括准备CSV源文件,最终程序成功运行会在resources目录下生成新文件,包含过滤后的数据。
订阅专栏 解锁全文

9747

被折叠的 条评论
为什么被折叠?



