JobGenrerator.generateJobs负责Streaming Job的产生,产生并且提交执行Job之后,会发送DoCheckpoint事件,源码如下:
本文深入探讨了Spark-Streaming中KafkaDirectDStream的checkpoint机制。从JobGenerator.generateJobs方法开始,当接收到数据后,会触发DoCheckpoint事件,进而调用JobGenerator.doCheckpoint进行实际的checkpoint操作,包括更新DStream的Checkpoint数据和写入Checkpoint信息到指定目录。详细阐述了DStreamGraph.updateCheckpointData和DirectKafkaInputDStreamCheckpointData的更新过程。在启动StreamingContext时,若提供上一次的Checkpoint信息,可以恢复上一次的DStream状态,从而实现容错。
JobGenrerator.generateJobs负责Streaming Job的产生,产生并且提交执行Job之后,会发送DoCheckpoint事件,源码如下:
1946

被折叠的 条评论
为什么被折叠?
