(1)合并记录步骤说明
###旧数据来源:旧数据来源的步骤
###新数据来源:新数据来源的步骤
标志字段:设置标志字段的名称,标志字段用于保存比较的结果,比较结果有下列几种。
1. “identical” – 旧数据和新数据一样
2. “changed” – 数据发生了变化;
3. “new” – 新数据中有而旧数据中没有的记录
4. “deleted” –旧数据中有而新数据中没有的记录
###关键字段:用于定位两个数据源中的同一条记录。
###比较字段:对于两个数据源中的同一条记录中,指定需要比较的字段。
###合并后的数据将包括旧数据来源和新数据来源里的所有数据,对于变化的数据,使用新数据代替旧数据,同时在结果里用一个标志字段,来指定新旧数据的比较结果。
###注意:
旧数据和新数据需要事先按照关键字段排序。
旧数据和新数据要有相同的字段名称。

(2)多表连接示例


附:在数据抽取过程中出现中文乱码问题,可行解决办法有:
打开Spoon.bat,在if “%PENTAHO_DI_JAVA_OPTIONS%”==”” set PENTAHO_DI_JAVA_OPTIONS=”-Xms1024m” “-Xmx2048m” “-XX:MaxPermSize=256m”,后面加了”-Dfile.encoding=UTF-8”,再重启即可解决乱码。
博客介绍了合并记录的步骤,包括旧数据与新数据来源步骤,设置标志字段保存比较结果,指定关键字段和比较字段,合并后用新数据替代变化数据。还给出多表连接示例,同时提及数据抽取中文乱码的解决办法。
-合并记录&spm=1001.2101.3001.5002&articleId=90576734&d=1&t=3&u=c7df560f3fff4efb9b174739a5b8ba01)
2290

被折叠的 条评论
为什么被折叠?



