|
我在用datastage的时候发现有些stage例如join stage,aggregate stage,sort stage等, 不就实现了order by ,sum ,连接等sql功能吗,那么我干嘛不在数据源的时候就做好这些事情呢,何必用这些stage呢? 例如我搞个odbc stage,自定义 sql select count(1),a from A group by a不就可以了吗
-- 我也感觉得是性能问题。比如用lookup做关联匹配的速度,比在Oracle里面用存储过程处理要快,当然原因有很多方面的,比如DS服务器性能和数据仓库的服务器性能差异,网络因素等。
-- 数据量不大的话,在数据库端做确实比较好。 --
|
为什么用datastage而不直接用sql
最新推荐文章于 2024-11-08 00:02:27 发布
本文探讨了在ETL工具DataStage中使用joinstage、aggregatestage、sortstage等特定功能的原因,与直接在数据源执行SQL操作进行筛选、聚合、排序的区别,重点阐述了性能考量及不同数据规模下选择的最佳实践。

1572

被折叠的 条评论
为什么被折叠?



