数据治理中Oracle SQL和存储过程的数据血缘分析

最新推荐文章于 2026-04-30 12:26:59 发布

原创

最新推荐文章于 2026-04-30 12:26:59 发布 · 1.3k 阅读

标签

#sql #数据库 #oracle

收录于

本文探讨了在数据治理中如何通过自动解析和分析Oracle SQL语句与存储过程来揭示数据血缘，重点介绍如何使用SQLFlow工具进行可视化和API自动化。涵盖了从SELECT语句到存储过程的实例，以及SQLFlow在数据血缘追踪中的应用。

数据治理中的一个重要基础工作是分析组织中数据的血缘关系。有了完整的数据血缘关系，我们可以用它进行数据溯源、表和字段变更的影响分析、数据合规性的证明、数据质量的检查等。

分析数据血缘的方法主要分为四类

自动解析
系统跟踪
机器学习
人工收集

自动解析主要是利用工具解析 SQL 语句、存储过程和 ETL等文件。本文以 Oracle 为例，来说明如何分析 SQL 和存储过程中的数据血缘。

产生数据血缘的 SQL 语句

SELECT
INSERT
UPDATE
MERGE
CREATE VIEW
CREATE TABLE
存储过程

SELECT

可能你会感到奇怪， SELECT 语句没有对数据进行增、改操作，如何会产生数据血缘？秘密就在于 SELECT 语句中的 select list 部分，在这里，可以对数据进行转换。以下面这个 SELECT 语句为例：

select  sal + commission as totalSal
from emp;

我们可以看到，totalSal 字段的数据来自 emp.sal 和 emp.commission，在这里，数据进行了一次转换。这种在 SELECT 内部产生的数据血缘是临时性的，但是这个 SELECT 语句和 CREATE VIEW 或者 CREATE TABLE 一结合，这个数据血缘就真正落地形成了。例如：

create view v_sal(mySal)
as
select  sal + commission as totalSal
from emp;

这个 CREATE VIEW 语句通过 SELECT 形成了从 emp.sal 和 emp.commission 到 v_sal.mySal 的数据血缘。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

liuheping233

关注关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【SQLFlow】马哈鱼—利用元数据提高数据血缘分析的准确性

m0_54252387的博客

07-20

628

治理分析师常常需要对各种复杂场景下的SQL语句进行溯源分析，而限于环境因素，往往只能提供SQL语句给马哈鱼进行分析处理，SQL语句的制造者往往为了简便行事，会产生一些数据库可执行但马哈鱼无法正确识别的一类语句，本文聚焦此处，为各位专家介绍马哈鱼官方对这类问题的解决方案。由于第一张表customer_total_return所使用/返回的列均在SQL语句中显示指定，所以这里不需要额外提供它的定义信息，只需要提供其他两张表的定义，如果您的语句中存在所有表均有上述情况，则需要将所有表的定义提供给马哈鱼供分析。..

1 条评论您还未登录，请先登录后发表或查看评论

【SQLFlow】数据治理中Oracle SQL和存储过程的数据血缘分析

m0_54252387的博客

07-22

1207

中的一个重要基础工作是分析组织中数据的血缘关系。有了完整的数据血缘关系，我们可以用它进行数据溯源、表和字段变更的影响分析、数据合规性的证明、数据质量的检查等。分析数据血缘的方法主要分为四类自动解析主要是利用工具解析SQL语句、和ETL等文件。本文以Oracle为例，来说明如何分析SQL和存储过程中的数据血缘。......

sqllineage解析sql列级血缘并提交到datahub

LCriska的博客

03-04

8921

通过sqllineage获取指定sql文件中HiveSQL的字段级血缘关系，并将结果提交到datahub

SQL血缘解析

butterBallj的博客

12-18

3445

是编程语言解析和编译过程中产生的一种树状数据结构，它表示源代码的语法结构。AST 抽象出代码的语法特征，同时剔除不必要的语法细节，提供了程序结构的抽象表示。

终极SQL血缘分析工具：sqllineage让数据流向一目了然

最新发布

gitblog_00501的博客

04-30

213

你是否曾在复杂的ETL管道中迷失方向，不知道某个数据字段究竟来自哪里？或者在进行数据迁移时，担心某个SQL修改会引发连锁反应？今天，我要向你介绍一个Python驱动的SQL血缘分析神器——sqllineage，它能自动解析SQL语句中的数据流向关系，帮助你轻松追踪数据血缘脉络，让数据治理变得简单高效。 ## 🎯 数据治理的痛点与sqllineage的解决方案想象一下这样的场景：你的公司有数

【亲测免费】探秘 SQL 线索追踪利器：`sqllineage`

gitblog_00022的博客

04-25

1200

在大数据时代，SQL 查询是数据分析师和工程师的主要工具。然而，理解复杂的 SQL 查询如何影响数据模型及数据流动往往是一项挑战。`sqllineage` 就是一个旨在解决这个问题的开源项目，它帮助我们追踪 SQL 查询中的数据源与目标，从而增强数据治理的能力。让我们一起深入了解这个项目的特性、工作原理以及如何使用。 ## 项目简介 [![](https://gitcode.net/mirro...

sqllineage解析FineBI数据集导入Datahub生成血缘

zdsx1104的专栏

01-30

4289

使用Sqllineage解析FineBI、数栖开发平台血缘，导入Datahub生成端到端血缘图

马哈鱼——数据治理中Oracle SQL和存储过程的数据血缘分析

chensuper的专栏

09-12

621

数据治理中的一个重要基础工作是分析组织中数据的血缘关系。有了完整的数据血缘关系，我们可以用它进行数据溯源、表和字段变更的影响分析、数据合规性的证明、数据质量的检查等。分析数据血缘的方法主要分为四类自动解析系统跟踪机器学习人工收集自动解析主要是利用工具解析 SQL 语句、存储过程和 ETL等文件。本文以 Oracle 为例，来说明如何分析 SQL 和存储过程中的数据血缘。产生数据血缘的 SQL 语句 SELECT INSERT UPDATE MERGE CREATE VI

源代码：ZGLanguage 解析SQL数据血缘 之显示复杂SQL脚本结构图

Byron___的博客

02-02

源代码：ZGLanguage 解析SQL数据血缘 之显示复杂SQL脚本结构图

如何在5分钟内发现 SQL 语言中的数据血缘

chensuper的专栏

07-25

937

介绍如何发现 SQL 语句中的数据血缘，哪些 SQL 语句中隐藏着数据血缘关系。如果你想知道自己公司的数据仓库和数据湖中有哪些数据血缘，本文教你在5分钟内，通过分析你企业中已经存在的那些 SQL 语句，来快速获得数据血缘信息。...

5分钟掌握SQLFlow数据血缘追踪：从零开始构建完整数据地图

gitblog_01147的博客

02-24

822

SQLFlow是一款强大的SQL数据血缘分析工具，能够通过解析SQL脚本自动生成数据血缘关系，帮助用户清晰了解数据从源头到目标的完整流转路径。无论是数据治理、影响分析还是故障排查，SQLFlow都能提供直观的可视化数据地图，让数据资产管理变得简单高效。 ## 为什么需要数据血缘追踪？想象数据如同家族血脉，数据血缘就是记录这份"家族关系"的族谱。它能清晰展示： - **数据从哪里来**：识别原

PL/SQL 存储过程血缘解析指南：攻克数据治理的「最后堡垒」

Aloudata的博客

04-17

394

PL/SQL存储过程是传统血缘工具的盲区，解析准确率常低于 80%，而算子级血缘能实现 >99% 的精准解析。

数据治理选型对比：Apache Atlas vs 商业平台在存储过程解析与自动化治理的实测分析

Aloudata的博客

02-03

1098

高精度解析是强大的“武器”，但唯有与业务场景结合，才能转化为真正的“战斗力”。

Datablau数据血缘成功落地中控技术——助力工业AI平台实现全链路数据治理升级

Datablau国产数据库建模工具

02-06

675

中控技术作为工业AI领域的标杆企业，三十余年来深耕流程工业智能化赛道，构建了覆盖全球50多个国家和地区、服务3.5万多家客户的产业生态。在推进第三代数仓建设的关键阶段，中控技术面临多代技术架构迁移与全链路数据管理的双重挑战，Datablau凭借SQLink数据血缘服务平台的专业能力，双方携手完成数据治理攻坚，为工业级数据治理提供了可落地的实践范本。

DataHub——实时数据治理平台

大数据流动

05-07

9374

DataHub首先，阿里云也有一款名为DataHub的产品，是一个流式处理平台，本文所述DataHub与其无关。数据治理是大佬们最近谈的一个火热的话题。不管国家层面，还是企业层面现在对这...

告别人工梳理！Intalink 让数据血缘关系自动浮现，效率提升10倍

YUANtuoshuzhi的博客

03-24

192

数据血缘不是"可有可无"的，是数据治理的基础设施。没有它，数据改版就像蒙眼开车。自动化：从几天到几分钟智能化：AI比人更懂数据关系可视化：一眼看清全貌你的数据团队还在手动梳理血缘吗？你们公司有数据血缘工具吗？你最常遇到的"数据改版翻车"是什么？如果Intalink免费试用，你会第一个试吗？👇 一起聊聊数据人的那些坑。

基于算子级血缘的 Oracle 存储过程自动化迁移：从“黑盒”重构到“白盒”治理

Aloudata的博客

02-06

664

通过深入解析 SQL 内部转换逻辑（Filter, Join, Aggregation 等），为存储过程迁移提供了自动化、精准化的“三阶引擎”。