MySQL 8.0 vs 5.7：JSON支持与窗口函数实战对比（附性能测试）

最新推荐文章于 2026-04-02 12:14:23 发布

原创

最新推荐文章于 2026-04-02 12:14:23 发布 · 259 阅读

标签

#MySQL #数据库升级 #JSON #窗口函数

MySQL 8.0 vs 5.7：JSON支持与窗口函数实战对比（附性能测试）

如果你还在用MySQL 5.7处理复杂的JSON数据或者做数据分析报表，可能会感觉有点“力不从心”。我最近把一个老项目的数据库从5.7升级到了8.0，整个过程就像给一辆老爷车换上了新引擎——动力响应和操控感完全不一样了。特别是处理那些嵌套的JSON配置和需要排名的销售数据时，原先需要写一堆子查询和临时表的复杂操作，现在几行清晰的SQL就能搞定。这篇文章，我就结合自己踩过的坑和实际测试的数据，带你深入看看MySQL 8.0在JSON支持和窗口函数这两个核心特性上，到底比5.7强在哪里，值不值得你花时间去升级。

1. JSON数据处理：从“能存”到“好用”的飞跃

JSON在现代应用里太常见了，用户配置、日志记录、API响应，到处都有它的身影。MySQL 5.7引入了原生的JSON数据类型，这确实是个进步，至少不用再把JSON当普通文本字符串存了，数据库能帮你校验格式。但用久了你会发现，它更像是一个“只读仓库”——存进去没问题，想高效地查、改、分析，就得费不少功夫。

1.1 MySQL 5.7的JSON：基础支持与手动优化

在5.7里，你确实可以创建一个JSON字段。基本的提取函数JSON_EXTRACT()（或者用->这个简写操作符）也能工作。但它的局限性很快会在实际开发中暴露出来。

最头疼的问题之一：索引支持。 5.7不能直接在JSON字段的某个路径上创建索引。想加速查询？你得绕个弯子，通过生成列（Generated Column） 来实现。比如，你有一个存储用户信息的profile JSON字段，里面有个username路径，你想根据用户名快速查找。

-- 在MySQL 5.7中
CREATE TABLE users_57 (
    id INT PRIMARY KEY AUTO_INCREMENT,
    profile JSON,
    -- 创建一个存储的生成列来提取用户名
    username VARCHAR(100) AS (JSON_UNQUOTE(profile->'$.username')) STORED
);

-- 然后在这个生成列上创建索引
CREATE INDEX idx_username ON users_57(username);

注意：这里必须使用STORED（存储）类型的生成列，VIRTUAL（虚拟）列在5.7里无法被索引。这意味着每次插入或更新数据时，数据库都要额外计算并物理存储这个username的值，增加了写开销和存储空间。

另一个麻烦是修改数据。 5.7缺乏原生的JSON更新函数。如果你想修改JSON对象中某个键的值，或者向数组里添加元素，你需要把整个JSON文档取出来，在应用层用编程语言（如Python、PHP）修改，然后再写回数据库。这个过程不仅繁琐，而且在并发场景下容易产生数据竞争。

-- 假设要更新profile中的city字段，在5.7中没有直接的方法
-- 通常需要在应用层完成：
-- 1. SELECT profile FROM users_57 WHERE id = 1;
-- 2. 在代码中解析JSON，修改city的值
-- 3. UPDATE users_57 SET profile = '{"username": "alice", "city": "New York"}' WHERE id = 1;

1.2 MySQL 8.0的JSON：功能全面内化

升级到8.0后，JSON处理体验是质的提升。它引入了一系列新的JSON函数，让很多操作变得原子化和高效。

首先是强大的JSON_SET(), JSON_REPLACE(), JSON_REMOVE()。 现在，你可以直接在SQL里精准地修改JSON文档的局部，而无需读写整个文档。这大大简化了代码，也提升了性能。

-- 在MySQL 8.0中，直接更新JSON内部的某个值
UPDATE users_80
SET profile = JSON_SET(profile, '$.city', 'Berlin')
WHERE id = 1;
-- 或者使用JSON_REPLACE替换值，JSON_REMOVE删除键

其次是增强的查询能力。 JSON_TABLE()函数是一个“游戏规则改变者”，它能把一个JSON数组“展开”成一张临时关系表，让你可以用标准的SQL去JOIN、WHERE、GROUP BY。这对于处理API返回的数组数据或者日志聚合特别有用。

-- 假设profile里有一个`skills`数组：["MySQL", "Python", "Docker"]
SELECT u.id, jt.skill
FROM users_80 u,
     JSON_TABLE(
         u.profile,
         '$.skills[*]' COLUMNS (
             skill VARCHAR(50) PATH '$'
         )
     ) AS jt
WHERE jt.skill LIKE '%SQL%';

这个查询会为每个用户的每一项技能生成一行记录，从而可以方便地进行筛选。

索引支持也变得更优雅。