深入解析 Java Stream 的 limit 与 skip 操作

List<Integer> numbers = Arrays.asList(10, 2, 8, 1, 5);

// 截取前3个元素并排序
List<Integer> result = numbers.stream()
    .sorted()
    .limit(3)
    .collect(Collectors.toList());

System.out.println(result); // 输出: [1, 2, 5]

2. 与无限流的结合

// 生成10个随机数的Stream
Stream<Double> randomNumbers = Stream.generate(Math::random)
    .limit(10);

randomNumbers.forEach(System.out::println);

3. 底层实现原理

当调用 limit(n) 时，Stream 会创建一个新的 ReferencePipeline.Limit 实例
对于有序 Stream，limit 操作会严格按照元素顺序截取
对于并行 Stream，limit 会通过分段处理确保元素顺序正确

二、skip 操作：跳过前 N 个元素

skip(n) 方法用于跳过 Stream 中的前 n 个元素，返回剩余元素组成的新 Stream。它是 limit 的反向操作，同样属于中间操作，不会立即执行计算。

1. 基本用法

List<String> names = Arrays.asList("Alice", "Bob", "Charlie", "David", "Eve");

// 跳过前2个元素
List<String> result = names.stream()
    .skip(2)
    .collect(Collectors.toList());

System.out.println(result); // 输出: [Charlie, David, Eve]

2. 与过滤操作结合

// 跳过前3个偶数
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8);
List<Integer> result = numbers.stream()
    .filter(n -> n % 2 == 0)  // 先过滤偶数
    .skip(3)                  // 跳过前3个
    .collect(Collectors.toList());

System.out.println(result); // 输出: [8]（假设过滤后得到[2,4,6,8]，跳过前3个剩下8）

3. 边界情况处理

当 n ≥ 元素总数时，skip(n) 会返回空 Stream
与 limit 不同，skip 不是短路操作，需要遍历前 n 个元素才能执行

三、limit 与 skip 的性能对比与优化

场景	limit 性能表现	skip 性能表现
小规模数据	两者差异不明显	两者差异不明显
大规模数据	高效（短路特性）	需要遍历前 n 个元素
并行 Stream	分段处理更高效	并行处理复杂度更高
无限流处理	唯一可行方案	无法处理无限流

优化建议：

优先使用 limit 处理大规模数据，利用其短路特性减少计算量
避免对无序 Stream 使用 skip，可能导致元素顺序不可控
在并行 Stream 中，limit 的性能优势更为明显

四、实际应用场景

1. 数据分页处理

// 模拟数据库分页查询（第2页，每页3条数据）
List<User> users = userService.getAllUsers();
int page = 2;
int pageSize = 3;

List<User> pageData = users.stream()
    .skip((page - 1) * pageSize)
    .limit(pageSize)
    .collect(Collectors.toList());

2. 日志采样分析

// 从日志流中采样100条数据进行分析
Stream<String> logStream = logReader.readAllLogs();
logStream
    .limit(100)
    .forEach(log -> analyzeLog(log));

3. 数据流预处理

// 跳过无效数据头，处理有效数据
Stream<String> dataStream = fileReader.lines();
dataStream
    .skip(5)  // 跳过前5行表头
    .limit(1000)  // 处理前1000行数据
    .map(LineProcessor::process)
    .collect(Collectors.toList());

五、注意事项与陷阱

顺序依赖性
- limit 和 skip 对有序 Stream 效果确定，但对无序 Stream（如 HashSet 转换的 Stream）可能产生不可预测结果
与并行操作的兼容性
- 并行 Stream 中的 limit 可能因分段处理导致元素顺序与预期不同
- 建议在使用 skip 前先进行排序（sorted）以确保顺序
性能陷阱
- 对超大集合使用 skip(n) 时，若 n 接近集合大小，效率远低于直接截取子列表
- 示例：list.stream().skip(list.size() - 10) 不如直接使用 list.subList(list.size() - 10, list.size())