当前位置: 首页 > news >正文

277. Java Stream API - 去重与排序:Stream 中的 distinct() 与 sorted()

文章目录

  • 277. Java Stream API - 去重与排序:Stream 中的 `distinct()` 与 `sorted()`
      • 🎯 目标
    • 🧼 `distinct()` —— 去重利器
      • 📌 定义:
      • 🔍 `distinct()` 的内部原理
      • ✅ 示例:整数去重
      • 🔽 输出:
    • 📊 `sorted()` —— 排序操作
      • 📌 定义:
      • 🧠 工作机制:
      • ✅ 示例 1:自然排序(String 实现了 Comparable)
      • 🔽 输出:
      • ✅ 示例 2:按长度排序(使用 Comparator)
      • 🔽 输出:
    • 🔁 无限流中的表现对比
      • ✅ `distinct()` 适用于无限流
        • 示例:
      • 🔽 输出:
      • ❌ `sorted()` 不适用于无限流
        • 示例(反例):
      • ⚠️ 输出:
    • ✅ 总结对比
    • 🧠 延伸小技巧
      • 🧩 想去重自定义对象?

277. Java Stream API - 去重与排序:Stream 中的distinct()sorted()


🎯 目标

本节将讲解如何使用distinct()去除重复值,使用sorted()对流元素排序,包括:

  • 它们的工作机制
  • 使用示例
  • 注意事项(如可用于无限流与否)
  • 性能影响

🧼distinct()—— 去重利器

📌 定义:

distinct()会移除流中重复的元素,依据是元素的:

  • hashCode()
  • equals()

所以:你使用的对象必须正确实现这两个方法,才能保证去重有效。


🔍distinct()的内部原理

distinct()并不像大多数中间操作那样是“无状态”的:

  • 内部维护一个Set集合来追踪已见过的元素。
  • 每处理一个元素,会尝试把它加入Set
    • ✅ 加入成功:表示是第一次出现,传递下游。
    • ❌ 加入失败:说明是重复的,直接丢弃。

⚠️ 因为要维护状态,所以它会占用内存,但能即时输出结果。


✅ 示例:整数去重

List<Integer>ints=List.of(1,4,2,1,3,3);List<Integer>distincts=ints.stream().distinct().toList();System.out.println("distinct ints: "+distincts);

🔽 输出:

distinct ints:[1,4,2,3]

✅ 说明:重复的13被移除了,且保持原始顺序。


📊sorted()—— 排序操作

📌 定义:

sorted()用于将流中的元素排序。

它有两个重载:

Stream<T>sorted();// 自然顺序(元素必须实现 Comparable)Stream<T>sorted(Comparator<?superT>c);// 自定义顺序

🧠 工作机制:

  • sorted()是有状态的中间操作。
  • 必须读取所有元素后再排序输出
  • 所以它不适用于无限流,会导致挂起或卡死。

✅ 示例 1:自然排序(String 实现了 Comparable)

List<String>strings=List.of("one","two","three","four");List<String>naturalSort=strings.stream().sorted().toList();System.out.println("natural sort: "+naturalSort);

🔽 输出:

natural sort:[four,one,three,two]

👉 字符串按照字典序排序。


✅ 示例 2:按长度排序(使用 Comparator)

List<String>shortestFirst=strings.stream().sorted(Comparator.comparingInt(String::length)).toList();System.out.println("shortest first: "+shortestFirst);

🔽 输出:

shortest first:[one,two,four,three]

👉 按字符串长度升序排序。


🔁 无限流中的表现对比

distinct()适用于无限流

可以边处理边输出,只要有足够的终止条件(如limit()),就不会卡死。

示例:
varints=IntStream.iterate(0,i->i+1).map(i->i/3).distinct().limit(5).toArray();System.out.println("ints = "+Arrays.toString(ints));

🔽 输出:

ints=[0,1,2,3,4]

🌟 它发现新值就会推送给下游,表现非常高效!


sorted()不适用于无限流

因为它必须先收集所有元素再排序,所以当流无限时,它永远等不到结束,程序会卡死或耗尽内存。

示例(反例):
int[]ints=IntStream.iterate(0,i->i+1).map(i->i/3).sorted().limit(5).toArray();System.out.println("ints = "+Arrays.toString(ints));

⚠️ 输出:

<程序将无限等待,永远没有结果>

✅ 总结对比

方法是否有状态是否可用于无限流内部机制
distinct()有状态✅ 支持使用Set去重
sorted()有状态❌ 不支持使用缓冲区收集+排序

🧠 延伸小技巧

🧩 想去重自定义对象?

你的类必须实现正确的:

  • equals()
  • hashCode()

示例:

recordUser(Stringname,intage){}List<User>users=...;users.stream().distinct().toList();// 正常去重

如用的是Comparator排序:

users.stream().sorted(Comparator.comparing(User::age)).toList();
http://www.gsyq.cn/news/180062.html

相关文章:

  • 数字集成电路PPT资源:电路系统与设计第二版完整课件获取指南
  • Miniconda环境导出与共享:确保团队协作一致性
  • SublimeREPL插件:在Sublime Text中打造无缝Python交互开发体验
  • Surya OCR文本排序技术深度解析:3大核心优势与实战应用指南
  • DataGear数据可视化:从零开始的智能分析平台实战指南
  • 智能菜谱推荐|基于springboot智能菜谱推荐系统(源码+数据库+文档)
  • GitHub开源项目依赖管理:Miniconda环境文件规范
  • Git stash暂存未完成的PyTorch代码更改
  • 社区智慧消防管理|基于springboot 社区智慧消防管理系统(源码+数据库+文档)
  • 计算机毕设java游戏账号交易平台 基于Java的在线游戏账号交易管理系统设计与实现 Java Web环境下游戏账号交易平台的开发与应用
  • DBeaver数据导入加速技巧:3个关键设置让你的导入速度翻倍
  • Pylint symilar工具:代码重复检测的完整实战指南
  • PictureSelector裁剪功能实战指南:从基础配置到高级定制
  • DICOM医学影像资源宝库:解锁医疗数据处理的无限可能
  • 分布式事务解决方案实战指南:从架构设计到性能优化
  • 分布式系统异步通信容错实战:构建永不宕机的微服务调用链
  • AI音乐生成终极指南:Riffusion模型实时创作完整教程
  • Soso操作系统:从零构建的类Unix系统深度解析
  • 完整grpcurl使用指南:快速上手gRPC命令行调试工具
  • RPM Spec 文件中的 %bcond_with和 %bcond_without条件宏
  • ownCloud集群部署终极指南:构建高可用企业级文件同步平台
  • [Linux]学习笔记系列 -- [fs]mnt_idmapping
  • Apache ShenYu深度重构:Redis集群缓存架构设计完全指南
  • 21天精通量化投资:日历效应检测工具的实战应用宝典
  • 从星空菜鸟到深空大师:DeepSkyStacker让你的天文摄影梦想照进现实
  • 2025 年总结盘点:成长、突破与平衡
  • Pyenv与Miniconda对比:哪种更适合管理Python AI环境?
  • 如何快速配置Chuck:Android网络请求调试的完整指南
  • Waymo数据集完整实践指南:从零开始快速掌握自动驾驶数据
  • GitHub托管PyTorch项目时忽略.pycache/和__pycache__/目录