从原理剖析带你理解Stream

来源：互联网收集：自由互联发布时间：2022-09-02

摘要：Stream是jdk1.8给我们提供的新特性本文分享自华为云社区《深入理解Stream之原理剖析》，作者：李哥技术。 Stream是jdk1.8给我们提供的新特性，主要就是允许我们采用声明

摘要：Stream是jdk1.8给我们提供的新特性

本文分享自华为云社区《深入理解Stream之原理剖析》，作者：李哥技术。

Stream是jdk1.8给我们提供的新特性，主要就是允许我们采用声明式的方式处理数据集合，我们要知道在项目中我们集合就是我们最常用的数据存储结构，有时后我们需要对集合内的元素做一些过滤或者其他的操作我们一般是采用for循环的方式。

Stream操作分类

从原理剖析带你理解Stream_中间操作

Stream中的操作可以分为两大类：中间操作与结束操作。

中间操作只会进行操作记录，只有结束操作才会触发实际的计算，可以理解为懒加载，这也是Stream在操作大对象迭代计算的时候如此高效的原因之一。

中间操作分为有状态操作与无状态操作，无状态是指元素的处理不受之前元素的影响，有状态是指该操作只有拿到所有元素之后才能继续下去。这也比较好理解，比如有状态的distinct()去重方法，你说他能不关心其他值吗？当然不能，他必须拿到所有元素才知道当前迭代的元素是否被重复。

结束操作可以分为短路与非短路操作，这个应该很好理解，短路是指遇到某些符合条件的元素就可以得到最终结果；而非短路是指必须处理所有元素才能得到最终结果。

之所以要进行如此精细的划分，是因为底层对每一种情况的处理方式不同。

Stream结构分析

让我们先简单看看下面一段代码：

List<String> list = new ArrayList<>();
// 获取stream1
Stream<String> stream1 = list.stream();
// stream1通过filter后得到stream2
Stream<String> stream2 = stream1.filter("lige"::equals);
// stream1与stream2是同一个对象吗？
System.out.println("stream1.equals(stream2) = " + stream1.equals(stream2));
System.out.println("stream1.classTypeName = " + stream1.getClass().getTypeName());
System.out.println("stream2.classTypeName = " + stream2.getClass().getTypeName());
// 结果
// stream1.equals(stream2) = false
// stream1.classTypeName = java.util.stream.ReferencePipeline$Head
// stream1.classTypeName = java.util.stream.ReferencePipeline$2

很明显，stream1与stream2不是同一个对象，并且他们不是同一个实现类。stream1的实现类为ReferencePipeline$Head，而stream2的实现类为一个匿名内部类，让我们进步一分析其源码，所谓源码之下，无所遁形。

从原理剖析带你理解Stream_中间操作_02

从原理剖析带你理解Stream_Stream_03

从原理剖析带你理解Stream_jdk1.8_04

让我们再看看stream2：

从原理剖析带你理解Stream_中间操作_05

从原理剖析带你理解Stream_java_06

从原理剖析带你理解Stream_中间操作_07

从原理剖析带你理解Stream_Stream_08

从原理剖析带你理解Stream_java_09

从原理剖析带你理解Stream_Stream_10

通过分析我们可以发现，stream2的实现类是StatelessOp，所以就形成了这样一个结构。

从原理剖析带你理解Stream_中间操作_11

每一次中间操作都会生成一个新的Stream，如果是无状态操作则实现类是StatelessOp，如果是有状态操作则实现类是StatefulOp。

让我们再来看一下他们之间的继承关系。

从原理剖析带你理解Stream_java_12

从原理剖析带你理解Stream_数据_13

再聊核心Sink

实际上Stream API内部实现的的本质，就是如何重载Sink的这四个接口方法。

我还是从一个示例开始：

List<String> list = new ArrayList<>();
list.add("zhangsan");
list.add("ligeligeligeligeligeligeligeligeligelige");
list.add("lisilisilisilisilisilisilisilisi");
list.add("wangwu");
list.add("ligejishuligejishuligejishuligejishuligejishuligejishuligejishu");
List<String> resultList = list.stream()
.filter(it -> it.contains("li"))// 1. 只要包含li的数据
.filter(it -> it.contains("lige"))// 2. 只要包含lige的数据
.map(String::toUpperCase)// 3. 对符合的数据作进一步加工，转换大写
.map(String::toLowerCase)// 4. 对符合的数据作进一步加工，转换小写
.collect(Collectors.toList());
resultList.forEach(System.out::println);

不管是filter方法，还是map方法，还是其他的方法，我们进入到源码层面，返回了一个StatelessOp对象或StatefulOp对象。

所以便产生了这样一个结构:

从原理剖析带你理解Stream_数据_14