详解Java中的集合框架（持续更新）_java

文章目录

一前言
二集合框架常见接口和实现
- 2.1 基本概述
- 2.2 List 接口
- - 2.2.1 ArrayList
  - - 2.2.1.1 增加元素
    - 2.2.1.2 删除元素
    - 2.2.1.3 修改元素
    - 2.2.1.4 查找元素
    - 2.2.1.5 遍历ArrayList 的几种常见写法
  - 2.2.2 LinkedList
  - - 2.2.2.1 增加元素
    - 2.2.2.2 删除元素
    - 2.2.2.3 修改元素
    - 2.2.2.4 查找元素
    - 2.2.2.5 遍历LinkedList 的几种常见写法
- 2.3 Set 接口
- 2.4 Map接口
- 2.5 Queue 接口
- 2.6 比较器 Comparator和Comparable
- - 2.6.1 hashCode 和 equals 方法
- 2.7 数组&集合工具类
- - 2.7.1 Arrays
  - 2.7.2 Collections
  - 2.7.3 集合&泛型
- 2.8 Fail-fast 机制
附录
- Java 11 中文API文档

一前言

🏷 本文基于Java 11版本

Java 中的集合框架，涉及到大量的接口、类、异常类；以及各种的算法、数据结构、并发问题。工具类和工具方法也有不少。本文将逐一介绍这些内容。

Java 中的集合是用于存储对象的工具类容器，它实现了常用的数据结构，提供了一系列公开的方法用于增加、删除、修改、查找和遍历数据，降低了日常开发成本。集合的种类非常多，形成了一个比较经典的继承关系树，称为 Java集合框架。

二集合框架常见接口和实现 2.1 基本概述

Map接口：

图解：常用接口使用紫色标注，常用类使用橙色标注，不常用使用灰色标注，抽象层和其他都是红色标注。

首先可以看到 Collection 接口，继承于 Iterable 接口。这也就表明，只要是 Collection 这个类型，就可以进行迭代、并且可以进行 for-each 增强循环。

特别的，在 Java 8及其以上版本，增加了默认实现的 forEach 方法，可以进行迭代。

另外关于 Map 接口，它自己本身不继承任何接口。只是在定义一些方法时，依赖了 Collection 接口。

在日常的开发中，我们主要使用的是这些接口的实现类，也就是上图中黄色阴影框的 ArrayList，LinkedList，TreeSet, HashSet, LinkedHashSet, TreeMap, HashMap, LinkedHashMap。本文的核心也就是围绕这些实现类来说明各个集合类的使用场景。

2.2 List 接口

📢 接口定义如下：

public interface List<E> extends Collection<E> {

    // 因本文篇幅原因，省略若干方法
}

List 集合通常是有序的，可以方便的知道上一个元素、下一个元素。一般是可以允许存储重复的元素。至于一个元素是否重复，需要用 Object 类的 equals 方法来判定。另外，List 集合的遍历结果是稳定的，也就是说它在不做任何额外 *** 作（额外 *** 作是指修改，删除，增加，排序等）时，每次遍历的结果都是一致的。

我们通常会使用它的实现类 ArrayList 和 LinkedList。

2.2.1 ArrayList

📢 类的定义如下：

// 类的定义上，实现了RandomAccess，表示可以进行随机访问（通过数组下标）
public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    // 集合中元素的个数，空集合的话，size值是0
    private int size;
    // ArrayList 的容量就是这个数组缓冲区的长度。
    // 当添加第一个元素时，任何具有 elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA 的空 ArrayList 都将扩展为 DEFAULT_CAPACITY
    transient Object[] elementData;
    // 使用空参数构造器时，将这个默认空数组赋值给数组缓冲区 elementData
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    // 使用有参数构造时，如果参数容量是0，将这个空数组赋值给数组缓冲区 elementData
    private static final Object[] EMPTY_ELEMENTDATA = {};
    // 默认容量：10
    private static final int DEFAULT_CAPACITY = 10;
    // 尝试分配最大大小的数组给数组缓冲区，尝试分配更大的数组可能会导致 OutOfMemoryError：请求的数组大小超过 VM 限制
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    
    // 空参数构造器
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }
    
    // 构造具有指定初始容量的空列表
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
        }
    }
    
    // 按照集合的迭代器返回的顺序构造一个包含指定集合元素的列表
    public ArrayList(Collection<? extends E> c) {
        Object[] a = c.toArray();
        if ((size = a.length) != 0) {
            if (c.getClass() == ArrayList.class) {
                elementData = a;
            } else {
                elementData = Arrays.copyOf(a, size, Object[].class);
            }
        } else {
            // replace with empty array.
            elementData = EMPTY_ELEMENTDATA;
        }
    }
    
    // 因本文篇幅原因，省略若干方法
}

ArrayList 的定义是：容量可以自我更改的、线程不安全集合。

其底层代码是使用了 Object 数组承载了数据，根据数据占整个集合的多少，进行扩容（其实是数组复制）。

可以看到 ArrayList 在定义时，实现了 RandomAccess 接口。表示支持快速随机访问。但是其在插入元素、删除元素时速度通常是很慢的，因为可能会移动其他元素。比如：在一个ArrayList中，存了10个元素，现在给它的第4个下标的位置插入一个新元素，那么从原先第4个元素开始，所有排在后边的元素都需要移动位置。

2.2.1.1 增加元素

ArrayList 在增加元素时，会存在一个扩容的 *** 作。
整体的 *** 作就是，
增加元素的代码如下：

// 第一个参数是要添加的元素，第二个是当前维护的数组缓冲，第三个参数是当前集合中的元素个数
private void add(E e, Object[] elementData, int s) {
	// 当集合真实存储元素的个数等于数组的长度时，表示需要扩容，核心方法是 grow()
    if (s == elementData.length)
        elementData = grow();
    elementData[s] = e;
    size = s + 1;
}

🎃 接下来看看 grow() 是如何进行扩容的！

    private Object[] grow(int minCapacity) {
    	// 进行数组复制，核心扩容方法是newCapacity。传入当前数组，新的数组长度即可。
        return elementData = Arrays.copyOf(elementData,
                                           newCapacity(minCapacity));
    }

	// 传入当前容器中元素个数+1作为最小容量
    private Object[] grow() {
        return grow(size + 1);
    }

🎃 接下来看看 newCapacity() 是如何进行计算新的容量的！

private int newCapacity(int minCapacity) {
    // 获取当前数组缓冲的长度
    int oldCapacity = elementData.length;
    // 计算新的容量：当前容量 + （当前容量除以2）
    // 其实就是原先大小的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity <= 0) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return minCapacity;
    }
    return (newCapacity - MAX_ARRAY_SIZE <= 0)
        ? newCapacity
        : hugeCapacity(minCapacity);
}

通过源码，我们观察到，在增加元素时涉及到的是数组复制、扩容。
ArrayList 还对外提供了一个插入的方法：

public void add(int index, E element) {
	// 检查索引是否越界
    rangeCheckForAdd(index);
    modCount++;
    final int s;
    Object[] elementData;
    // 判断是否需要尽行扩容：当前数组的长度等于真实的元素个数时扩容
    if ((s = size) == (elementData = this.elementData).length)
        elementData = grow();
    System.arraycopy(elementData, index,
                     elementData, index + 1,
                     s - index);
    elementData[index] = element;
    size = s + 1;
}

这里用到一个数组的复制的方法， System.arraycopy，它和之前用的 Arrays.copyOf，是不同的。
关于 System.arraycopy 的入参：

要复制的数组
要复制的起始索引
目标数组，也就是说这个方法需要额外提供一个数组
要复制的目标位置
复制的数组的长度

其实就是，从插入的位置开始，所有的元素都往后移动一个位置。

而 Arrays.copyOf 有所不同，它是直接就创建一个数组，返回给调用者。它需要的是要复制的数组以及新数组的长度作为参数即可。

2.2.1.2 删除元素

删除元素的流程是，先从集合容器中查找当前元素的所在索引。
查找这一步，需要遍历集合容器一次。

然后，根据索引，进行数组复制。
数组复制的方法也是使用了 System.arraycopy ，只是参数不同。此次的 *** 作实质上是对数组进行“逆向复制”。即将要删除的元素的索引加1，作为复制的起始位置，而当前索引为复制的目标位置，做一个“所有元素全部往前移动一位”的 *** 作。
方法定义如下：

// 这里的 int i 是要删除的元素的索引。
private void fastRemove(Object[] es, int i) {
    modCount++;
    final int newSize;
    if ((newSize = size - 1) > i)
        System.arraycopy(es, i + 1, es, i, newSize - i);
    es[size = newSize] = null;
}

2.2.1.3 修改元素

没有什么高大上的 *** 作，仅仅是将指定的元素赋值给数组的指定索引位置。
修改的源码如下：

public E set(int index, E element) {
    Objects.checkIndex(index, size);
    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}

2.2.1.4 查找元素

在 ArrayList 中，对外提供的有 indexOf 方法。

它其实是遍历了缓冲数组 elementData，逐一匹配。具体代码如下：

// 查找对象o，返回它在 ArrayList 中的索引下标。
public int indexOf(Object o) {
    return indexOfRange(o, 0, size);
}

// 在索引为 [start, end] 范围内，从elementData 中查找元素o
int indexOfRange(Object o, int start, int end) {
    Object[] es = elementData;
    if (o == null) {
        for (int i = start; i < end; i++) {
            if (es[i] == null) {
                return i;
            }
        }
    } else {
        // 要查找的元素不为空，使用 Object 的 equals 方法判定对象是否相等
        for (int i = start; i < end; i++) {
            if (o.equals(es[i])) {
                return i;
            }
        }
    }
    // 查找不到元素 o，返回 ArrayList 的索引 -1
    return -1;
}

假如知道一个元素在 ArrayList 中的索引下标，可以直接使用 get(int index) 方法获取对应的元素。

另外如果仅仅需要判断容器中是否包含一个元素，有包装了 indexOf 方法的 contains 方法可以使用。在语义上能好理解些。

2.2.1.5 遍历ArrayList 的几种常见写法

package org.feng.demo;

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.stream.IntStream;

public class ArrayListDemo {

    public static void main(String[] args) {
        // 创建初始大小为15的容器
        List<Integer> integerList = new ArrayList<>(15);
        // 增加元素,从1到15，共15个元素
        IntStream.rangeClosed(1, 15).forEach(integerList::add);

        // 遍历方式1：for-each 增强for循环遍历集合，打印每一个元素
        for (Integer integer : integerList) {
            System.out.println(integer);
        }

        // 遍历方式2：for-i根据索引获取每个元素
        int size = integerList.size();
        for (int i = 0; i < size; i++) {
            System.out.println(integerList.get(i));
        }

        // 遍历方式3：Iterable接口的 forEach方法
        integerList.forEach(System.out::println);


        // 遍历方式4：Iterator迭代，使用for循环
        for (Iterator<Integer> iterator = integerList.iterator(); iterator.hasNext(); ) {
            Integer currentElement = iterator.next();
            System.out.println(currentElement);
        }

        // 遍历方式5：Iterator迭代，使用while循环
        Iterator<Integer> iterator = integerList.iterator();
        while (iterator.hasNext()) {
            Integer currentElement = iterator.next();
            System.out.println(currentElement);
        }

        // 遍历方式6：转换为 stream 流，进行处理
        Object[] objects = integerList.stream().peek(System.out::println).toArray();
    }
}

2.2.2 LinkedList

📢 类的定义如下：

public class LinkedList<E>
    extends AbstractSequentialList<E>
    implements List<E>, Deque<E>, Cloneable, java.io.Serializable
{
    // 省略变量定义和方法定义
}

从类的定义上看，它实现了 List 接口，表示是一个有序列表（存入集合容器的顺序，就是遍历时的顺序）。

其次，LinkedList 实现了 Deque ，表示是一个双端链表。

那么和 ArrayList 不同，它并没有实现随机访问接口，因此无法通过索引直接快速获取元素。因为是一个链表，也就具备了链表数据结构的一些基本特性。

在查找元素时，需要从头结点往后遍历到最后一个元素，若匹配到目标元素，则会返回。在增加元素时，直接尾插法，链接到链表的最后一个元素的后继上。在删除元素时，直接使用其后继，链接到其前驱上即可。在修改时，也是先查找，再赋值。在插入元素时，和删除类似，只是将要插入的元素的前驱链接到插入位置的后继上，将插入位置的后一个元素的前驱，链接到插入元素的后继上。

内部定义了节点对象：

private static class Node<E> {
    // 存储的元素
    E item;
    // 后继
    Node<E> next;
    // 前驱
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

2.2.2.1 增加元素

🎃 实质上是创建一个新的 Node 对象，将新增加的元素，作为当前链表的最后一个元素的后继。

  public boolean add(E e) {
      linkLast(e);
      return true;
  }

  void linkLast(E e) {
  	  // 将当前最后一个元素获取到
      final Node<E> l = last;
      // 新建一个 Node，前驱是当前链表最后一个元素，后继是null
      final Node<E> newNode = new Node<>(l, e, null);
      // 将新建的 Node 标记为最后一个元素
      last = newNode;
      // 如果最后一个元素是null，表示当前容器中没有元素，则此次是第一次增加元素，将该元素同时标记为第一个元素
      if (l == null)
          first = newNode;
      else
          l.next = newNode;
      size++;
      modCount++;
  }

通过分析源码，我们知道了这个 LinkedList 的增加元素，时间是极小的， *** 作很简单。因此它的增加元素很快。

LinkedList 的插入方法是 add(int index, E element)，表示将元素插入到index索引对应的位置。
其详细代码如下：

public void add(int index, E element) {
    checkPositionIndex(index);

	// 如果插入的位置是最后一个元素的位置
    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}


void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    // 获取要插入位置的节点的前驱
    final Node<E> pred = succ.prev;
    // 创建新的结点，前驱是要插入位置的节点的前驱，后继是要插入位置的节点
    final Node<E> newNode = new Node<>(pred, e, succ);
    // 将新的结点作为要插入位置的结点的前驱，即插入到当前元素的前面
    succ.prev = newNode;
    if (pred == null)
        first = newNode;
    else
        pred.next = newNode;
    size++;
    modCount++;
}

// 返回目标索引下的元素
Node<E> node(int index) {
   	// 当 index 小于当前容器中元素的个数的一半时
    if (index < (size >> 1)) {
    	// 从第一个元素开始查找
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
    	// 当 index 不小于当前容器中元素的个数的一半时，从最后一个元素开始查找
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

仔细分析后，插入的时间复杂度为 O(n/2)，因为要遍历查找节点。

2.2.2.2 删除元素 2.2.2.3 修改元素 2.2.2.4 查找元素 2.2.2.5 遍历LinkedList 的几种常见写法 2.3 Set 接口 2.4 Map接口 2.5 Queue 接口 2.6 比较器 Comparator和Comparable 2.6.1 hashCode 和 equals 方法 2.7 数组&集合工具类 2.7.1 Arrays 2.7.2 Collections 2.7.3 集合&泛型 2.8 Fail-fast 机制附录 Java 11 中文API文档

https://www.apiref.com/java11-zh/index.html

要找对应的Java类，可以在该页面顶部导航栏，搜索框搜索类名即可。比如本文中涉及到的 Collection、Set、Queue、Map等，都是可以直接搜索到的。

集合框架：

https://www.apiref.com/java11-zh/java.base/java/util/package-summary.html#CollectionsFramework

欢迎分享，转载请注明来源：内存溢出

原文地址: https://www.outofmemory.cn/langs/786221.html

详解Java中的集合框架（持续更新）

发表评论

评论列表（0条）