Java Stream sorted 方法的排序规则

在 Java 8 引入 Stream API 后，开发者能够以一种更为简洁和声明式的方式处理集合数据。其中，sorted 方法是 Stream API 中用于对元素进行排序的重要方法。理解 sorted 方法的排序规则对于编写高效且正确的代码至关重要。

自然排序

Java 中的许多类都实现了 Comparable 接口，该接口定义了一个自然顺序。当使用 Stream 的 sorted 方法且不传递任何参数时，它会依据元素的自然顺序进行排序。

例如，对于 Integer 类型的 Stream：

import java.util.Arrays;
import java.util.stream.Stream;

public class NaturalSortExample {
    public static void main(String[] args) {
        Stream<Integer> integerStream = Arrays.stream(new Integer[]{5, 3, 7, 1, 9});
        integerStream.sorted()
                .forEach(System.out::println);
    }
}

在上述代码中，Integer 类实现了 Comparable 接口，其 compareTo 方法定义了从小到大的自然顺序。因此，执行这段代码会输出 1 3 5 7 9。

再来看 String 类型：

import java.util.Arrays;
import java.util.stream.Stream;

public class StringNaturalSortExample {
    public static void main(String[] args) {
        Stream<String> stringStream = Arrays.stream(new String[]{"banana", "apple", "cherry"});
        stringStream.sorted()
                .forEach(System.out::println);
    }
}

String 类也实现了 Comparable 接口，其排序依据字典序，所以输出为 apple banana cherry。

自然排序的原理

当调用无参的 sorted 方法时，Stream 内部会使用元素类实现的 Comparable 接口的 compareTo 方法。该方法接收一个与当前对象同类型的参数，并返回一个整数值。如果返回值小于 0，表示当前对象小于参数对象；等于 0 表示两者相等；大于 0 则表示当前对象大于参数对象。通过多次调用这个方法，Stream 能够对元素进行正确的排序。

自定义排序

然而，在实际开发中，自然顺序可能无法满足所有需求。这时就需要使用带参数的 sorted 方法，通过传递一个 Comparator 来定义自定义的排序规则。

Comparator 是一个函数式接口，它有一个抽象方法 compare，该方法接收两个参数并返回一个整数值，用于比较这两个参数。

例如，假设有一个自定义的 Person 类：

class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public int getAge() {
        return age;
    }
}

如果我们想根据 Person 的年龄对 Stream<Person> 进行排序，可以这样做：

import java.util.Arrays;
import java.util.Comparator;
import java.util.stream.Stream;

public class CustomSortByAgeExample {
    public static void main(String[] args) {
        Stream<Person> personStream = Arrays.stream(new Person[]{
                new Person("Alice", 30),
                new Person("Bob", 25),
                new Person("Charlie", 35)
        });
        personStream.sorted(Comparator.comparingInt(Person::getAge))
                .forEach(p -> System.out.println(p.getName() + " : " + p.getAge()));
    }
}

在上述代码中，Comparator.comparingInt(Person::getAge) 创建了一个 Comparator，它根据 Person 对象的年龄进行比较。因此，输出会按照年龄从小到大排列：Bob : 25 Alice : 30 Charlie : 35。

多字段排序

有时，我们可能需要根据多个字段进行排序。例如，先按年龄排序，如果年龄相同，再按名字排序。

import java.util.Arrays;
import java.util.Comparator;
import java.util.stream.Stream;

public class MultiFieldSortExample {
    public static void main(String[] args) {
        Stream<Person> personStream = Arrays.stream(new Person[]{
                new Person("Alice", 30),
                new Person("Bob", 25),
                new Person("Charlie", 30),
                new Person("David", 25)
        });
        personStream.sorted(Comparator.comparingInt(Person::getAge)
               .thenComparing(Person::getName))
               .forEach(p -> System.out.println(p.getName() + " : " + p.getAge()));
    }
}

这里，先使用 Comparator.comparingInt(Person::getAge) 按年龄排序，然后使用 thenComparing(Person::getName) 当年龄相同时按名字排序。输出结果为 Bob : 25 David : 25 Alice : 30 Charlie : 30。

自定义排序的实现细节

当使用带 Comparator 参数的 sorted 方法时，Stream 会调用 Comparator 的 compare 方法来比较元素。与自然排序类似，compare 方法返回的整数值决定了元素的相对顺序。在多字段排序中，thenComparing 方法会在第一个比较器返回 0（即两个元素在第一个比较条件下相等）时，使用第二个比较器进行进一步比较，以此类推。

并行流中的排序

Java 的 Stream API 支持并行处理，以提高大数据集的处理效率。当在并行流上使用 sorted 方法时，排序的行为和性能会有所不同。

例如，对于一个较大的 Integer 数组的并行流排序：

import java.util.Arrays;
import java.util.stream.Stream;

public class ParallelSortExample {
    public static void main(String[] args) {
        Integer[] largeArray = new Integer[1000000];
        for (int i = 0; i < largeArray.length; i++) {
            largeArray[i] = (int) (Math.random() * 1000000);
        }
        Stream<Integer> parallelStream = Arrays.stream(largeArray).parallel();
        parallelStream.sorted()
                .forEach(System.out::println);
    }
}

在并行流中，元素会被分成多个部分，每个部分在不同的线程中进行排序，最后再合并这些已排序的部分。这一过程涉及到复杂的并行算法和数据结构，以确保排序结果的正确性。

并行流排序的性能考量

虽然并行流排序在处理大数据集时通常能提高性能，但并非总是如此。并行流的启动和合并开销可能会抵消排序带来的性能提升，特别是在数据集较小时。此外，并行流排序需要更多的内存来存储中间结果，因为多个部分需要同时在内存中进行排序。

稳定性

排序算法的稳定性是指相等元素在排序前后的相对顺序保持不变。Java Stream 的 sorted 方法保证了稳定性。

例如，假设有一个包含重复值的 Stream<Integer>：

import java.util.Arrays;
import java.util.stream.Stream;

public class StabilityExample {
    public static void main(String[] args) {
        Stream<Integer> stream = Arrays.stream(new Integer[]{3, 1, 2, 3, 4});
        stream.sorted()
               .forEach(System.out::println);
    }
}

输出为 1 2 3 3 4，两个值为 3 的元素在排序后相对顺序与原始顺序一致。

稳定性的重要性

在某些场景下，稳定性至关重要。比如，在对数据库查询结果进行排序时，如果已经按照某个字段进行了分组，再对另一个字段排序，保持稳定性可以确保同一组内的元素相对顺序不变，这对于后续的数据处理和展示可能非常关键。

与传统排序方式的对比

在 Java Stream API 出现之前，开发者通常使用 Collections.sort 等方法对集合进行排序。与传统排序方式相比，Stream 的 sorted 方法具有以下特点：

声明式编程风格：Stream 的 sorted 方法采用声明式编程，开发者只需描述想要的结果（即排序），而无需关心具体的实现细节，如如何进行比较和交换元素。而 Collections.sort 需要开发者更多地关注排序的具体实现过程。
链式调用：Stream API 支持链式调用，sorted 方法可以很方便地与其他 Stream 操作（如 filter、map 等）组合使用，形成更复杂的数据处理流水线，使代码更加简洁和易读。

例如，从一个 List 中筛选出偶数并按从小到大排序：

import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;

public class ComparisonExample {
    public static void main(String[] args) {
        List<Integer> numbers = new ArrayList<>();
        numbers.add(1);
        numbers.add(2);
        numbers.add(3);
        numbers.add(4);
        numbers.add(5);

        // 使用 Stream API
        List<Integer> resultStream = numbers.stream()
               .filter(n -> n % 2 == 0)
               .sorted()
               .collect(Collectors.toList());

        // 使用传统方式
        List<Integer> filtered = new ArrayList<>();
        for (int num : numbers) {
            if (num % 2 == 0) {
                filtered.add(num);
            }
        }
        filtered.sort(null);

        System.out.println(resultStream);
        System.out.println(filtered);
    }
}

可以看到，使用 Stream API 的代码更加简洁明了。

总结常见的排序场景及应用

数值类型排序：在处理数值数据时，无论是基本类型还是包装类型，自然排序或按数值大小的自定义排序是常见需求。例如，对销售数据中的金额进行排序，以找出最高或最低销售额。
字符串排序：在处理文本数据时，按字典序或特定的字符串比较规则排序很常见。比如，对用户输入的搜索关键词进行排序，以提供更有序的搜索结果。
对象排序：在面向对象编程中，根据对象的属性进行排序是非常普遍的。例如，在一个员工管理系统中，按员工的工资、入职时间等属性进行排序。
多条件排序：在复杂业务场景下，可能需要根据多个条件进行排序。如在电商系统中，对商品进行排序时，可能先按销量排序，销量相同再按价格排序。

实际应用案例分析

假设我们正在开发一个音乐播放器应用，其中有一个歌曲列表。每个歌曲对象包含歌曲名称、歌手、播放次数等属性。

按播放次数排序

class Song {
    private String title;
    private String artist;
    private int playCount;

    public Song(String title, String artist, int playCount) {
        this.title = title;
        this.artist = artist;
        this.playCount = playCount;
    }

    public String getTitle() {
        return title;
    }

    public String getArtist() {
        return artist;
    }

    public int getPlayCount() {
        return playCount;
    }
}

import java.util.Arrays;
import java.util.Comparator;
import java.util.stream.Stream;

public class MusicPlayerSortExample {
    public static void main(String[] args) {
        Stream<Song> songStream = Arrays.stream(new Song[]{
                new Song("Song1", "Artist1", 100),
                new Song("Song2", "Artist2", 200),
                new Song("Song3", "Artist1", 150)
        });
        songStream.sorted(Comparator.comparingInt(Song::getPlayCount).reversed())
               .forEach(s -> System.out.println(s.getTitle() + " by " + s.getArtist() + " : " + s.getPlayCount()));
    }
}

上述代码按歌曲的播放次数从高到低排序，这样可以在音乐播放器中展示最热门的歌曲。

先按歌手再按播放次数排序

import java.util.Arrays;
import java.util.Comparator;
import java.util.stream.Stream;

public class MusicPlayerMultiSortExample {
    public static void main(String[] args) {
        Stream<Song> songStream = Arrays.stream(new Song[]{
                new Song("Song1", "Artist1", 100),
                new Song("Song2", "Artist2", 200),
                new Song("Song3", "Artist1", 150)
        });
        songStream.sorted(Comparator.comparing(Song::getArtist)
               .thenComparingInt(Song::getPlayCount).reversed())
               .forEach(s -> System.out.println(s.getTitle() + " by " + s.getArtist() + " : " + s.getPlayCount()));
    }
}

这里先按歌手名称排序，同一歌手的歌曲再按播放次数从高到低排序，有助于用户按歌手浏览热门歌曲。

注意事项

空指针问题：在使用 sorted 方法时，如果流中包含 null 元素，并且没有在 Comparator 中进行适当的处理，可能会抛出 NullPointerException。例如，在自定义 Comparator 时，可以使用 Comparator.nullsFirst 或 Comparator.nullsLast 来处理 null 值。
性能优化：对于大数据集，并行流排序可能会提高性能，但要注意内存消耗和并行开销。在数据集较小时，串行排序可能更高效。此外，可以通过预排序或减少数据量等方式来优化排序性能。
排序稳定性：虽然 sorted 方法保证了稳定性，但在某些复杂的自定义排序场景下，可能会因为不正确的 Comparator 实现而破坏稳定性。在编写 Comparator 时，要仔细考虑相等元素的处理。

综上所述，Java Stream 的 sorted 方法提供了强大且灵活的排序功能，通过理解其自然排序和自定义排序规则，以及在并行流中的应用和注意事项，开发者能够更高效地处理数据排序任务，编写出更健壮和高性能的代码。无论是简单的数值排序，还是复杂的对象多条件排序，sorted 方法都能满足各种需求。在实际应用中，结合具体的业务场景，合理选择排序方式和优化策略，能够提升程序的整体性能和用户体验。同时，注意避免常见的问题，如空指针异常和性能陷阱，确保代码的正确性和稳定性。随着数据量的不断增大和业务需求的日益复杂，深入掌握 sorted 方法的排序规则将成为 Java 开发者的必备技能之一。