Rust for表达式遍历数据结构

Rust for 表达式基础

在Rust中，for表达式是一种强大的控制结构，主要用于遍历可迭代的数据结构。它提供了一种简洁、安全且高效的方式来处理集合中的每一个元素。for表达式的基本语法如下：

for variable in iterable {
    // 执行代码块
}

这里的variable是每次迭代时从iterable（可迭代对象）中取出的元素。iterable可以是多种数据结构，比如数组、向量（Vec）、链表等，只要这些数据结构实现了IntoIterator trait。

例如，遍历一个简单的数组：

fn main() {
    let numbers = [1, 2, 3, 4, 5];
    for number in numbers.iter() {
        println!("Number: {}", number);
    }
}

在这个例子中，numbers.iter()返回一个迭代器，for循环每次从这个迭代器中取出一个元素并赋值给number变量，然后执行花括号内的代码块，这里是打印出每个数字。

遍历数组

数组是Rust中一种固定大小的数据结构，它在栈上分配内存。使用for表达式遍历数组非常直观。

fn main() {
    let fruits = ["apple", "banana", "cherry"];
    for fruit in fruits.iter() {
        println!("Fruit: {}", fruit);
    }
}

在上述代码中，fruits.iter()创建了一个迭代器，该迭代器可以逐个提供数组中的元素。for循环将迭代器中的元素依次赋值给fruit变量。

如果需要同时获取数组元素的索引，可以使用enumerate方法。

fn main() {
    let fruits = ["apple", "banana", "cherry"];
    for (index, fruit) in fruits.iter().enumerate() {
        println!("Index {}: Fruit {}", index, fruit);
    }
}

enumerate方法会将迭代器中的元素和其索引一起包装成一个新的迭代器，其中每个元素是一个包含索引和原始元素的元组。

遍历向量（Vec）

向量（Vec）是Rust中动态大小的数组，它在堆上分配内存，并且支持动态增长。遍历向量同样可以使用for表达式。

fn main() {
    let mut scores = Vec::new();
    scores.push(85);
    scores.push(92);
    scores.push(78);
    for score in scores.iter() {
        println!("Score: {}", score);
    }
}

这里，scores.iter()返回一个不可变的迭代器，用于遍历向量中的元素。如果需要在遍历过程中修改向量的元素，可以使用iter_mut方法。

fn main() {
    let mut scores = Vec::new();
    scores.push(85);
    scores.push(92);
    scores.push(78);
    for score in scores.iter_mut() {
        *score += 5;
        println!("New Score: {}", score);
    }
}

iter_mut方法返回一个可变的迭代器，允许在遍历过程中修改向量的元素。注意，在修改元素时需要使用解引用操作符*。

遍历链表

链表在Rust中可以通过标准库中的LinkedList类型来实现。LinkedList是一种动态数据结构，由节点组成，每个节点包含数据和指向下一个节点的指针。

use std::collections::LinkedList;

fn main() {
    let mut list = LinkedList::new();
    list.push_back(10);
    list.push_back(20);
    list.push_back(30);
    for item in list.iter() {
        println!("Item: {}", item);
    }
}

这里，list.iter()返回一个不可变的迭代器，用于遍历链表中的元素。如果要修改链表中的元素，可以使用iter_mut方法。

use std::collections::LinkedList;

fn main() {
    let mut list = LinkedList::new();
    list.push_back(10);
    list.push_back(20);
    list.push_back(30);
    for item in list.iter_mut() {
        *item += 5;
        println!("New Item: {}", item);
    }
}

与向量类似，iter_mut方法提供了对链表元素的可变访问。

遍历哈希表（HashMap）

哈希表（HashMap）是一种基于键值对的数据结构，它提供了快速的查找和插入操作。在Rust中，遍历HashMap可以使用for表达式。

use std::collections::HashMap;

fn main() {
    let mut scores = HashMap::new();
    scores.insert("Alice", 85);
    scores.insert("Bob", 92);
    scores.insert("Charlie", 78);
    for (name, score) in scores.iter() {
        println!("{}: {}", name, score);
    }
}

scores.iter()返回一个不可变的迭代器，其中每个元素是一个包含键值对的元组。如果需要修改哈希表中的值，可以使用entry方法结合or_insert方法。

use std::collections::HashMap;

fn main() {
    let mut scores = HashMap::new();
    scores.insert("Alice", 85);
    scores.insert("Bob", 92);
    scores.insert("Charlie", 78);
    for name in ["Alice", "Bob", "David"] {
        let score = scores.entry(name).or_insert(0);
        *score += 5;
        println!("{}: {}", name, score);
    }
}

entry方法返回一个Entry枚举，or_insert方法在键不存在时插入一个默认值，并返回该值的可变引用。

自定义数据结构的遍历

在Rust中，我们可以为自定义数据结构实现IntoIterator trait，从而使其能够使用for表达式进行遍历。假设我们有一个简单的自定义结构体Point，并且有一个包含Point的结构体Points。

struct Point {
    x: i32,
    y: i32,
}

struct Points {
    points: Vec<Point>,
}

impl IntoIterator for Points {
    type Item = Point;
    type IntoIter = std::vec::IntoIter<Point>;

    fn into_iter(self) -> Self::IntoIter {
        self.points.into_iter()
    }
}

现在，我们可以使用for表达式遍历Points结构体。

fn main() {
    let points = Points {
        points: vec![
            Point { x: 1, y: 2 },
            Point { x: 3, y: 4 },
            Point { x: 5, y: 6 },
        ],
    };
    for point in points {
        println!("Point: ({}, {})", point.x, point.y);
    }
}

在上述代码中，我们为Points结构体实现了IntoIterator trait，使得Points实例可以像其他标准可迭代数据结构一样使用for循环进行遍历。

遍历过程中的控制流

在for循环中，我们可以使用break和continue关键字来控制循环的执行流程。break关键字用于立即终止循环，而continue关键字用于跳过当前迭代，继续下一次迭代。

fn main() {
    let numbers = [1, 2, 3, 4, 5];
    for number in numbers.iter() {
        if *number == 3 {
            continue;
        }
        if *number == 5 {
            break;
        }
        println!("Number: {}", number);
    }
}

在这个例子中，当number等于3时，continue关键字会跳过当前迭代，不执行println!语句。当number等于5时，break关键字会终止整个循环。

嵌套`for`循环

Rust支持嵌套for循环，这在处理多维数据结构时非常有用。例如，遍历一个二维数组：

fn main() {
    let matrix = [
        [1, 2, 3],
        [4, 5, 6],
        [7, 8, 9],
    ];
    for row in matrix.iter() {
        for &num in row.iter() {
            println!("{} ", num);
        }
        println!();
    }
}

这里，外层for循环遍历二维数组的每一行，内层for循环遍历每一行中的元素。注意，内层循环使用了&num，因为row.iter()返回的是不可变引用，所以需要使用解引用操作符&来获取实际的值。

迭代器适配器与`for`表达式

Rust的迭代器提供了一系列的适配器方法，这些方法可以对迭代器进行转换和处理。这些适配器方法可以与for表达式结合使用，以实现更复杂的遍历逻辑。

例如，filter方法用于过滤迭代器中的元素，只有满足特定条件的元素才会被包含在新的迭代器中。

fn main() {
    let numbers = [1, 2, 3, 4, 5];
    for number in numbers.iter().filter(|&&n| n % 2 == 0) {
        println!("Even Number: {}", number);
    }
}

在这个例子中，filter方法接受一个闭包，该闭包用于判断元素是否满足条件。只有偶数会被包含在新的迭代器中，并通过for循环进行遍历。

map方法用于对迭代器中的每个元素应用一个函数，并返回一个新的迭代器，其中的元素是应用函数后的结果。

fn main() {
    let numbers = [1, 2, 3, 4, 5];
    for squared in numbers.iter().map(|&n| n * n) {
        println!("Squared: {}", squared);
    }
}

这里，map方法将每个数字平方，并返回一个新的迭代器，for循环遍历这个新的迭代器，打印出每个数字的平方值。

性能考量

在使用for表达式遍历数据结构时，性能是一个重要的考量因素。对于数组和向量，由于它们在内存中是连续存储的，遍历的性能通常非常高，因为CPU可以利用缓存预取技术来提高数据访问速度。

对于链表，由于节点在内存中是分散存储的，遍历的性能相对较低，因为每次访问下一个节点都需要通过指针进行内存跳转，这可能会导致缓存不命中。

在使用迭代器适配器时，也需要注意性能。例如，filter和map等方法会创建新的迭代器，这可能会带来一些额外的开销。在性能敏感的场景下，应该尽量减少不必要的迭代器适配器调用，或者使用更高效的实现方式。

另外，Rust的编译器会对for循环进行大量的优化。例如，在编译时，编译器可能会将for循环展开，从而减少循环控制的开销。同时，编译器也会对迭代器的操作进行优化，以提高整体的执行效率。

总结

Rust的for表达式是一种功能强大且灵活的控制结构，它可以方便地遍历各种数据结构。无论是数组、向量、链表、哈希表还是自定义数据结构，都可以通过实现IntoIterator trait来使用for表达式进行遍历。在遍历过程中，我们可以结合控制流关键字、嵌套循环以及迭代器适配器来实现复杂的逻辑。同时，了解不同数据结构遍历的性能特点，可以帮助我们编写高效的代码。通过合理使用for表达式和相关的特性，Rust开发者能够更加简洁、安全地处理数据集合。