为什么在循环中修改集合，会导致程序出错？(为什么循环小数是无限的) #科技 #进行 #移动 #大小 #代码 #地图

在循环遍历一个集合（如列表、数组）的过程中，直接对其进行添加或删除元素的操作，之所以会导致程序出错或产生非预期的结果，其根本原因在于这种修改行为，直接破坏了循环赖以正常工作的“迭代器”的内部状态或循环的“边界条件”。一个循环的执行，如同一个人，在参照一张地图进行按部就班的徒步旅行。如果在旅行途中，这张地图本身，被随意地修改（例如，擦掉了一个即将要访问的村庄，或在终点后又增加了一个新的村庄），那么，旅行者（即循环），就必然会“迷路”。

这种“迷路”的具体表现，涵盖了五大方面：破坏了迭代器内部状态的一致性、在索引类循环中导致元素“跳过”或“重复”处理、在增强型循环中触发“并发修改异常”、改变了集合的原始大小导致循环边界失效、以及这种不确定的行为会产生难以预测的逻辑错误。其中，在索引类循环中导致元素被“跳过”处理，是最为常见也最隐蔽的逻辑错误。

一、问题的本质：迭代器的“契约”

要深刻理解这个问题的本质，我们必须首先，理解程序是如何进行“遍历”的。无论是for循环，还是foreach循环，其背后，都有一个名为“迭代器”的对象在工作。

1. 迭代器是什么？

我们可以将“迭代器”，理解为一个智能的、用于在集合上进行导航的“书签”或“游标”。当你开始一个循环时，程序会首先，为你要遍历的那个集合，创建一个专属的迭代器。这个迭代器，在其内部，维护着一些至关重要的状态信息，例如：“集合的总大小是多少？”、“我当前访问到了哪个位置？”以及“下一个应该访问的元素在哪里？”。

2. 迭代器的“隐性契约”

当你启动一个循环时，你的代码，就与这个新创建的迭代器之间，订立了一份“隐性契约”。这份契约的核心内容是：“在我（迭代器）的这次完整的遍历旅程结束之前，你（我们的代码）不应该，通过除我之外的任何其他方式，来擅自修改我们正在遍历的这个集合的‘结构’。”

“结构性”的修改，主要指那些会改变集合大小、或影响元素顺序的操作，即添加和删除元素。

3. 为何会有这个契约？

这个契约的存在，是为了保障遍历过程的“确定性”和“可预测性”。迭代器在“出发”前，记录了地图的全貌（例如，集合的大小）。如果在“旅途”中，地图本身被随意篡改，那么，迭代器基于“旧地图”所做出的“下一步”决策，就必然会与“新地图”的现实，产生矛盾。

正如软件工程领域的巨匠比雅尼·斯特劳斯特鲁普所言：“我们最希望代码所拥有的品质之一，就是它的行为，应该是可预测的。” 在循环中直接修改集合，恰恰是破坏这种“可预测性”的、最经典的反面教材。

二、场景一：在“索引”循环中删除元素

这是最常见的、也是最能清晰地，揭示问题所在的场景。我们以一个经典的、基于“索引”的for循环为例。

1. “跳过”元素的陷阱

场景：假设我们有一个数字列表，目标是删除其中所有“偶数”的元素。

错误的代码：Java// 这是一个包含6个元素的列表 List<Integer> numbers = new ArrayList<>(Arrays.asList(1, 2, 3, 4, 5, 6)); // 错误地，使用“正序”遍历，并直接删除 for (int i = 0; i < numbers.size(); i++) { if (numbers.get(i) % 2 == 0) { numbers.remove(i); } } System.out.println(numbers);

预期输出：[1, 3, 5]

实际输出：[1, 3, 5, 6] (数字 4 被成功删除，但 6 却被“遗漏”了！)

“法医级”的执行过程分析：

i = 0: numbers.get(0) 是 1，非偶数，跳过。

i = 1: numbers.get(1) 是 2，是偶数。执行 numbers.remove(1)。

关键变化：此时，列表的内部结构，发生了“塌陷”。原有的元素3，移动到了索引1的位置；原有的元素4，移动到了索引2的位置；列表的总大小，从6变为5。

列表当前状态：[1, 3, 4, 5, 6]

i = 2: for循环头部的i++被执行，i的值变为2。循环，继续，检查索引为2的元素。

致命的“跳跃”：此时，列表索引为2的元素，是数字4。而那个刚刚移动到索引1位置的数字3，因为i已经变成了2，而被**永久地“跳过”**了检查。

i = 2 (继续): numbers.get(2) 是 4，是偶数。执行 numbers.remove(2)。

再次塌陷：列表变为 [1, 3, 5, 6]。原有的5移动到索引2，原有的6移动到索引3。

i = 3: i++后，i变为3。循环检查索引为3的元素，即数字6。刚刚移动到索引2的数字5，又被“跳过”了。

i = 3 (继续): numbers.get(3) 是6，是偶数。执行numbers.remove(3)。

再次塌陷：列表变为[1, 3, 5]。

i = 4: i++后，i变为4。此时，列表的新大小是3。边界条件 i < numbers.size() (即 4 < 3) 不再满足，循环终止。

【解决方案】：

方案一（最佳）：倒序遍历。这是解决“索引类”循环中删除问题的、最经典、也最优雅的方案。Javafor (int i = numbers.size() - 1; i >= 0; i--) { // 从后往前遍历 if (numbers.get(i) % 2 == 0) { numbers.remove(i); } } 为何倒序可行？：因为当你，从后往前，删除一个位于索引i的元素时，它只会影响其后面（即索引大于i）的元素的位置。而你接下来，将要访问的，是i-1这个更靠前的元素，其索引，完全不受本次删除的影响。

三、场景二：在“增强型”循环中修改

在Java等语言中，for-each循环（即增强型for循环），为我们提供了更简洁的遍历语法。但它背后，隐藏着更严格的“契约”。

1. 并发修改异常

错误的代码：JavaList<String> fruits = new ArrayList<>(Arrays.asList("苹果", "香蕉", "橘子")); for (String fruit : fruits) { if ("香蕉".equals(fruit)) { fruits.remove(fruit); // 错误！ } }

后果：这段代码，在运行时，会直接抛出一个名为“并发修改异常”的错误，导致程序崩溃。

“快速失败”机制：这是Java集合框架，为了保护开发者，而设计的一种“快速失败”机制。

当for-each循环开始时，它会创建一个迭代器，并记录下集合在那一刻的“内部修改次数”（一个内部计数器）。

在循环的每一步，当迭代器，试图获取下一个元素时，它都会重新检查集合的“内部修改次数”，是否与它最初记录的那个值，保持一致。

当我们，在循环体内，直接调用fruits.remove()时，这个操作，会直接地、在迭代器“不知情”的情况下，去修改集合的内容，并使其“内部修改次数”加一。

在下一次循环时，迭代器，就会发现“内外不一致”——“在我上次检查之后，有人在我背后，偷偷修改了地图！” 为了避免后续出现更不可预测的行为（例如，像前一节那样的“元素跳过”），迭代器，会选择一种“最安全”的方式，即立即地、响亮地，抛出一个“并发修改异常”来中止程序。

【解决方案】：

方案一（唯一正确）：使用迭代器自身的remove方法。JavaIterator<String> iterator = fruits.iterator(); while (iterator.hasNext()) { String fruit = iterator.next(); if ("香蕉".equals(fruit)) { iterator.remove(); // 正确！这是唯一被允许的、在迭代中删除元素的方式 } } 因为，当你调用迭代器自身的remove方法时，它在删除元素的同时，也会智能地、同步地，更新其内部的、关于“位置”和“修改次数”的状态，从而维护了“契约”的一致性。

方案二（普适安全）：先收集，再处理。JavaList<String> itemsToRemove = new ArrayList<>(); for (String fruit : fruits) { if (fruit.contains("果")) { // 假设要删除所有带“果”字的水果 itemsToRemove.add(fruit); } } fruits.removeAll(itemsToRemove); // 在循环结束后，进行一次性的批量删除这个模式，通过完全地，分离“遍历”和“修改”这两个操作，从根本上，避免了所有潜在的并发修改问题，是普适性最强、也最推荐的安全实践。

四、场景三：在循环中“添加”元素

在循环中，添加元素，同样是极其危险的，它甚至可能导致程序陷入“无限循环”。

错误代码：JavaScriptlet nums = [1, 2, 3]; for (let i = 0; i < nums.length; i++) { console.log(nums[i]); if (nums[i] === 1) { nums.push(i + 10); // 错误！在循环中，向尾部添加元素 } }

问题分析：这个循环的终止条件，是i < nums.length。在循环体内，我们，向数组的尾部，添加了新的元素。这导致了nums.length这个值，在持续地、动态地增长。循环变量i，可能永远也追不上nums.length的增长速度，从而导致循环，永不终止。

【解决方案】：与删除操作一样，“先收集，再处理”的模式，对于添加操作，同样是最安全、最推荐的。先将所有需要被添加的元素，放入一个临时的集合，待主循环结束后，再将其，一次性地，全部添加到原始集合中。

五、在流程与规范中“防范”

要系统性地，杜绝这类问题，我们需要在团队的“流程”和“规范”中，建立起“防御工事”。

编码规范中的“禁令”：团队的《编码规范》中，必须有一条明确的、高优先级的“禁令”：“严禁，在任何‘索引类’或‘增强型’循环的内部，直接地，对被遍历的集合，进行‘添加’或‘删除’操作。必须，采用‘倒序遍历’、‘迭代器’或‘先收集后处理’的规范化模式。”

代码审查的“火眼金睛”：在进行代码审查时，任何一个有经验的开发者，都应对“循环 + remove/add”这种组合，保持最高级别的警惕。这是代码审查中，一个经典的、必须被仔细审视的“坏味道”。

工具的支撑：在 PingCode 或 Worktile 这样的协作平台中，团队，可以创建一份**《代码审查检查清单》的模板**。并将“检查是否存在不安全的循环内集合修改”这一项，作为模板的必选项。这样，在每次发起代码审查的流程时，工具，就能自动地，提醒审查者，去关注这个关键的、易错的检查点。

常见问答 (FAQ)

Q1: 为什么倒序遍历删除元素是安全的？

A1: 因为，当你从后往前，在索引i处，删除一个元素时，这个操作，只会影响到，那些你已经访问过的、索引大于i的元素的位置。而你接下来，将要访问的，是i-1这个更靠前的元素，其索引，完全不受本次删除的影响。

Q2: 既然在循环中修改集合如此危险，为什么语言设计者不直接禁止它呢？

A2: 语言的设计，需要在“灵活性”与“安全性”之间，做出权衡。直接禁止，会使得一些高级的、特定的算法实现，变得不可能。因此，大多数语言，选择将这份“自由”，连同其所伴随的“责任”，都交给了开发者。同时，通过像“并发修改异常”这样的“快速失败”机制，来尽可能地，提醒开发者，他们正在进行危险的操作。

Q3: “快速失败”和“安全失败”的迭代器有什么区别？

A3: “快速失败”（例如Java的ArrayList的迭代器），会在检测到外部修改时，立即抛出异常，中止程序。而“安全失败”（例如Java的CopyOnWriteArrayList的迭代器），则通常，是在一个原始数据的“快照”上进行遍历。在遍历期间，对原始数据的任何修改，都不会影响到这次遍历，也不会抛出异常，但同样地，遍历者，也看不到这些最新的修改。

Q4: 除了添加和删除，还有哪些修改操作也同样危险？

A4: 任何能够“结构性地”改变集合的操作，都是危险的。例如，对一个正在被遍历的列表，进行“清空”（clear()）或“排序”（sort()）等操作，同样，会破坏迭代器的内部状态，并可能导致不可预测的行为。