用Python手把手复现灰狼算法GWO：从狩猎行为到代码实现（附完整源码）-平芜编程栈

用Python手把手复现灰狼算法GWO：从狩猎行为到代码实现（附完整源码）

灰狼优化算法（Grey Wolf Optimizer, GWO）作为一种新兴的群体智能算法，正逐渐在工程优化、机器学习参数调优等领域崭露头角。与传统的遗传算法、粒子群优化相比，GWO以其独特的狩猎行为模拟机制和简洁的参数设置，为复杂优化问题提供了新的解决思路。本文将带您从零开始，用Python完整实现这一算法，并通过可视化展示其收敛过程。无论您是算法爱好者还是需要解决实际优化问题的开发者，都能通过这个可运行的代码项目获得第一手的实践经验。

1. 理解灰狼的社会等级与狩猎策略

灰狼群体中存在严格的社会等级制度，这直接影响了它们的狩猎行为。在GWO算法中，我们将狼群分为四个等级：

α狼：群体中的领导者，负责决策狩猎地点和攻击时机
β狼：辅助α狼的次级领导者，在α狼无法履行职责时可接替其位置
δ狼：侦察兵和哨兵，负责警戒和向领导层报告危险
ω狼：普通成员，遵循上级指令完成狩猎

这种等级结构在算法中对应着不同的解决方案质量。最优解对应α狼，次优解对应β狼，第三优解对应δ狼，其余解均为ω狼。

狩猎过程主要分为三个阶段：

追踪与包围猎物：狼群发现猎物后，会逐渐缩小包围圈
骚扰猎物：通过不断移动迫使猎物失去平衡
攻击猎物：当猎物停止移动时发起最终攻击

# 社会等级初始化示例代码 def initialize_population(pop_size, dim, lb, ub): """ 初始化狼群位置 :param pop_size: 种群大小 :param dim: 问题维度 :param lb: 变量下界 :param ub: 变量上界 :return: 初始化的种群位置矩阵 """ return np.random.uniform(lb, ub, (pop_size, dim))

2. 算法核心公式与Python实现

GWO算法的核心在于三个数学公式，它们模拟了灰狼的狩猎行为。我们将逐一解析这些公式，并展示如何用Python实现。

2.1 包围机制实现

包围行为在算法中表现为当前解向最优解靠近的过程。公式(1)描述了这一行为：

def update_position(X_alpha, X_beta, X_delta, A, C, current_pos): """ 更新ω狼位置 :param X_alpha: α狼位置 :param X_beta: β狼位置 :param X_delta: δ狼位置 :param A: 系数向量A :param C: 系数向量C :param current_pos: 当前狼位置 :return: 更新后的位置 """ # 计算与三头领导狼的距离 D_alpha = np.abs(C * X_alpha - current_pos) D_beta = np.abs(C * X_beta - current_pos) D_delta = np.abs(C * X_delta - current_pos) # 计算新位置 X1 = X_alpha - A * D_alpha X2 = X_beta - A * D_beta X3 = X_delta - A * D_delta return (X1 + X2 + X3) / 3

2.2 系数向量A和C的计算

系数向量A和C决定了狼群行为的随机性，是实现算法探索与开发平衡的关键：

系数	计算公式	作用
A	2a·r₁ - a	控制狼群与猎物的距离
C	2·r₂	为猎物位置添加随机权重

def calculate_a(t, max_iter): """计算收敛因子a""" return 2 * (1 - t / max_iter) def calculate_A_C(a): """计算系数向量A和C""" r1, r2 = np.random.rand(2) A = 2 * a * r1 - a C = 2 * r2 return A, C

2.3 狩猎行为模拟

狩猎过程的最后阶段是攻击猎物，在算法中表现为解的局部精细搜索：

def hunting_phase(population, fitness, a): """ 模拟狩猎阶段的位置更新 :param population: 当前种群位置 :param fitness: 适应度值 :param a: 收敛因子 :return: 更新后的种群位置 """ # 按适应度排序，确定α、β、δ狼 sorted_indices = np.argsort(fitness) alpha, beta, delta = population[sorted_indices[:3]] # 更新每只ω狼的位置 new_population = np.zeros_like(population) for i, wolf in enumerate(population): A, C = calculate_A_C(a) new_population[i] = update_position(alpha, beta, delta, A, C, wolf) return new_population

3. 完整GWO算法实现与参数调优

现在我们将上述组件整合成一个完整的GWO算法实现，并讨论关键参数的设置策略。

3.1 算法主循环结构

def gwo_optimizer(objective_func, dim, lb, ub, pop_size=30, max_iter=100): """ GWO算法主函数 :param objective_func: 目标函数 :param dim: 问题维度 :param lb: 变量下界 :param ub: 变量上界 :param pop_size: 种群大小 :param max_iter: 最大迭代次数 :return: 最优解及其适应度 """ # 初始化种群 population = initialize_population(pop_size, dim, lb, ub) fitness = np.array([objective_func(ind) for ind in population]) # 记录收敛过程 convergence_curve = np.zeros(max_iter) for t in range(max_iter): a = calculate_a(t, max_iter) # 计算当前收敛因子 # 狩猎阶段位置更新 population = hunting_phase(population, fitness, a) # 确保不越界 population = np.clip(population, lb, ub) # 计算新适应度 new_fitness = np.array([objective_func(ind) for ind in population]) # 更新适应度 improved = new_fitness < fitness population[improved] = population[improved] fitness[improved] = new_fitness[improved] # 记录当前最优适应度 convergence_curve[t] = np.min(fitness) # 返回最优解 best_idx = np.argmin(fitness) return population[best_idx], fitness[best_idx], convergence_curve

3.2 关键参数设置建议

GWO算法相对简单，但仍有一些参数需要合理设置：

种群大小(pop_size)：
- 通常设置在20-50之间
- 复杂问题需要更大的种群规模
- 但会增加计算成本
最大迭代次数(max_iter)：
- 取决于问题复杂度
- 可以通过观察收敛曲线确定
- 一般100-500次迭代足够
问题维度(dim)：
- 高维问题可能需要调整其他参数
- 可以考虑维度缩减技术

提示：在实际应用中，可以先在小规模参数上进行快速测试，观察算法行为后再确定最终参数。

4. 可视化与性能评估

为了直观理解GWO算法的性能，我们将实现结果可视化功能，并讨论几种常见的评估方法。

4.1 收敛曲线绘制

import matplotlib.pyplot as plt def plot_convergence(convergence_curve): """绘制收敛曲线""" plt.figure(figsize=(10, 6)) plt.plot(convergence_curve, linewidth=2) plt.title('GWO Algorithm Convergence Curve') plt.xlabel('Iteration') plt.ylabel('Best Fitness Value') plt.grid(True) plt.show()

4.2 搜索过程动画展示

对于二维优化问题，我们可以用动画展示狼群的搜索过程：

from matplotlib.animation import FuncAnimation def animate_search_process(history, bounds, objective_func): """创建搜索过程动画""" fig, ax = plt.subplots(figsize=(10, 8)) # 绘制目标函数曲面 x = np.linspace(bounds[0], bounds[1], 100) y = np.linspace(bounds[0], bounds[1], 100) X, Y = np.meshgrid(x, y) Z = objective_func([X, Y]) ax.contourf(X, Y, Z, levels=50, cmap='viridis') # 初始化散点图 scatter = ax.scatter([], [], c='red', s=50) def update(frame): positions = history[frame] scatter.set_offsets(positions) return scatter, ani = FuncAnimation(fig, update, frames=len(history), interval=200, blit=True) plt.close() return ani

4.3 算法性能对比

我们可以将GWO与其他优化算法进行比较，以下是一个简单的性能对比表：

算法	收敛速度	全局搜索能力	参数敏感性	实现复杂度
GWO	中等偏快	较强	低	简单
PSO	快	中等	中等	简单
GA	慢	强	高	复杂
DE	快	强	中等	中等

5. 实战应用：函数优化与超参数调优

为了展示GWO的实际应用价值，我们将探讨两个典型场景：数学函数优化和机器学习模型超参数调优。

5.1 测试函数优化

我们选用经典的Sphere函数作为测试案例：

def sphere_function(x): """Sphere测试函数""" return sum(xi**2 for xi in x) # 运行GWO优化 best_solution, best_fitness, convergence = gwo_optimizer( objective_func=sphere_function, dim=10, lb=-100, ub=100, pop_size=30, max_iter=200 ) print(f"最优解: {best_solution}") print(f"最优适应度: {best_fitness}") plot_convergence(convergence)

5.2 SVM超参数调优

GWO可以用于优化机器学习模型的超参数。以下是用GWO优化SVM分类器的示例：

from sklearn.svm import SVC from sklearn.model_selection import cross_val_score def svm_fitness(params): """SVM分类器的适应度函数""" C, gamma = params model = SVC(C=10**C, gamma=10**gamma, random_state=42) scores = cross_val_score(model, X_train, y_train, cv=5, scoring='accuracy') return -np.mean(scores) # 最小化问题 # 定义搜索边界 lb = [-3, -5] # log10(C)和log10(gamma)的下界 ub = [3, 2] # 上界 # 运行GWO优化 best_params, best_score, _ = gwo_optimizer( objective_func=svm_fitness, dim=2, lb=lb, ub=ub, pop_size=20, max_iter=50 ) print(f"最优参数: C=10^{best_params[0]:.2f}, gamma=10^{best_params[1]:.2f}") print(f"最佳交叉验证准确率: {-best_score:.4f}")

6. 算法变体与改进思路

虽然标准GWO已经表现出色，但研究者们提出了多种改进版本以适应不同场景。以下是几种常见的改进方向：

混合变异策略：
- 在位置更新后加入变异操作
- 增强算法跳出局部最优的能力
- 如差分变异、高斯变异等
自适应参数调整：
- 根据搜索进度动态调整收敛因子a
- 平衡探索与开发阶段
多种群策略：
- 将种群分为多个子群
- 子群间定期交换信息
- 提高搜索多样性

# 改进版GWO示例：带差分变异的DGWO def dgwo_update_position(X_alpha, X_beta, X_delta, A, C, current_pos, F=0.5): """带差分变异的位置更新""" # 标准GWO更新 standard_update = (X_alpha - A*abs(C*X_alpha - current_pos) + X_beta - A*abs(C*X_beta - current_pos) + X_delta - A*abs(C*X_delta - current_pos)) / 3 # 差分变异 mutation = F * (X_alpha - current_pos) return standard_update + mutation

在实际项目中，我发现结合差分变异的改进版GWO在处理高维复杂问题时表现尤为突出。特别是在神经网络结构搜索任务中，这种变体能够更有效地探索参数空间，避免早熟收敛。