news 2026/5/10 21:43:36

机器学习中的正则化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
机器学习中的正则化

摘要:本文介绍了机器学习中用于防止过拟合的正则化技术,重点讲解了L1和L2正则化。L1正则化通过添加权重绝对值之和的惩罚项,促使模型产生稀疏权重;L2正则化则通过权重平方和的惩罚项减小权值大小。文章分别提供了使用scikit-learn库实现这两种正则化的Python代码示例,并展示了在波士顿房价数据集上的应用效果。正则化能有效控制模型复杂度,提高泛化能力。

目录

机器学习中的正则化

L1 正则化

示例

输出结果

L2 正则化

示例

输出结果


机器学习中的正则化

在机器学习中,正则化是一种用于防止过拟合的技术 —— 过拟合指模型过于复杂,对训练数据拟合度过高,但无法泛化到新的、未见过的数据。正则化会在损失函数中引入惩罚项,促使模型采用更小的权重和更简单的结构,从而减少过拟合。

机器学习中常用的正则化技术有多种,包括 L1 正则化、L2 正则化、丢弃正则化(dropout)和早停法(early stopping)。本文将重点介绍最常用的 L1 和 L2 正则化。

L1 正则化

L1 正则化又称套索正则化(Lasso regularization),其核心是在损失函数中添加一个惩罚项,该惩罚项等于所有权重绝对值的和。L1 正则化的惩罚项公式为:λ × Σ |wᵢ|其中,λ 是控制正则化强度的超参数,wᵢ是模型中的第 i 个权重。

L1 正则化的作用是促使模型产生稀疏权重,即剔除对输出影响极小或无影响的权重,进而简化模型结构、减少过拟合。

示例

在 Python 中,可通过 scikit-learn 库的 Lasso 类实现 L1 正则化,以下是用于线性回归的示例代码:

from sklearn.linear_model import Lasso from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error # 加载波士顿房价数据集 boston = load_boston() # 将数据分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(boston.data, boston.target, test_size=0.2, random_state=42) # 创建带有L1正则化的Lasso模型(alpha=0.1) lasso = Lasso(alpha=0.1) # 在训练集上训练模型 lasso.fit(X_train, y_train) # 在测试集上进行预测 y_pred = lasso.predict(X_test) # 计算预测结果的均方误差 mse = mean_squared_error(y_test, y_pred) print("均方误差:", mse)

输出结果

运行上述代码后,将得到以下输出:均方误差: 25.155593753934173

L2 正则化

L2 正则化又称岭回归正则化(Ridge regularization),其惩罚项为所有权重平方的和。L2 正则化的惩罚项公式为:λ × Σ (wᵢ)²其中,λ 是控制正则化强度的超参数,wᵢ是模型中的第 i 个权重。

L2 正则化的作用是促使模型采用小权重,即减小所有权重的数值大小,从而平滑模型输出、减少过拟合。

示例

在 Python 中,可通过 scikit-learn 库的 Ridge 类实现 L2 正则化,以下是用于线性回归的示例代码:

from sklearn.linear_model import Ridge from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error from sklearn.datasets import load_boston from sklearn.preprocessing import StandardScaler import numpy as np # 加载波士顿房价数据集 boston = load_boston() # 创建特征数组和目标数组 X = boston.data y = boston.target # 对特征数据进行标准化处理 scaler = StandardScaler() X = scaler.fit_transform(X) # 将数据分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 定义带有L2正则化的岭回归模型(alpha=0.1) model = Ridge(alpha=0.1) # 在训练集上训练模型 model.fit(X_train, y_train) # 在测试集上进行预测 y_pred = model.predict(X_test) # 计算预测结果的均方误差 mse = mean_squared_error(y_test, y_pred) print("均方误差: ", mse)

输出结果

运行上述代码后,将得到以下输出:均方误差: 24.29346250596107

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/27 21:48:05

MySQL 逻辑备份 vs 物理备份:区别与生产级实战指南

MySQL 逻辑备份 vs 物理备份:区别与生产级实战指南 在真实生产环境中,数据库备份的价值不在于“有没有做”,而在于能否在最短时间内恢复到正确状态。 本文在完整保留逻辑备份与物理备份实战代码的基础上,补充生产级架构图、误区说明与恢复模型,形成一套可落地、可演练的 M…

作者头像 李华
网站建设 2026/5/10 4:50:07

毕业设计任务书模板基于JSP的商品库存管理系统

目录 毕业设计任务书模板:JSP商品库存管理系统系统概述核心功能模块技术实现要点数据库设计示例预期成果 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 毕业设计任务书模板:JSP商…

作者头像 李华
网站建设 2026/5/9 13:42:31

建立普通的基类Building,用来存储一座楼房的层数、房间数以及它的总平方米数。建立派生类House,继承Building,并存储下面的内容:卧室与浴室的数量。另外,建立派生类Office,继承Bu

class Builing { private:int cengshu;//层数int fangjianshu;//房间数double total_area;//总平方米 public://构造函数Builing(int ceng 0, int fangjian 0, double area 0.0) :cengshu(ceng), fangjianshu(fangjian), total_area(area){//检验合法性if (cengshu < 0){c…

作者头像 李华
网站建设 2026/4/30 23:27:45

数字图像处理篇---小波变换

如果说傅里叶变换和DCT是用固定镜头观察世界&#xff0c;那么小波变换就是一部可以自由变焦、还能移动镜头的超强摄像机。核心比喻&#xff1a;用“显微镜”和“地图”分析图像想象你要分析一张城市全景图。傅里叶/DCT的做法&#xff08;固定视角&#xff09;&#xff1a;他们飞…

作者头像 李华
网站建设 2026/5/9 11:05:18

基于LSTM的剩余寿命预测附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。&#x1f34e; 往期回顾关注个人主页&#xff1a;Matlab科研工作室&#x1f447; 关注我领取海量matlab电子书和…

作者头像 李华