如何减少过拟合？

shiiiilong / 2023-05-03 / 原文

过拟合

即过度拟合train集分布，泛化能力差

解决方案

正则化
- L0，L1，L2
- dropout
- early stop
数据增强

正则化

正则化是一类通过限制模型复杂度，从而避免过拟合，提高泛化能力的方法，包括引入一些约束规则，增加先验、提前停止等。

L0,L1,L2正则化

指给目标函数增加关于模型权重的L0，L1，L2范数，来约束模型的复杂程度

L0范数：向量中的非零个数
- 难以优化，通常不用
L1范数：向量中各元素绝对值之和
- L1正则化（lasso回归）： $Costfuncation=Loss+\lambda\sum \left | w \right | $
L2范数：向量中各元素平方之和
- L2正则化（ridge回归）： \(Costfuncation=Loss+\lambda\sum \left \| w \right \|^2\)

下图可视化可以发现：

L1正则化更倾向于让一些维度的参数减少到0，适用于模型压缩，特征选择
L2正则化更倾向于让参数整体更小，更通用

Dropout

在训练阶段动态的让一些节点失效

避免节点之间学到复杂的耦合关系
也相当于将一个网络变成多个网络的累加

early stop

在验证集上的loss开始上升时就停止训练，通常会指定patience，还可以忽略一定阈值内的loss的波动

数据增强（Data Augmentation）

扩充现有数据，提升泛化能力

关于nlp任务中的数据增强方式，具体请看nlp中的数据增强方法

如何减少过拟合？更多相关文章

Redis持久化机制（面试考点）与位图API

爬虫--识别验证码

TZYLT's 2024CSP-S游记

「CSP2024」游记

js模拟构造函数的实现过程

命令拼接技巧

SD NAND 与 SPI NAND

C语言中的编译过程详解

step7 V5.x上的SCL

yolo --- 核心思想

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

什么是IT技术

即将到来！

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

ubuntu 24.04 部署 mysql 8.4.3 LTS

随机推荐

【游记】CCPC 济南 2024 游记

AJAX & AXIOS-2024/11/1

验证码处理在自动化测试中的应用

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

09-XSS键盘监听、cookie窃取&文件上传绕过

ubuntu 24.04 部署 mysql 8.4.3 LTS

国标GB28181公网平台LiteGBS国标GB28181视频平台建筑工地无线视频联网监控系统方案

imes完工下线

android 13 更改手机信号调整

BFS(Breath First Search 广度优先搜索)

热门话题

Ethernaut Level 11: Elevator Attack and Blockchain Interaction

快速部署开源spug运维平台的Docker安装指南

驱动调试之printk的原理与使用

计算机思维模型及其应用

华为云发布代码大模型PanGu-Coder2，实现高效代码生成

Linux多硬盘数据存储和分区操作

构建高可用架构: 分层冗余与自动故障转移

LoRA：高效调参的大语言模型适应方法

《分布式系统的基本原理及互联网分层架构的本质》

Hadoop写流程解析

Java架构师的系统架构设计方法论中的规范要点

使用observeDOM解决BetterScroll插件在移动端无法滑动的问题

互联网一致性架构设计实践

高并发系统架构与水平扩展

混合应用的崛起：跨平台开发取代原生应用

穗舟网（www.seizhou.com）

本站除标明"本站原创"外所有文章版权归创作人所有，本站不承担任何法律责任和连带责任，如有冒犯请直接联系，我们将立即予以纠正并致歉。

Powered by WordPress · v1.0.0-alpha