关于炼丹

嘎吱嘎吱脆 / 2023-08-18 / 原文

lr_scheduler的选择

学习率在训练过程起到很重要的作用，这段时间里最常用的两个：

循环学习率调度器
循环学习率调度器主要基于一个基本的观点：将训练过程中的学习率从较低的初始值逐渐增加，然后再逐渐减小到较小的终止值。这个过程有助于模型更快地收敛，并且可以降低模型过拟合的风险。同时，通过在训练过程中循环地逐渐调整学习率，可以避免在过多迭代中学习率过小或者过大。

torch.optim.lr_scheduler.OneCycleLR(optimizer, max_lr=, steps_per_epoch=, epochs=)

指数衰减学习率调度器
指数衰减学习率调度器的工作方式很简单：在每个训练迭代中，它会根据一个事先指定的指数衰减率，对当前学习率进行乘法衰减。

torch.optim.lr_scheduler.ExponentialLR(optimizer, gamma=0.88, last_epoch=-1)

个人感觉：循环学习率调度器在训练收敛的过程更稳定一些

关于炼丹更多相关文章

Redis持久化机制（面试考点）与位图API

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

什么是IT技术

即将到来！

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

ubuntu 24.04 部署 mysql 8.4.3 LTS

随机推荐

Fiddler抓包Android7以内版本

AJAX & AXIOS-2024/11/1

验证码处理在自动化测试中的应用

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

09-XSS键盘监听、cookie窃取&文件上传绕过

关于炼丹

lr_scheduler的选择

关于炼丹更多相关文章

随机推荐

热门话题