当前位置:首页 > 影视动漫 >

iclr最新优化算法(lr算法公式)

来源:原点资讯(www.yd166.com)时间:2023-05-11 00:11:32作者:YD166手机阅读>>

作者丨GlobalTrack

编辑丨极市平台

iclr最新优化算法,lr算法公式(1)

论文链接:https://openreview.net/pdf?id=6kxApT2r2i

源码链接:https://github.com/yukimasano/single-img-extrapolating

简介

本文研究关注于是否神经网络可以从单一数据训练并进行推断。

这个问题的主要难点在于:1. 当前深度学习优化的算法(SGD等)在大的数据集上设计的,不能在单一数据上推广,2. 需要关于单个数据之外的自然图像空间信息的语义类别进行推断。本文的主要思想是结合数据增广和知识蒸馏的相关算法。

数据增广算法可以通过单一图像生成大量变化,有效解决一般优化方法只在大型数据集上设计难以优化的问题1。为了解决单一数据设定难以提供语义类别相关信息的问题,本文方法选择使用有监督训练模型的输出和知识蒸馏算法。使用知识蒸馏算法提供训练过程中需要的语义类别信息。

相关工作知识蒸馏

一般的知识蒸馏主要目标即使用一个预训练的教师模型信息辅助训练一个低学习能力的学生模型。利用教师模型获得的软预测结果获得类别间关系提升学生模型训练性能。早期方法只使用最终层输出,其他转移的特征还包括:中间层特征;空间注意力后特征,对比学习蒸馏等。

无数据知识蒸馏

无数据知识蒸馏(Data-Free Knowledge Distillation)一般用于极端巨大数据集,有隐私需求的数据集或只能获得API模型输出的需求等。原始方法一般需要训练数据集相关激活层统计信息。之后提出的方法一般不需要此类信息。使用基于生成的方法生成合成图像数据集,最大限度地激活教师最后一层的神经元。

本文方法数据生成

在A critical analysis of self-supervision, or what we can learn from a single image研究中,一个单一的图片增广若干次生成一个固定尺寸的静态数据集。增广方法包括切割,旋转,剪切和颜色抖动( cropping, rotation,shearing,color jittering)。本文也使用相同的方法并不改变超参。这里通过添加随机噪声分析源图像选择。另外本文实验也关注了音频分类。这里选择的赠官该方法包括随机音量增加,背景噪声添加和变桨(pitch shifting)。

知识蒸馏

原始知识蒸馏算法(Distilling the knowledge in a neural network)将一个预训练的教师模型的知识迁移到一个能力较弱的学生模型。学生模型的优化目标是一个两种损失函数的加权组合:一个标准的交叉熵损失和分布匹配损失(减少与教师模型结果的分布差异)。

本文方法特殊的是对于生成的单一图像没有标签信息,这里使用学生模型结果与教师模型结果的KL散度信息:

iclr最新优化算法,lr算法公式(2)

训练时按照Knowledge distillation: A good teacher is patient and consistent的功能匹配策略,教师与学生模型传入一致的增广示例。复杂增广的方法包括MixUp和CutMix。

实验

这里检查从单一图像推断到小尺寸数据集的能力。表1给出了在CIFAR10和CIFAR100数据集上的实验结果。使用源数据集在源数据集达到最高的精度,但使用单个图像得到的模型也可以达到下界。另外单一图像蒸馏甚至超过了使用CIFAR-10的10K图像指导CIFAR-100训练即使两个数据集相似。

iclr最新优化算法,lr算法公式(3)

单一图像的选择 这里发现单一图像选择是重要的。随机噪声或稀疏的图像与密集标签bridge和Animal图像性能差很多。

损失函数的选择 图3(b)发现本文方法的学生模型甚至能从下降质量的学习信号下学习。即使受到的是TOP-5的预测或者最大预测(硬标签),学生模型也能在很大意义上进行推断(>91%/60%)。

增广策略选择 图3(c)给出了不同的增广策略,除了之前指出的策略:更多的增广更好。本文发现在本文的单一图像蒸馏任务上CutMix比MixUp性能更好。

iclr最新优化算法,lr算法公式(4)

首页 123下一页

栏目热文

二建报名居住证怎么弄(二建报名后怎么查询报名信息)

二建报名居住证怎么弄(二建报名后怎么查询报名信息)

对于第一次尝试报名考试的我,哪知道报名就给了我半血伤害,实在是不容易,今天我就整理了一下我的报名历程,分享给大家,也让...

2023-05-11 00:09:29查看全文 >>

教师资格证要居住证吗(有无居住证是什么意思教师资格证)

教师资格证要居住证吗(有无居住证是什么意思教师资格证)

许多同学问,教招考试怎么考的?自己能不能报名?今天通过对比教资和教招带大家感受下教招吧01 考试流程教师资格证笔试通过且...

2023-05-11 00:08:34查看全文 >>

考教资居住证是怎么回事(报考教资需要居住证吗)

考教资居住证是怎么回事(报考教资需要居住证吗)

按照往年惯例,教师资格证报名时间在9月份,小伙伴们可以趁着这段时间,早点准备报名材料。但是小编洞察到很多小伙伴还不知道居...

2023-05-11 00:30:59查看全文 >>

没有居住证可以考教资吗(有无居住证对考教资有什么影响)

没有居住证可以考教资吗(有无居住证对考教资有什么影响)

23上半年教资笔试1月13日起报名 3月11日笔试笔试报名材料需要哪些?快来一起看看!1- 身份证明 -笔试报名时需要填...

2023-05-11 00:03:34查看全文 >>

教资认定要居住证吗(教资认定必须在居住证所在地吗)

教资认定要居住证吗(教资认定必须在居住证所在地吗)

麒麟区2023年中小学教师资格认定公告根据云南省2023年中小学教师资格认定工作安排,现将认定工作有关事项公告如下:一、...

2023-05-11 00:23:07查看全文 >>

iclr知识图谱(如何学好iclr)

iclr知识图谱(如何学好iclr)

雷锋网 AI 科技评论:ICLR 2020 正在进行,但总结笔记却相继出炉。我们曾对 ICLR 2020 上的图机器学习...

2023-05-11 00:35:34查看全文 >>

iclr是什么模型(mlr模型是啥)

iclr是什么模型(mlr模型是啥)

萧箫 发自 凹非寺量子位 | 公众号 QbitAI用深度生成模型搞科学发现,是不少AI大牛最近的研究新动向。就在最新一届...

2023-05-11 00:25:50查看全文 >>

采样步长和仿真步长(离散系统采样时间和仿真步长)

采样步长和仿真步长(离散系统采样时间和仿真步长)

Simulink仿真Simulink是MATLAB中的一种可视化仿真工具, 基于MATLAB的框图设计环境,是实现动态系...

2023-05-11 00:37:38查看全文 >>

模型预测精度太低(模型参数复制后准确率降低)

模型预测精度太低(模型参数复制后准确率降低)

这篇文章力图回答三个建模中比较关心问题:1、如何控制模型的复杂度;2、如何构建建模要预测的指标(Y);3、寻找什么样的特...

2023-05-11 00:35:03查看全文 >>

时序预测常见模型(时序预测强化学习)

时序预测常见模型(时序预测强化学习)

作者 | arit Maitra编译 | 1 1=6来源 | 量化投资与机器学习(ID:Lhtz_Jqxx)0 前言时间...

2023-05-10 23:54:31查看全文 >>

文档排行