#斯坦福高效图像训练法#给图像加个大过滤器——让图像的第一层训练更加“均匀”,即可帮助模型更高效地学习?众所周知,视觉模型学习图像特征时,模型第一层通常会根据图像的像素值来进行训练。该过程有个问题:图像亮度很高的部分(对比度很强的部分)会对模型训练产生很大的影响,这让训练变得很不均衡。为了解决这个问题,斯坦福大学的团队提出一种优化方法:TrAct,能帮助模型的第一层训练得更加平衡。它做了两件事:1. 调整激活值:即调整第一层的输出值,让模型看到图像后,惊喜地连连拍手。2. 优化权重更新:修改模型的第一层,让它们的更新更加均匀,不会因为输入图像的亮度差异而导致训练变得不稳定。这样做的好处是,当你用TrAct训练一个模型时,只需要一个额外的参数,就能让用更少的训练次数得到比传统方法更好的结果。实验结果显示,在一些常见的数据集(比如 CIFAR-10、ImageNet)上,TrAct显著提高了训练效率,速度快了1.25倍到4倍,准确性甚至更好。此外,这个方法不需要改动模型的架构,便可以跟现有的优化器和模型一起使用,包括卷积神经网络(CNNs)和视觉变换器(ViTs)。感兴趣的小伙伴可以查看原文: