当前位置：首页 > news >正文

网站中的冒号番禺网站制作技术

news 2025/11/14 16:58:18

网站中的冒号,番禺网站制作技术,小说网站开发需求分析,排名优化工具内容摘自王老师的B站视频#xff0c;大家还是尽量去看视频#xff0c;老师讲的特别好#xff0c;不到一小时的时间就缕清了小样本学习的基础知识点~Few-Shot Learning (1/3): 基本概念_哔哩哔哩_bilibili Few-Shot Learning#xff08;小样本分类#xff09; 假设现在每类…内容摘自王老师的B站视频大家还是尽量去看视频老师讲的特别好不到一小时的时间就缕清了小样本学习的基础知识点~Few-Shot Learning (1/3): 基本概念_哔哩哔哩_bilibili Few-Shot Learning小样本分类假设现在每类只有一两个样本计算机能否做到像人一样的正确分类这个例子Support Set有两类每类只有一两个样本靠这些样本难以训练出一个深度神经网络这个集合只能提供一些参考信息。对于小样本问题不能用传统的分类方法。小样本分类与传统的监督学习有所不同小样本学习的目标不是让机器通过学习训练集中图片知道哪类是什么样子当我拿一个很大的训练集来训练神经网络后进行小样本分类预训练模型的目的是让机器自己学会学习-----也就是学习事物的异同学会区分不同的事物。现在训练集有五类其中并没有松鼠这个类别训练完成之后可以问模型这两张图片是否是相同的东西呢这时候模型已经学会分辨了事物的异同比如给出两张松鼠图片模型知道这两个动物之间长得很像模型能够告诉你两张图片很可能是相同的东西。支持集给出一张图片神经网络不知道这是什么。这时候就需要支持集Support Set每类给出少样本1~2张神经网络将Query图片和支持集中的每个类别依次对比找出最相似的。训练集和支持集的区别训练集规模很大每类有很多张图片可以训练一个深度神经网络支持集每类只有一张或几张图片不足以训练一个大的神经网络只能在做预测时候提供一些额外信息。用足够大的训练集训练的目的不是让模型识别训练集中的大象、老虎而是知道事物的异同。对于训练的模型只要提供含有该类别的小样本信息模型就能区分类别尽管训练集中没有这个类别。小样本分类Learn To Learn 带小朋友去动物园小朋友不知道这个动物是什么但是小朋友只需要翻一遍卡片将目标与卡片上动物对应就知道看到的动物是什么这个卡片就是支持集前提是小朋友有读卡片的能力也就是得先经过训练学习。如果卡片中每类只有一张那就是One-Shot Learning单样本学习传统监督学习和小样本学习步骤的区别传统监督学习测试图片虽然不是训练集中图片但包含在训练集类别模型已经见过上千张该类别图片能够判断出是哪类。小样本学习测试图片不但不包含在训练集中也不是训练集中的类别。所以小样本学习比传统监督学习更难。因为不是训练集中的类别所以要提供支持集提供更多信息给模型看小卡片每张卡片有一个图片和一个标签模型发现测试图片和某张卡片相似度高就知道测试图片属于哪个标签小样本学习两个术语 k-way 支持集含有的种类数 n-shot 支持集中每个种类有多少张图片小样本学习预测准确率横轴是支持集类别数量。随着类别数量增加分类准确率会降低。比如从三选一变成六选一每类样本越多做预测越容易相似度函数 sim(x, x) x,x为两个input 理想情况sim(x1,x2) 1 , sim(x1,x3) 0, sim(x2,x3) 0 从一个很大的训练集上学习一个相似度函数它可以判断两张图片的相似度有多高。孪生神经网络就可以作为相似度函数可以拿大规模数据集做训练训练结束之后可以拿得到的相似度函数做预测。给一个测试图片可以拿他跟支持集中的图片逐一对比计算相似度找到相似度最高作为预测结果。 Omniglot 特点小样本(20个,105*105) 孪生网络Siamese Network 孪生网络要解决的问题第一类分类数量较少每一类的数据量较多比如ImageNet、VOC等。这种分类问题可以使用神经网络或者SVM解决只要事先知道了所有的类。第二类分类数量较多或者说无法确认具体数量每一类的数据量较少比如人脸识别、人脸验证任务。少样本问题孪生网络的优点这个网络主要的优点是淡化了标签使得网络具有很好的扩展性可以对那些没有训练过的小样本类别进行分类这点是优于很多算法的。第一种训练孪生网络方法每次取2样本比较相似度。训练这个神经网络要用一个大的数据集每类有标注每类下面都有很多个样本。我们需要用训练集来构造正样本和负样本正样本告诉神经网络什么东西是同一类。负样本告诉神经网络事物之间的区别。正样本获取每次从训练集中抽取一张图片老虎然后从同一类中随机抽取另一张图片老虎标签设置为1 (tiger, tiger, 1)意思是相似度满分。负样本获取每次从训练集中抽取一张图片汽车排除汽车这个类别再从数据集中随机抽样大象标签设计为(car, elephant, 0)意思是相似度为0 搭建一个卷积神经网络CNN用来提取特征这个神经网络有很多卷积层Pooling层以及一个flatten层。输入是一张图片x输出是提取的特征向量 f(x) 现在开始训练神经网络输入为(x1, x2 , 0或1)把这两张图片输入神经网络把刚才搭建的卷积神经网络记作函数f。对于提取的特征向量第一张图片特征向量记作h1 f(x1)第二张图片特征向量记作h2 f(x2)如果都是用CNN这两个f需要是相同的卷积神经网络共享相同的权值W之所以叫孪生就是因为共享特征提取的部分。也可以不同权值则不同场景允许不同神经网络。然后拿h1 - h2 得到一个向量再对这个向量所有元素求绝对值记作z ||h1 - h2||表示两个特征向量之间的区别再用一些全连接层来处理z向量输出一些标量。最后用Sigmoid激活函数得到输出是一个介于0~1之间的实数可以衡量两个图片之间的相似度。如果两张图片是同一个类别输出应该接近1如果两张图片不同类别输出应该接近0希望神经网络的训练输出接近1把标签与预测之间的差别作为损失函数。损失函数可以是标签与预测的交叉熵损失函数cross-entropy loss function可以衡量标签与预测的差别。有了损失函数可以用反向传播计算梯度用梯度下降来更新模型参数。模型主要有两部分一个是卷积神经网络f用来从图片提取特征一个是全连接层预测相似度训练部分就是更新这两个的参数做反向传播梯度从损失函数传回到向量z以及全连接层的参数有了损失函数关于全连接层的梯度就可以更新全连接层的参数了。然后梯度进一步从向量z传回到卷积神经网络更新卷积神经网络参数这样就完成了一轮训练做训练时候我们要准备同样数量正样本和负样本。负样本标签设置为0希望神经网络预测接近0意思是这两张图片不同。还是用同样方法做反向传播更新参数。训练好模型之后可以做One-Shot Prediction 六个类别每个类别一张图片这六个类别可以都不在训练集中将Query与Support Set支持集中图片作对比将Query图片与支持集中某一类一张图片作为input1 和 input2 输入到孪生网络中孪生网络会输出一个0~1之间的值。用同样方法算出Query与所有图片相似度查找相似度最高的。孪生网络第二种训练方法Triplet Loss 准备数据有这样一个训练集每次选出三张图片首先从训练集随机选一张图片作为anchor(锚点)记录这个锚点然后从同类中随机抽取一张图片作为正样本Positive排除该类别从数据集中作随机抽样得到不同类别的负样本Negative。现在有锚点x^a正样本x负样本x-把三张图片分别输入卷积神经网络f来提取特征(f指的是同一个卷积神经网络)得到三个特征向量计算正样本和锚点再特征空间上的距离将特征向量 f(x)与f(xa)求差然后算二范数的平方得到距离d 类似操作得到d- 我们希望得到的神经网络有这样性质像同类别特征向量聚在一起不同类别的特征向量能够被分开所以d应该很小d-应该很大这个坐标系是特征空间卷积神经网络可以把图片映射到这个特征空间 d-应该比d大很多否则模型分辨不了同类和不同类所以鼓励正样本在特征空间接近锚点(d尽量小)鼓励负样本在特征空间远离锚点(d-尽量大) 指定一个margin αα0。如果d- d α我们就认为没有损失loss0分类正确。假如条件不满足则会有loss d α - d- 我们希望loss越小越好有了损失函数就可以求损失函数关于神经网络的梯度作梯度下降来更新模型参数测试模型给一个query一个支持集用神经网络提取特征把所有这些图片变为特征向量比较特征向量之间的距离。找出距离最小的。总结我们使用了Siamese Network解决了少样本学习基本思路用一个比较大的训练集来训练孪生网络让孪生网络知道事物之间的异同训练结束之后拿孪生网络作预测解决少样本问题。少样本的问题是少样本的类别不在训练集中。比如query是松鼠但训练集中没有松鼠这个类别需要额外的信息来识别query的图片这个额外的信息就是少样本支持集。支持集称为k-way n-shotk个类别类别越多预测越困难n个样本样本越少预测越困难one-shot learning单样本预测最困难。有了训练好的孪生网络我们就可以将query与support set中的样本逐一对比选出距离最小或相似度最高作为分类结果。两种训练孪生网络方法1.两个input标签0或1输出0~1之间数值与标签差值作为loss目标是让预测尽量接近标签。 2.另一种是Triplet Lossxa,x,x-用CNN提取得到三个特征向量输出dd-目标是让d尽量小d-尽量大。有了这样一个神经网络就可以用它提取特征比较两张图片在特征空间距离作出few-shot分类 Fine Tuning 基本思路在大规模数据上预训练模型然后再小规模的support set上做fine-tuning。方法简单准确率高。看个例子余弦相似度consine similarity衡量两个向量之间相似度现在两个向量长度都是1即他们的二范数都为1。把向量x和w的夹角记作θ由于向量x和w长度都是1cosθ就是x和w的内积表示两个向量的相似度。可以理解把向量x投影到w方向上投影长度就是-1到1之间如果向量x和w的长度不是1则需要做归一化把他们程度变为1然后求得的内积才是余弦相似度微调主要用到Softmax Function 它是一个常用的激活函数可以把一个k维向量映射成一个概率分布输入为Φ它是任意的k维向量。把Φ的每一个元素做指数变换得到k个大于0的数然后对其作归一化让得到的k个数相加等于1把得到的k个数记为向量p 向量p就是softmax函数的输出性质输入Φ和输出p都是k维向量向量p的元素都是正数而且相加等于1 所以p是个概率分布 softmax通常用于分类器的输出层如果有k个类别那么softmax的输出就是k个概率值每个概率值表示对一个类别的confidence。 softmax会让最大的值变大其余的值变小。softmax比max函数要温柔一些 Softmax分类器是一个全连接层加一个Softmax函数分类器的输入是特征向量x表示输入的测试图片的特征向量把x乘到参数矩阵w上再加上向量b得到一个向量对得到的向量做softmax变换得到输出向量p 假如类别数量为k那么向量p就是k维的矩阵W和b是这一层的参数可以从训练数据中学习。W有K行k是类别数量所以W每一行对应一个类别d是每个类别的特征数量使用预训练好的神经网络在query和support set上做fine-tuning的过程把query和support set中的图片都映射成特征向量这样可以比较query和support set在特征空间上的相似度比如可以计算两两之间的cosine similarity。最后选择相似度最高的作为query的分类结果预训练搭一个卷积神经网络用来提取特征有很多卷积层、Pooling层以及一个Flatten层也可以有全连接层神经网络输入是一张图片x输出一个特征向量f(x) 可以用传统的监督学习预训练好后把全连接层都去掉也可以用孪生网络训练 Few-Shot分类方法 3-way 2-shot三类别每类别两样本拿预训练的神经网络提取特征每张图片变成一个特征向量每个类别两个特征向量平均每个类别特征向量作平均得到一个同样大小的向量也就是均值向量有三个类别一共得到三个均值向量均值向量归一化得到三个向量μ1μ2μ3它们的二范数都等于一μ1μ2μ3就是对三个类别的表征做分类的时候要拿query的特征向量对μ1μ2μ3作对比对query作分类给一张query图片需要判断是三个类别中的哪一个拿预训练的神经网络f来提取特征得到一个特征向量对特征向量作归一化得到向量q它的二范数等于1 与刚才从support set中提取的三个向量μ1μ2μ3它们的二范数也是1每个μ向量表征一个类别可以把三个μ向量堆叠起来作为矩阵M的三个行向量做few-shot预测把query的特征向量q乘到矩阵M上,再做Softmax变换得到p Softmax(Mq)p是个概率分布这个例子里,p是三维向量表示对三个类别的confidence 三个元素分别是q与μ1μ2μ3的内积很显然在向量p中第一个元素最大分类结果是第一类 Fine-tuning可以大幅提高预测准确率基本都是先做预训练后做Fine-Tuning 刚才我们用了固定的W和b没有学习这两个参数可以在Support Set上学习W和b这叫做fine tuning 用Cross Entropy来衡量yj与pj的差别有多大yj是真实标签pj是分类器做出的预测损失函数就是Cross Entropy Loss Support set中有几个或者几十个有标注的样本每个样本都对应一个Cross Entropy Loss把这些Cross entropy loss加起来作为损失函数也就是说我们用support set中所有的图片和标签来学习这个分类器对CrossEntropyLoss做最小化Minimization让预测pj尽量接近真实标签yj Minimization是对分类器参数W和b求的希望学习W和b当然也可以让梯度传播到卷积神经网络更新神经网络参数让提取的特征向量更有效 support通常很小几十个到几百个样本最好加个regularization来防止过拟合。有一篇文章建议用Entropy Regularization 有一篇ICLR2020的论文说对于5-way 1-shot做fine tuning可以提到2%~7%的准确率对5-way 5-shot提高1.5%~4%准确率尽管support set很小但用support set来训练分类器有助于提高准确率预训练fine tuning比只用预训练好很多 Wb默认值 Entropy Regularization防止过拟合希望Entropy Regularization越小越好

查看全文

http://www.zqtcl.cn/news/329573/