画品展现手机网站,哈尔滨专业制作网站,如何做好网站关键词优化,百度收录查询代码ICLR 2024 reviewer评分 6888
1 intro
zero-shot prompt 在视觉-语言模型中#xff0c;已经取得了令人印象深刻的表现 这一成功呈现出一个看似令人惊讶的观察#xff1a;这些方法相对不太受过拟合的影响 即当一个提示被手动工程化以在给定训练集上达到低错误率时#xff0…ICLR 2024 reviewer评分 6888
1 intro
zero-shot prompt 在视觉-语言模型中已经取得了令人印象深刻的表现 这一成功呈现出一个看似令人惊讶的观察这些方法相对不太受过拟合的影响 即当一个提示被手动工程化以在给定训练集上达到低错误率时从而使得该方法实际上不再是零次学习该方法在保留的测试数据上仍然表现良好。论文试图从理论上解释这一点 使用了经典的 PAC-Bayes bound结合prompt的离散属性以及大语言模型给出了先验概率 (prior distribution)能够得到非常紧的泛化误差——对一个已经预训练完毕的大语言模型做prompt engineering不会受到泛化误差的负面影响 实验证明这对现有的手工制作的提示和通过简单贪婪搜索生成的提示都成立
2 方法部分
方便部分很理论没有特别深挖。。。
设计一个提示类似于在机器学习模型中找到一组权重其中假设空间是文本/令牌的空间 目标是找到能够最大化训练准确率而不需要微调模型参数可以被构想为在令牌空间V上的离散优化论文考虑一个简单的贪婪搜索算法连续生成prompt 如果设计这个score论文考虑了两种方式 经验风险最小化 通过PAC-Bayes进行结构风险最小化
3 实验
评估了通过贪婪生成的离散提示的泛化情况
3.1 实验结果 相较于所有3个数据集的最新技术通过Greedy生成的离散提示实现了更紧的界限 ‘即使是简单的UC界限通过Greedy生成的离散提示也能在各种数据集上得到紧凑、非空泛的界限【紧密在yx下方】而带有LLM先验的PAC-Bayes界限进一步改善了这些界限 现有文献中手工生成的prompt启发式prompt同样适用 3.2 使用greedy的方式找到的prompt 4 结论
研究了在图像识别任务上prompt engineering的泛化属性 观察到一个令人惊讶的事实提示工程似乎不会过度拟合并且在测试分布上也表现良好。手动提示工程【贪婪 or 手工】通常表现出令人惊讶的强大泛化行为