当前位置: 首页 > news >正文

网站制作 江西中小微企业服务平台

网站制作 江西,中小微企业服务平台,软件开发文档编制规范,培训机构课程设置KAN: Kolmogorov-Arnold Networks code#xff1a;https://github.com/KindXiaoming/pykan Background ​ 多层感知机#xff08;MLP#xff09;是机器学习中拟合非线性函数的默认模型#xff0c;在众多深度学习模型中被广泛的应用。但MLP存在很多明显的缺点#xff1a;…KAN: Kolmogorov-Arnold Networks codehttps://github.com/KindXiaoming/pykan Background ​ 多层感知机MLP是机器学习中拟合非线性函数的默认模型在众多深度学习模型中被广泛的应用。但MLP存在很多明显的缺点 **参数量大**Transformer中MLP几乎消耗了所有非嵌入参数。**缺乏可解释性**在没有后期分析工具的情况下相较于注意力层通常难以解释。 Novelty ​ 受到Kolmogorov-Arnold 表示定理启发提出了一种有希望的MLP替代方案称为Kolmogorov-Arnold Networks(KANs)。 ​ MLP将固定的激活函数放在节点(“神经元”)上而KAN将可学习的激活函数放在边缘(“权重”)上。 ​ 对于PDE求解2x10 的KAN比4x100 MLP精确100倍10−7 vs 10−5 MSE参数效率高100倍 1 0 2 10^2 102 vs 1 0 4 10^4 104参数。 Method Kolmogorov-Arnold表示定理 基本形式 ​ 这个公式仅仅包含两层非线性和少量的隐藏层项2n1。这意味着原始的表示方法虽然理论上是完备的但在处理实际问题时可能因表达能力受限而不够有效。 ​ 本文将把网络泛化到任意宽度和深度可以增加模型的复杂度和学习能力使得网络能够更好地逼近和表达各种复杂的函数。 KAN结构 把网络泛化到任意宽度和深度 激活函数 ​ c i c_i ci​是可训练的。原则上w是多余的因为它可以被包括到b(x)和spline(x)中。然而KAN中仍使用了w以更好地控制激活函数的总体大小。 初始化 ​ 每个激活函数初始化为 s p l i n e ( x ) ≈ 0 spline(x)≈0 spline(x)≈0。w根据Xavier初始化进行初始化。 网格扩展 ​ 增加MLP的宽度和深度可以提高性能但不同大小的MLP训练是独立的训练这些模型的成本很高。 ​ KAN可以先用一个参数较少的模型进行训练然后通过使其样条网格更精细将其扩展到具有更多参数的KAN而不需要从头开始重新训练更大的模型。通过以下公式利用最小二乘法来获得细网格的参数 简化KAN ​ 从一个足够大的KAN开始用稀疏性正则化训练它然后进行修剪。 稀疏化 ​ 在训练MLP时通常使用L1范数来鼓励模型的权重向量中有更多的零从而达到稀疏化的效果。但L1不足以使KAN稀疏化需要一个额外的熵正则化。 ​ 定义每一个激活函数的L1范数为 ​ KAN的每一层的L1范数为所有激活函数的L1范数之和 ​ 定义KAN的每一层的熵为 ​ 总的训练损失为预测损失与所有KAN层的L1和熵正则化之和 剪枝 ​ 对于每个节点来对KAN进行剪枝定义每个结点的传入和传出分数为 如果传入和传出的分数都小于0.01则认为该神经元时不重要的将其修剪。 符号化 ​ 一些激活函数实际上是符号函数如cos、log等作者提供了一个接口来将他们设置为制定的符号函数f的形式。但激活函数的输出和输出可能有偏移和缩放因此从样本中获取预激活值x和后激活值y并拟合仿射函数 y ≈ c f ( a x b ) d y≈cf(axb)d y≈cf(axb)d。 人类用户可以通过观察KAN可视化的激活函数猜出这些符号公式并将这些激活函数直接设置为该公式再去拟合仿射函数。通过这样注入人类的归纳偏差或领域知识使得拟合的结果更加精准。 Experiment 神经标度律scaling lawKAN比MLP有着更快的标度变化速度。在求解偏微分方程任务中KANs也展现出更快的收敛速度、达到更低的损失并有着更陡峭的标度率表现。 **函数拟合**KAN比MLP更准确具有更好的Pareto边界 **偏微分方程求解**在求解泊松方程时KAN比MLP更准确敛速度更快损失更低并且具有更陡峭的神经标度率表现。 **持续学习**借助样条设计的局部性天然优势KAN可以在新数据上实现持续学习规避了机器学习中存在的灾难性遗忘问题。 **可解释性**KAN能通过符号公式揭示合成数据集的组成结构和变量依赖性。 人类用户可以与 KANs 交互使其更具可解释性。在 KAN 中注入人类的归纳偏差或领域知识非常容易。 Limitation ​ KAN最大的瓶颈在于训练速度慢。在参数数量相同的情况下KAN通常比MLP慢10倍这需要在未来加以改善。
http://www.zqtcl.cn/news/357297/

相关文章:

  • 南京越城建设集团网站网站空间续费多少钱
  • 深圳nft网站开发公司如何制作微信公众号里的小程序
  • 做网站美工要学什么聊城网站建设电话
  • 南通个人网站建设快手秒刷自助网站
  • html5 做网站网站开发找工作
  • 聚成网站建设艺术公司网站定制中心
  • 阿里云上可以做网站吗十六局集团门户网
  • 门户网站建设询价函有哪些网站可以做设计挣钱
  • 如何建立自己网站奔奔网站建设
  • 自由做图网站做网站所用的工具
  • 广西南宁做网站专业网站建设案例
  • 视屏网站的审核是怎么做的群辉 搭建wordpress
  • 嘉兴网站快速排名优化衡阳网站建设制作
  • 建设公共资源交易中心网站成都APP,微网站开发
  • dede网站地图修改厦门百度seo
  • 可以做行程的网站网站详情怎么做的
  • 网站建设心得8000字营销型网站建设的注意事项
  • 织梦购物网站整站源码哈尔滨网站建设技术托管
  • 做推广的网站微信号企业免费网站制作
  • 做旅游网站的引言上海公司网站建设哪家好
  • 找项目去哪个网站网站建设一条龙全包
  • 网站 数据库 模板网站系统建设合作合同范本
  • 网站空间租赁费用企业网站建设需要多少钱知乎
  • 免费建网站哪个模板多浅谈学校网站建设
  • 精致的个人网站手机网站建设基本流程图
  • 优秀网站网页设计图片主机屋做网站视频
  • 安徽网站建设电话编程一个最简单游戏代码
  • 西宁圆井模板我自己做的网站在线平面设计图
  • 浦口区网站建设技术指导做软件需要网站吗
  • 丹东有做公司网站的吗搜索引擎 wordpress