当前位置: 首页 > news >正文

东营市报名系统网站设计公司瑞安专业网站建设

东营市报名系统网站设计公司,瑞安专业网站建设,固镇建设局网站,荥阳市建设局网站深度学习概述 1. 线性回归1.1 线性回归一般表达式1.2 线性回归内积表达方式#xff1a;1.3 多个样本时#xff0c;线性回归的进一步表达#xff1a;1.4 线性回归方程的解析1.5 线性回归就是求loss函数的最小值 2. 如何求函数最小值2.1 一个例子2.2 求导法——求最小值2.3 求… 深度学习概述 1. 线性回归1.1 线性回归一般表达式1.2 线性回归内积表达方式1.3 多个样本时线性回归的进一步表达1.4 线性回归方程的解析1.5 线性回归就是求loss函数的最小值 2. 如何求函数最小值2.1 一个例子2.2 求导法——求最小值2.3 求导法存在的问题2.4 迭代法——求最小值 3. 代码实现3.1 手动求函数最小值3.2 使用pytorch求函数最小值 原文 https://blog.csdn.net/Deadwalk/article/details/139606252?spm1001.2014.3001.5502 1. 线性回归 1.1 线性回归一般表达式 y f ( x ) x 1 w 1 x 2 w 2 . . . x n w n b y f(x) x_1w_1 x_2w_2 ... x_nw_n b yf(x)x1​w1​x2​w2​...xn​wn​b ( x 1 、 x 2 、 x n ) 输入特征向量 ( x ) 的各个特征值代表输入数据的特征。 (x_1、x_2、x_n)输入特征向量 ( x ) 的各个特征值代表输入数据的特征。 (x1​、x2​、xn​)输入特征向量(x)的各个特征值代表输入数据的特征。 ( w 1 、 w 2 、 w n ) 权重向量 ( w ) 的各个权重值用来衡量每个特征对输出的影响程度。 (w_1、w_2、w_n)权重向量 ( w ) 的各个权重值用来衡量每个特征对输出的影响程度。 (w1​、w2​、wn​)权重向量(w)的各个权重值用来衡量每个特征对输出的影响程度。 ( b ) 偏置项也称为截距项用来调整模型的输出值即在没有特征输入时的输出值。 ( b )偏置项也称为截距项用来调整模型的输出值即在没有特征输入时的输出值。 (b)偏置项也称为截距项用来调整模型的输出值即在没有特征输入时的输出值。 ( y ) 模型的输出值即线性回归模型对输入特征的预测值。 ( y )模型的输出值即线性回归模型对输入特征的预测值。 (y)模型的输出值即线性回归模型对输入特征的预测值。 1.2 线性回归内积表达方式 y f ( x ) x w b y f(x) xw b yf(x)xwb x w 特征向量 ( x ) 与权重向量 ( w ) 的内积 xw特征向量 ( x ) 与 权重向量( w ) 的内积 xw特征向量(x)与权重向量(w)的内积 1.3 多个样本时线性回归的进一步表达 y f ( X ) X w b y f(X) Xw b yf(X)Xwb X 特征矩阵矩阵的行是一条一条的样本矩阵的列是多个特征向量。 X特征矩阵矩阵的行是一条一条的样本矩阵的列是多个特征向量。 X特征矩阵矩阵的行是一条一条的样本矩阵的列是多个特征向量。 1.4 线性回归方程的解析 在训练时x和y是训练集中的特征和标签看作是常量w和b是待优化的参数值看作是变量。在推理时w和b已经找到了比较合适的值固定下来看作常量此时x是待预测的样本的特征是变量预测的本质把x带入求解y。 1.5 线性回归就是求loss函数的最小值 训练过程 从训练集中取出一对x 和y把x带入模型求解预测结果y_pred找到一种方法度量y和y_pred的误差loss由此推导 loss是y和y_pred的函数y_pred是模型预测的结果是w和b的函数所以简单来说loss也是w和b的函数 训练的本质 由上图推导结果可知训练的本质就是求解loss什么时候是最小值。当w和b取得什么值的时候loss最小。 2. 如何求函数最小值 2.1 一个例子 y 2 x 2 y 2x^2 y2x2 上述这个示例中求y最小值是比较简单的从图形中可以看到x0时y0为最小值。但是实际工程中并不是所有的函数yf(x)都能画出来简单地找到最小值此时就需要使用导数求最小值。 2.2 求导法——求最小值 通过回归导数求极值的方法我们知道大致步骤如下 第一步求函数的导数第二步令导数等于零第三步解方程求出疑似极值点第四步验证该点是否是极值点以及是什么极值点 2.3 求导法存在的问题 求导的方法是有一定前提条件的即 第一步的求(偏)导数是可以求得的第三步(偏)导数为零后方程(组)是可以解的。实际工程中上述方法是不可行的。以Llama3-8B模型为例其有80亿个输入参数 x按照上述的求解方法是几乎无法求得最小值的由此可知通过推导公式期望一次性求得最小值是不现实的而我们可以借鉴人工智能中一个重要的思想迭代法来逐步求解最小值。 2.4 迭代法——求最小值 原理如下图 随机选择一个出生点 x 0 随机选择一个出生点x_0 随机选择一个出生点x0​ 当 x 0 在最小值的左侧时 x 0 正数一个非常小的正数向右侧移动而最小值左侧的导数是负数所以可以看作 x 0 − 导数 当x_0在最小值的左侧时x_0 正数一个非常小的正数向右侧移动而最小值左侧的导数是负数所以可以看作 x_0 - 导数 当x0​在最小值的左侧时x0​正数一个非常小的正数向右侧移动而最小值左侧的导数是负数所以可以看作x0​−导数 当 x 0 在最小值的右侧时 x 0 − 正数一个非常小的正数向左侧移动而最小值右侧的导数是正数所以也可以看作 x 0 − 导数 当x_0在最小值的右侧时x_0 - 正数一个非常小的正数向左侧移动而最小值右侧的导数是正数所以也可以看作 x_0 - 导数 当x0​在最小值的右侧时x0​−正数一个非常小的正数向左侧移动而最小值右侧的导数是正数所以也可以看作x0​−导数 当 x 0 是最小值时 x 0 不需要移动而此处的导数也正是 0 所以依然可以看作 x 0 − 导数 当x_0是最小值时x_0不需要移动而此处的导数也正是0所以依然可以看作 x_0 - 导数 当x0​是最小值时x0​不需要移动而此处的导数也正是0所以依然可以看作x0​−导数 梯度下降的概念 在一元函数中求函数f(x)在某一点的斜率为导数在多元函数中称为偏导数也就是梯度。减去导数也就是减去梯度这就是梯度下降法 3. 代码实现 3.1 手动求函数最小值 以 y 2 x 2 y 2x^2 y2x2 import numpy as npdef fn(x):原始函数return 2 * x ** 2def dfn(x):导函数return 4 * xdef gradient_descent(x0, learning_rate, dfn, epochs):使用梯度下降法求函数的最小值Parameters:x0 (float): 初始点的位置learning_rate (float): 学习率dfn (function): 导函数epochs (int): 迭代次数Returns:x_min (float): 最小值点的位置for _ in range(epochs):x0 x0 - learning_rate * dfn(x0)return x0# 随机选择一个出生点 x0 np.random.randint(low-1000, high1000, size1)# 迭代次数 epochs 1000# 学习率 learning_rate 1e-2# 使用梯度下降法求最小值 x_min gradient_descent(x0, learning_rate, dfn, epochs)# 输出最小值 print(最小值点的位置, x_min)f ( x , y , z ) x 2 y 2 z 2 f ( x , y , z ) x^2 y^2 z^2 f(x,y,z)x2y2z2 import numpy as npdef df_x(x, y, z):f 对 x 求偏导return 2 * xdef df_y(x, y, z):f 对 y 求偏导return 2 * ydef df_z(x, y, z):f 对 z 求偏导return 2 * z# 随机选择出生点 x0 np.random.randint(low-1000, high1000, size(1,)) y0 np.random.randint(low-1000, high1000, size(1,)) z0 np.random.randint(low-1000, high1000, size(1,))# 迭代次数 epochs 1000# 学习率 learning_rate 1e-2for _ in range(epochs):# 求解每个变量的偏导fx df_x(x0, y0, z0)fy df_y(x0, y0, z0)fz df_z(x0, y0, z0)# 每个变量都减去自己的偏导x0 x0 - learning_rate * fxy0 y0 - learning_rate * fyz0 z0 - learning_rate * fz# 输出更新后的变量值 print(更新后的 x 值, x0) print(更新后的 y 值, y0) print(更新后的 z 值, z0) 3.2 使用pytorch求函数最小值 以 y 2 x 2 y 2x^2 y2x2 import torch# 定义原始函数和导函数 def fn(x):return 2 * x ** 2# 说明pytorch可以通过grad函数求导所以可以省去写导函数 # def dfn(x): # return 4 * x# 随机选择出生点 # requires_gradTrue用来告诉框架该变量是一个张量需要计算梯度。 x0 torch.randint(low-1000, high1001, size(1,), dtypetorch.float32, requires_gradTrue)# 迭代次数 epochs 1000# 学习率 learning_rate 1e-2# 使用 PyTorch 进行梯度下降 for _ in range(epochs):# 正向传播计算损失loss fn(x0)# 反向传播计算梯度loss.backward()# 获取梯度并更新参数with torch.no_grad():grad x0.gradx0 - learning_rate * grad# 梯度清零x0.grad.zero_()# 输出最小值点的位置 print(最小值点的位置, x0.item()) 以 f ( x , y , z ) x 2 y 2 z 2 f ( x , y , z ) x^2 y^2 z^2 f(x,y,z)x2y2z2 为例 import torchdef fn(x, y, z):函数定义return x**2 y**2 z**2# 说明pytorch可以通过grad函数求导所以可以省去写导函数 # def df_x(x, y, z): # return 2 * x# def df_y(x, y, z): # return 2 * y# def df_z(x, y, z): # return 2 * z# 随机选择出生点 x0 torch.randint(low-1000, high1001, size(1,), dtypetorch.float32, requires_gradTrue) y0 torch.randint(low-1000, high1001, size(1,), dtypetorch.float32, requires_gradTrue) z0 torch.randint(low-1000, high1001, size(1,), dtypetorch.float32, requires_gradTrue)# 迭代次数 epochs 1000# 学习率 learning_rate 1e-2# 使用 PyTorch 进行梯度下降 for _ in range(epochs):# 正向传播计算损失loss fn(x0, y0, z0)# 反向传播计算梯度loss.backward()# 获取梯度并更新参数# 在测试阶段或者不需要计算梯度的情况下使用 torch.no_grad()# 以提高计算效率并避免不必要的梯度计算。with torch.no_grad():x0 - learning_rate * x0.grady0 - learning_rate * y0.gradz0 - learning_rate * z0.grad# 梯度清零x0.grad.zero_()y0.grad.zero_()z0.grad.zero_()# 输出更新后的变量值 print(更新后的 x 值, x0.item()) print(更新后的 y 值, y0.item()) print(更新后的 z 值, z0.item())
http://www.zqtcl.cn/news/866203/

相关文章:

  • 冠县品牌网站建设推广外贸企业网站管理系统
  • 信息管理的基本原理分析网站建设南阳网站建设制作
  • 网站一直百度上搜不到是怎么回事啊网站建设首保服务
  • 解决网站兼容性问题福州房产网站建设
  • 怀化百度整站优化服务wap网站前景
  • 临沂制作网站企业施工企业汛期工作实施方案
  • 82家合法现货交易所名单永康关键词优化
  • 郑州市建设工程造价信息网站浙江省建设工程质量管理协会网站
  • 乌兰浩特市建设局网站永州微网站建设
  • 做网站的用什么电脑好wordpress首页调用指定分类
  • 网站域名申请好了怎么建设网站室内设计培训班哪个学校好
  • 东莞厚街网站建设网页设计代码字号px
  • 网站建站免费淘宝优惠券网站建设总代
  • 茶叶网站设计建设工程监理招标网站
  • 网站建设发展历程做网站要多少钱 知乎
  • 丽江建设信息网站江门网站制作方案
  • 网站名注册移动端应用开发
  • 本地网站搭建流程短链接生成器app
  • 建网站需要哪些技术代做ppt网站
  • 在上海哪个网站比较好网站建设服务方案ppt模板
  • 天津网站优化流程uniapp微信小程序模板
  • 网站 搜索引擎 提交企业网站必须备案
  • 公司网站主页设计深圳搜索引擎
  • 织梦学校网站中国建设银行官方网站诚聘英才频道
  • 织梦网站去除技术支持网站建设热门吗
  • 手机自助网站建设电商首页设计
  • 个人做电影网站违法吗招标网站哪个好
  • 岱山县网站建设旅游网站制作
  • 深圳建网站三千哪些网站可以做微商品牌宣传
  • 做网站哪些软件比较好个人网站备案幕布