北海建设厅网站,西安哪家做网站好,网站建设所需物资,个人网店搭建思路设计1、什么是机器学习
最早的机器学习应用——垃圾邮件分辨 传统的计算机解决问题思路#xff1a;
编写规则#xff0c;定义“垃圾邮件”#xff0c;让计算机执行对于很多问题#xff0c;规则很难定义规则不断变化
机器学习在图像识别领域的重要应用#xff1a; 人脸识别…1、什么是机器学习
最早的机器学习应用——垃圾邮件分辨 传统的计算机解决问题思路
编写规则定义“垃圾邮件”让计算机执行对于很多问题规则很难定义规则不断变化
机器学习在图像识别领域的重要应用 人脸识别
机器学习算法
深入理解算法基本原理 实际使用算法解决真实场景的问题 对不同算法进行对比试验 对同一算法的不同参数进行对比试验 对部分算法底层编写
介绍如何使用算法
如何评价算法的好坏如何解决过拟合和欠拟合如何调节算法的参数如何验证算法的正确性 Python机器学习技术栈 语言Python3 框架Scikit-learn 其他numpy、matplotlib… IDEJupyter Notebook、Pycharm 1、数据 莺尾花数据集 https://en.wikipedia.org/wiki/Iris_flower_data_set 关于特征信息的描述定义
2.1、数据集、样本、特征、label
行数即代表样本个数列数即代表每个样本的特征数 最后一列 label 用表示小写 y 表示
数据整体叫做数据集data set每一行数据称为一个样本sample除了最后一列 每一列表达样本的一个特征feature最后一列称为标记label通常大写字母表示矩阵小写字母表示向量如上X、y 通常大写字母表示矩阵小写字母表示向量如上X、y 特征空间feature space分类任务本质就是在特征空间切分在高纬空间同理
特征
特征可以很具体也可以很抽象
图像每个像素点都是特征28 * 28 的图像有 28 * 28 784 个特征如果是彩色图像特征更多
机器学习的基本任务
机器学习监督学习分为两类任务
分类回归
分类任务
二分类猫、狗 判断邮件是垃圾邮件、不是垃圾邮件 判断发放给客户信用卡有风险、没有风险 判断病患良性肿瘤、恶性肿瘤 判断某支股票涨、跌
多分类手写数字识别
数字识别图像识别数字识别判断发给客户信用卡的风险等级评估**数字识别MNIST数据集
多标签分类 综合图片中有女人、网球拍、运动短裤等等推测出这是一个女网球运动员。
二分类 VS 多分类
一些算法只支持完成二分类的任务但是多分类的任务可以转换成二分类的任务有一些算天然可以完成多分类任务
回归任务
回归任务定义 对于上图表数据中有四个特征但是最后一列的标签列不是一个类别是一个连续的数字这类任务叫回归任务。
回归任务结果是一个连续数字的值而非一个类别
房屋价格市场分析学生成绩
分类任务 VS 回归任务
有一些算法只能解决回归问题有一些算法只能解决分类问题有一些算法的思路既可以解决回归问题又可以解决分类问题一些情况下回归任务可以简化为分类任务
机器学习方法的分类算法角度
监督学习非监督学习半监督学习增强学习
监督学习
给机器的训练数据拥有“标记”、“答案” 如猫狗分类、MNIST手写数字识别
图像已经拥有了标定的信息银行已经积累了一定的客户信息和他们信用卡的信用情况市场积累了房屋的基本信息和最终成交的金额… 监督学习算法主要包括以下
非监督学习 半监督学习 增强学习