清远城乡住房建设部网站,集约化网站建设情况,深圳龙岗推广公司,成都高档网站建设1、SKlearn 是什么
Sklearn#xff08;全称 SciKit-Learn#xff09;#xff0c;是基于 Python 语言的机器学习工具包。
Sklearn 主要用Python编写#xff0c;建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上#xff0c;也用 Cython编写了一些核心算法来提高性能。…
1、SKlearn 是什么
Sklearn全称 SciKit-Learn是基于 Python 语言的机器学习工具包。
Sklearn 主要用Python编写建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上也用 Cython编写了一些核心算法来提高性能。
Sklearn 包括六大功能模块 分类Classification识别样本属于哪个类别常用算法有 SVM支持向量机、nearest neighbors最近邻、random forest随机森林 回归Regression预测与对象相关联的连续值属性常用算法有 SVR支持向量机、 ridge regression岭回归、Lasso 聚类Clustering对样本进行无监督的自动分类常用算法有 k-Meansk均值、spectral clustering特征聚类、mean-shift均值漂移 数据降维Dimensionality reduction减少相关变量维数常用算法有 PCA主成分分析、feature selection特征选择、non-negative matrix factorization非负矩阵分解 模型选择Model Selection比较验证选择参数和模型常用模块有 grid search网格搜索、cross validation交叉验证、 metrics度量 数据处理 Preprocessing特征提取和归一化常用模块有 preprocessing预处理feature extraction特征提取 这六个功能模块涉及 4类算法分类、回归 属于监督学习聚类属于非监督学习。
欢迎关注 Youcans 原创系列每周更新数模笔记
Python数模笔记-PuLP库 Python数模笔记-StatsModels统计回归 Python数模笔记-Sklearn Python数模笔记-NetworkX Python数模笔记-模拟退火算法 官网地址https://scikit-learn.org/
官方文档中文版 https://www.scikitlearn.com.cn/
内置数据集https://scikit-learn.org/stable/datasets.html 2、SKlearn 的安装
Sklearn 的安装要求Python 3.5 以上版本需要安装 NumPy、SciPy、Pandas 工具包的支持部分内容需要使用 Matplotlib、joblib 工具包。
pip 安装命令 pip3 install -U scikit-learn pip3 install -U scikit-learn -i https://pypi.douban.com/simple 注意 Sklearn 建议安装 Numpymkl可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpymkl版本下载后 pip3安装 pip install numpy-1.11.1mkl-cp27-cp27m-win_amd64.whl 3、SKlearn 内置数据集
Sklearn 内置了一些标准数据集可以用于练习和测试都是经常被引用的经典问题数据网址https://scikit-learn.org/stable/datasets.html Sklearn 标准数据集主要包括
测试问题数据集 波士顿房价Boston house prices dataset 鸢尾花问题Iris plants dataset 糖尿病数据Diabetes dataset 手写数字的识别Optical recognition of handwritten digits dataset 体能训练Linnerrud dataset 葡萄酒鉴别Wine recognition dataset 威斯康星州癌症诊断reast cancer wisconsin (diagnostic) dataset 实际问题数据集 人脸数据The Olivetti faces dataset 20个新闻文本数据The 20 newsgroups text dataset 标记的人脸数据The Labeled Faces in the Wild face recognition dataset 森林覆盖类型Forest covertypes 路透社新闻数据RCV1 dataset 网络入侵检测数据Kddcup 99 dataset 加州住房数据California Housing dataset 关注 Youcans分享原创系列 https://blog.csdn.net/youcans 4、Sklearn 数模笔记的计划
粗略看看 Sklearn 的文档是一个功能强大和丰富的机器学习库远远超出了数学建模学习的范围。 基于数模教学的目的本系列主要对应数模学习中的分类、聚类、降维问题并不打算全面讲解 Sklearn 的各种算法而是以典型问题为例来介绍原理简单、使用广泛的基本方法以便新手入门。 版权说明 YouCans 原创作品 Copyright 2021 YouCans, XUPT Crated2021-05-09
欢迎关注 Youcans 原创系列每周更新数模笔记
Python数模笔记-PuLP库1线性规划入门 Python数模笔记-PuLP库2线性规划进阶 Python数模笔记-PuLP库3线性规划实例 Python数模笔记-StatsModels 统计回归1简介 Python数模笔记-StatsModels 统计回归2线性回归 Python数模笔记-StatsModels 统计回归3模型数据的准备 Python数模笔记-StatsModels 统计回归4可视化 Python数模笔记-Sklearn 1介绍 Python数模笔记-Sklearn 2聚类分析 Python数模笔记-Sklearn 3主成分分析 Python数模笔记-Sklearn 4线性回归 Python数模笔记-Sklearn 5支持向量机 Python数模笔记-模拟退火算法1多变量函数优化 Python数模笔记-模拟退火算法2约束条件的处理 Python数模笔记-模拟退火算法3整数规划问题 Python数模笔记-模拟退火算法4旅行商问题