当前位置: 首页 > news >正文

鹏鹞网站页面代码中英文的网站是怎么做的

鹏鹞网站页面代码,中英文的网站是怎么做的,wordpress 灯箱,网站公司简介模板t-SNE实践——sklearn教程t-SNE是一种集降维与可视化于一体的技术#xff0c;它是基于SNE可视化的改进#xff0c;解决了SNE在可视化后样本分布拥挤、边界不明显的特点#xff0c;是目前最好的降维可视化手段。关于t-SNE的历史和原理详见从SNE到t-SNE再到LargeVis。代码见下…t-SNE实践——sklearn教程t-SNE是一种集降维与可视化于一体的技术它是基于SNE可视化的改进解决了SNE在可视化后样本分布拥挤、边界不明显的特点是目前最好的降维可视化手段。关于t-SNE的历史和原理详见从SNE到t-SNE再到LargeVis。代码见下面例一TSNE的参数函数参数表parameters描述n_components嵌入空间的维度perpexity混乱度表示t-SNE优化过程中考虑邻近点的多少默认为30建议取值在5到50之间early_exaggeration表示嵌入空间簇间距的大小默认为12该值越大可视化后的簇间距越大learning_rate学习率表示梯度下降的快慢默认为200建议取值在10到1000之间n_iter迭代次数默认为1000自定义设置时应保证大于250min_grad_norm如果梯度小于该值则停止优化。默认为1e-7metric表示向量间距离度量的方式默认是欧氏距离。如果是precomputed则输入X是计算好的距离矩阵。也可以是自定义的距离度量函数。init初始化默认为random。取值为random为随机初始化取值为pca为利用PCA进行初始化(常用)取值为numpy数组时必须shape(n_samples, n_components)verbose是否打印优化信息取值0或1默认为0不打印信息。打印的信息为近邻点数量、耗时、σσ、KL散度、误差等random_state随机数种子整数或RandomState对象method两种优化方法barnets_hut和exact。第一种耗时O(NlogN)第二种耗时O(N^2)但是误差小同时第二种方法不能用于百万级样本angle当methodbarnets_hut时该参数有用用于均衡效率与误差默认值为0.5该值越大效率越高误差越大否则反之。当该值在0.2-0.8之间时无变化。返回对象的属性表Atrtributes描述embedding_嵌入后的向量kl_divergence_KL散度n_iter_迭代的轮数t-distributed Stochastic Neighbor Embedding(t-SNE)t-SNE可降样本点间的相似度关系转化为概率在原空间(高维空间)中转化为基于高斯分布的概率在嵌入空间(二维空间)中转化为基于t分布的概率。这使得t-SNE不仅可以关注局部(SNE只关注相邻点之间的相似度映射而忽略了全局之间的相似度映射使得可视化后的边界不明显)还关注全局使可视化效果更好(簇内不会过于集中簇间边界明显)。目标函数原空间与嵌入空间样本分布之间的KL散度。优化算法梯度下降。注意问题KL散度作目标函数是非凸的故可能需要多次初始化以防止陷入局部次优解。t-SNE的缺点计算量大耗时间是PCA的百倍内存占用大。专用于可视化即嵌入空间只能是2维或3维。需要尝试不同的初始化点以防止局部次优解的影响。t-SNE的优化在优化t-SNE方面有很多技巧。下面5个参数会影响t-SNE的可视化效果perplexity 混乱度。混乱度越高t-SNE将考虑越多的邻近点更关注全局。因此对于大数据应该使用较高混乱度较高混乱度也可以帮助t-SNE拜托噪声的影响。相对而言该参数对可视化效果影响不大。early exaggeration factor 该值表示你期望的簇间距大小如果太大的话(大于实际簇的间距)将导致目标函数无法收敛。相对而言该参数对可视化效果影响较小默认就行。learning rate 学习率。关键参数根据具体问题调节。maximum number of iterations 迭代次数。迭代次数不能太低建议1000以上。angle (not used in exact method) 角度。相对而言该参数对效果影响不大。代码例一import numpy as npimport matplotlib.pyplot as pltfrom sklearn import manifold, datasetsdigits datasets.load_digits(n_class6)X, y digits.data, digits.targetn_samples, n_features X.shape显示原始数据n 20 # 每行20个数字每列20个数字img np.zeros((10 * n, 10 * n))for i in range(n):ix 10 * i 1for j in range(n):iy 10 * j 1img[ix:ix 8, iy:iy 8] X[i * n j].reshape((8, 8))plt.figure(figsize(8, 8))plt.imshow(img, cmapplt.cm.binary)plt.xticks([])plt.yticks([])plt.show()t-SNEtsne manifold.TSNE(n_components2, initpca, random_state501)X_tsne tsne.fit_transform(X)print(Org data dimension is {}.Embedded data dimension is {}.format(X.shape[-1], X_tsne.shape[-1]))嵌入空间可视化x_min, x_max X_tsne.min(0), X_tsne.max(0)X_norm (X_tsne - x_min) / (x_max - x_min) # 归一化plt.figure(figsize(8, 8))for i in range(X_norm.shape[0]):plt.text(X_norm[i, 0], X_norm[i, 1], str(y[i]), colorplt.cm.Set1(y[i]),fontdict{weight: bold, size: 9})plt.xticks([])plt.yticks([])plt.show()t-SNE高维数据可视化(python)t-SNE(t-distributedstochastic neighbor embedding )是目前最为流行的一种高维数据降维的算法。在大数据的时代数据不仅越来越大而且也变得越来越复杂数据维度的转化也在惊人的增加例如一组图像的维度就是该图像的像素个数其范围从数千到数百万。对计算机而言处理高维数据绝对没问题但是人类能感知的确只有三个维度因此很有必要将高维数据可视化的展现出来。那么如何将数据集从一个任意维度的降维到二维或三维呢。T-SNE就是一种数据降维的算法其成立的前提是基于这样的假设尽管现实世界中的许多数据集是嵌入在高维空间中但是都具有很低的内在维度。也就是说高维数据经过降维后在低维状态下更能显示出其本质特性。这就是流行学习的基本思想也称为非线性降维。下面就展示一下如何使用t-SNE算法可视化sklearn库中的手写字体数据集。import numpy as npimport sklearnfrom sklearn.manifold import TSNEfrom sklearn.datasets import load_digits# Random state.RS 20150101import matplotlib.pyplot as pltimport matplotlib.patheffects as PathEffectsimport matplotlib# We import seaborn to make nice plots.import seaborn as snssns.set_style(darkgrid)sns.set_palette(muted)sns.set_context(notebook, font_scale1.5,rc{lines.linewidth: 2.5})digits load_digits()# We first reorder the data points according to the handwritten numbers.X np.vstack([digits.data[digits.targeti]for i in range(10)])y np.hstack([digits.target[digits.targeti]for i in range(10)])digits_proj TSNE(random_stateRS).fit_transform(X)def scatter(x, colors):# We choose a color palette with seaborn.palette np.array(sns.color_palette(hls, 10))# We create a scatter plot.f plt.figure(figsize(8, 8))ax plt.subplot(aspectequal)sc ax.scatter(x[:,0], x[:,1], lw0, s40,cpalette[colors.astype(np.int)])plt.xlim(-25, 25)plt.ylim(-25, 25)ax.axis(off)ax.axis(tight)# We add the labels for each digit.txts []for i in range(10):# Position of each label.xtext, ytext np.median(x[colors i, :], axis0)txt ax.text(xtext, ytext, str(i), fontsize24)txt.set_path_effects([PathEffects.Stroke(linewidth5, foregroundw),PathEffects.Normal()])txts.append(txt)return f, ax, sc, txtsscatter(digits_proj, y)plt.savefig(digits_tsne-generated.png, dpi120)plt.show()可视化结果如下
http://www.zqtcl.cn/news/884407/

相关文章:

  • 盐城网站建设方案全景旅游网站项目建设
  • 网站备案完电信园林效果图网站
  • 伤豆丁文库网站开发贵州网站备案局
  • 做网站的注意什么北京建设协会网站首页
  • 石家庄网站开发设计网站建设重点步骤
  • 推广思路及执行方案昆明百度seo
  • 太原公司网站建立可视化小程序开发工具
  • 怎么做网站的搜索引擎云主机有什么用
  • 淘宝客新增网站南宁百度seo优化
  • 建设厅网站合同备案在哪里网站备案本人承诺
  • 做方案的网站住房城乡建设部官网
  • 怎样在门户网站做 推广天水市建设银行官方网站
  • 温州建网站哪家强网站建设谈客户说什么
  • 网站的子域名怎么设置整站seo排名外包
  • 免费网站在哪下载苏州建设银行网站
  • 邹平 建设项目 网站公示怎样做网站卖自己的产品教程
  • 手机免费网站建设哪家公司好免费动态域名申请
  • 提升网站排名怎么提交自己的网站
  • cms网站开发phpwordpress有什么功能
  • 专业网站制作解决方案自己在家搭建服务器
  • 中小企业网站提供了什么英文营销网站建设
  • 玉环市建设工程检测中心网站网站建设服务的具体条件
  • 主机网站wampserver搭建网站
  • 建设银行网站点不进去深圳龙华区招聘网最新招聘信息
  • 网站建设公司现在还挣钱吗wordpress棋牌
  • 网站建设有什么技术自媒体平台哪个好
  • 可以建网站的软件南昌seo代理商
  • 手机网站建设宽度中小型企业网站模板
  • 网站开发需要的所有技术中信建设有限责任公司历任董事长
  • 安徽省建设干部学校网站首页做软件是什么工作