当前位置: 首页 > news >正文

企业网站建设要怎么做淘宝联盟网站推广

企业网站建设要,怎么做淘宝联盟网站推广,怎样做网站表白墙,开发公司绩效考核评分细则独热编码的两种实现形式#xff1a; ​ OneHotEncoder和DictVectorizer是两种常用的特征向量化方法#xff0c;用于将分类特征转换为数值特征。但还是有一定的区别不管是再输入格式还是在输出类型上都有一些不同。 区别#xff1a; 输入格式要求#xff1a; OneHotEncod…独热编码的两种实现形式 ​ OneHotEncoder和DictVectorizer是两种常用的特征向量化方法用于将分类特征转换为数值特征。但还是有一定的区别不管是再输入格式还是在输出类型上都有一些不同。 区别 输入格式要求 OneHotEncoder接受二维数组或稀疏矩阵作为输入。需要先对分类特征进行编码为整数标签然后再使用OneHotEncoder进行转换。DictVectorizer接受字典列表或Pandas DataFrame作为输入。每个字典表示一个样本键表示特征名称值表示特征值。 输出类型 OneHotEncoder输出稀疏矩阵。对于大规模数据集和高维度特征可以节省内存空间。DictVectorizer输出稠密矩阵。对于小规模数据集和低维度特征输出的是一个数组。 处理缺失值 OneHotEncoder不直接处理缺失值需要在进行编码之前对缺失值进行处理。DictVectorizer可以通过设置sparseFalse参数将缺失值编码为0或使用其他指定的值。 特征名称的处理 OneHotEncoder不保留特征名称只生成数值编码后的特征。DictVectorizer保留特征名称可以通过get_feature_names()方法获取特征名称。 基础铺垫 ​ X.to_dict()这将返回一个字典其中键是特征列的名称值是特征列对应的 Series 对象。 import pandas as pddata {age: [young, young, young, young, young],prescript: [myope, myope, myope, myope, hyper],astigmatic: [no, no, yes, yes, no],tearRate: [reduced, normal, reduced, normal, reduced] } df pd.DataFrame(data) print(df) print(df.to_dict())# 字典套字典 print(-----------------) print(df.to_dict(orientrecords)) # 列表套字典X.to_dict(): {A: {0: 1, 1: 2, 2: 3},B: {0: 4, 1: 5, 2: 6}}X.to_dict(orientrecords): [{A: 1, B: 4},{A: 2, B: 5},{A: 3, B: 6}]​ X.values.tolist()这将返回特征矩阵 X 的值作为一个二维列表。每一行代表一个样本每一列代表一个特征。这种方法将DataFrame转换为一个二维列表可以方便地在某些情况下使用例如一些需要输入列表形式的机器学习算法。 import pandas as pddata {age: [young, young, young, young, young],prescript: [myope, myope, myope, myope, hyper],astigmatic: [no, no, yes, yes, no],tearRate: [reduced, normal, reduced, normal, reduced] }df pd.DataFrame(data) print(df) print(df.values.tolist())独热编码实现 方法一 from sklearn.feature_extraction import DictVectorizer from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score import pandas as pd from sklearn.tree import DecisionTreeClassifier data {age: [young, young, young, young, young],prescript: [myope, myope, myope, myope, hyper],astigmatic: [no, no, yes, yes, no],tearRate: [reduced, normal, reduced, normal, reduced] }df pd.DataFrame(data) print(df) vectorizer DictVectorizer(sparseFalse) # 注意需要将dataframe类型转化为键值对的形式 X_encoded vectorizer.fit_transform(df.to_dict(orientrecords)) print(X_encoded,type(X_encoded))方法二 import pandas as pd from sklearn.feature_extraction import DictVectorizer from sklearn.model_selection import train_test_split from sklearn.preprocessing import OneHotEncoder from sklearn.tree import DecisionTreeClassifier data {age: [young, young, young, young, young],prescript: [myope, myope, myope, myope, hyper],astigmatic: [no, no, yes, yes, no],tearRate: [reduced, normal, reduced, normal, reduced] }df pd.DataFrame(data) print(df)X_listdf.values.tolist() enc OneHotEncoder() # enc.fit_transform(X_list) 结果是csr_matrix稀疏矩阵类型 X_encodedenc.fit_transform(X_list).toarray() print(X_encoded,type(X_encoded))总结 ​ 总的来说OneHotEncoder适用于处理整数标签编码的分类特征输出稀疏矩阵不处理缺失值并且需要显式拟合和转换数据。DictVectorizer适用于处理字典格式或DataFrame格式的分类特征输出稠密矩阵可以处理缺失值并且不需要显式拟合。选择哪种方法取决于数据的特点和使用的上下文。
http://www.zqtcl.cn/news/490996/

相关文章:

  • 做网站 分辨率应该是多少做阿里巴巴网站要多少钱
  • 有专业做外贸的网站吗千岛湖网站建设
  • 百度怎么做开锁网站中国咖啡网站建设方案
  • 新网站不被收录郑州网站建设培训学校
  • 网站群建设意见征集北京做网站报价
  • 网站建设开发费会计处理山东省住房和城乡建设厅二建查询
  • 市工商局网站建设情况襄阳网站seo诊断
  • 动漫做那个视频网站单网页网站如何做
  • 企业网站名是什么意思广州公共交易中心
  • 做网站那家好沈阳做网站公司哪家好
  • 现在做一个网站大概多少钱中国住房城乡建设部网站
  • 高端企业网站建设核心秦皇岛网站制作人才招聘
  • 网站制作花多少钱简历模板表格
  • 泰安专业网站开发公司网页设计师常逛网站
  • 百度收录万网空间的网站需要多久推广seo网站
  • 个体工商户可以做网站备案吗微信app下载安装官方版2023
  • 内贸在什么网站做做网站需要提供哪些信息
  • 物流网站怎么做推广网页程序开发语言
  • 静态网站跟动态网站开发的层次
  • 公司购买网站怎么做分录被k掉的网站怎么做才能有收录
  • 网页制作相关网站网络卖货平台有哪些
  • 国内网站都要备案吗快速做网站的软件
  • 遂宁市住房和城乡建设局网站自己的网站怎么做美工
  • 资阳网站建设公司中国菲律宾概念股
  • 网站优化报价wordpress 获取别名
  • 自适应网站如何做mip微信网站公司
  • 网站建设改版升级wordpress 艺术家
  • 百度怎么网站排名python做网站的开发
  • 淘宝 网站建设教程视频北京华夏建设有限公司网站
  • 网站公司的利润中国域名后缀