盐城做网站优化,合肥网页设计培训学校,山东百度推广代理,苏州建站公司 诚找苏州聚尚网络在机器学习算法中#xff0c;常会遇到分类特征是离散的#xff0c;无序的。例如#xff1a;性别有男、女#xff0c;城市有北京#xff0c;上海#xff0c;深圳等。性别特征#xff1a;[男#xff0c;女] 0#xff0c;1地区特征#xf…在机器学习算法中常会遇到分类特征是离散的无序的。例如性别有男、女城市有北京上海深圳等。性别特征[男女] 01地区特征[北京上海深圳] 012工作特征[演员厨师公务员工程师律师] 01234比如样本(女北京工程师)(103)但是这样的特征处理并不能直接放入机器学习算法中因为分类器通常数据是连续且有序。解决这类问题一种解决方法是采用独热编码(One-Hot Encoding)。什么是独热编码独热编码(One-Hot Encoding)又称一位有效编码其方法是使用N位状态寄存器来对N个状态进行编码每个状态都有它独立的寄存器位并且在任意时候其中只有一位有效。即只有一位是1其余都是零值。例如对六个状态进行编码自然顺序码为 000,001,010,011,100,101独热编码则是 000001,000010,000100,001000,010000,100000回到一开始的例子性别特征[男,女]按照N位状态寄存器来对N个状态进行编码的原理性别特征[男女](这里N2)男 10女 01地区特征[北京上海深圳](这里N3)北京 100上海 010深圳 001工作特征[演员厨师公务员工程师律师](这里N5)演员 10000厨师 01000公务员 00100工程师 00010律师 00001所以样本的特征是[女,北京,工程师]的时候独热编码(One-Hot Encoding)的结果为[0110000010]