用wordpress建站域名和空间哪里买比较好,电话销售做网站认证,代做设计的网站,外贸流程的基本流程前言#xff1a;随着互联网行业的日益兴盛#xff0c;吸引力越来越多的牛人加入其中#xff0c;也有许多小伙伴跃跃欲试#xff0c;想要在互联网的浪潮中大展身手。今天我们通过看准网的数据#xff0c;帮助大家对各大互联网公司有一个比较概括的了解。01.数据来源看准网提… 前言随着互联网行业的日益兴盛吸引力越来越多的牛人加入其中也有许多小伙伴跃跃欲试想要在互联网的浪潮中大展身手。今天我们通过看准网的数据帮助大家对各大互联网公司有一个比较概括的了解。01.数据来源看准网提供了许多员工对于公司的评价我们从中提取需要的数据包括整体评分、面试难度、推荐率、前景看好情况、CEO支持率代码如下## 获得信息 def get_company_info(num,headers): ## 获得评价数据 url https://www.kanzhun.com/gsrstr(num).html?kacom-blocker1-review jswindow.open(url) driver.execute_script(js) time.sleep(5) driver.close() driver.switch_to_window(driver.window_handles[0]) bsObjBeautifulSoup(driver.page_source,html.parser) tagbsObj.find(div,attrs{class:all_item}).text.replace( ,).replace(
,).replace((, ).replace(), ).split( ) tagtag[0:len(tag)-1] this_tag {tag[i*2]:tag[i*21] for i in np.arange(int(len(tag)/2-1))} this_name bsObj.find(div,attrs{class:co_name t_center}).text this_overal float(bsObj.find(div,attrs{class:res_box_star f_right}).find(em).text) points bsObj.find(ul,attrs{class:score_rate clearfix}).text.replace(
, ).split() this_recommend float(points[0][0:2])/100*5 this_future float(points[2][0:2])/100*5 this_ceo float(points[4][0:2])/100*5 ## 获得CEO头像和公司logo ceo_pic bsObj.find(div,attrs{class:ceo_info}).find(div).find(img).attrs[src] ceo_name bsObj.find(div,attrs{class:ceo_info}).find(p).text head_logo bsObj.find(div,attrs{class:com_logo f_left}).find(img).attrs[src] head_loc D:/爬虫/看准/公司logo/this_name.jpg ceo_loc D:/爬虫/看准/CEOlogo/this_name.jpg request.urlretrieve(head_logo,head_loc) request.urlretrieve(ceo_pic,ceo_loc) ## 获得面试难度 url https://www.kanzhun.com/gsmstr(num).html?kacom-floater-interview jswindow.open(url) driver.execute_script(js) time.sleep(5) driver.close() driver.switch_to_window(driver.window_handles[0]) bsObjBeautifulSoup(driver.page_source,html.parser) reqrequest.Request(url,headersheaders) htmlurlopen(req) bsObjBeautifulSoup(html.read(),html.parser) this_difficulty float(bsObj.find(section,attrs{class:interview_feel}).find(em).text) this_feeling bsObj.find(ul,attrs{class:score_list}).find_all(span,attrs{class:percent}) this_feeling [float(k.text.replace(%,)) for k in this_feeling] this_feeling (this_feeling[0]*5this_feeling[1]*3this_feeling[2]*1)/100 ## 整合数据成为字典 this_company {name:this_name,overal:this_overal,comments:tag[1],recommend:this_recommend, future:this_future,ceo:this_ceo,difficulty:this_difficulty,feeling:this_feeling} return this_company,this_tag,this_name02.整体对比我们最终选取了50家互联网公司作为样本进行对比选取来源主要是结合2018年互联网公司百强榜单和看准网上的实际评价数量选取的公司logo拼图如下我们会在第4部分讲解如何将图片进行拼接首先对比各项评价指标的TOP15可以看到榜单中BAT在各项排名中都处于十分靠前的位置网易也占据了多个榜单的靠前位置腾讯霸占了所有排名的TOP1。下面我们再来看一下面试难度我们选取了面试难度评分的TOP15和BOTTOM15该数据仅供参考根据小编的经验同一个公司的不同部门不同岗位之间的难度差异也非常大。在面试难度偏低的一些公司中有许多非常不错的公司该数据仅仅是一个参考真正的面试还是要取决于求职者的实际能力所谓会者不难难者不会。真正的大牛无论是面对多么困难的面试依然可以slay全场。## 整体评分top15柱形图companypd.read_excel(company_info.xlsx)company_overal company.sort_values(overal,ascendingFalse)[0:15]attr company_overal[name]v1round(company_overal[overal],2)bar Bar(整体评分TOP15,title_poscenter)bar.use_theme(essos)bar.add(, attr, v1, is_stackFalse,xaxis_rotate30,yaxis_min3.7,is_label_showTrue, xaxis_interval 0,is_splitline_showFalse)bar.render(整体评分TOP15.html)03.雷达图前面我们看的都是各个公司之间的对比下面我们看一下同一个公司不同维度的情况我们选取了BAT和TMD作为数据其他的公司也可以按照同样的方式进行对比首先看一下BATBAT真的是名副其实的业界标杆各项指标都slay整个行业下面我们看一下此前发展势头迅猛的TMD三家公司TMD三家公司和行业整体水平相比也是出于领先地位可见其还不错的发展势头最后放上和小编息息相关的三家公司具体是哪三家相信了解小编的朋友一定是可以猜出来的value_avg [list(company.iloc[:,[1,3,4,5,6]].mean())]value_company0 [list(company.iloc[0,[1,3,4,5,6]])]value_company1 [list(company.iloc[1,[1,3,4,5,6]])]value_company2 [list(company.iloc[2,[1,3,4,5,6]])]c_schema [{name: 总体评价, max: 4.4, min: 3.2}, {name: 推荐度, max: 4.75, min: 2.4}, {name: 前景看好, max: 4.25, min: 1}, {name: CEO/董事长认可度, max: 4.8,min:3}, {name: 面试难度, max: 3.4,min:2.3}]radar Radar()radar.use_theme(essos)radar.config(c_schemac_schema, shapecircle)radar.add(company[name][0], value_company0, item_colorblue, symbolNone,linewidht5)radar.add(company[name][1], value_company1, item_colororange, symbolNone,linewidht5)radar.add(company[name][2], value_company2, item_colorred, symbolNone,linewidht5)radar.add(整体水平, value_avg, item_colorpurple, symbolNone,linewidth5, legend_selectedmodemultiple)radar.render(bat.html)04.图片拼接看准网提供了各个公司的logo和各位公司大佬的头像我们冒昧地利用这些数据进行简单的图片拼接制作成一副大的合成图。主要原理是利用numpy中的多维数组进行拼接由于图像本身就可以看做是一个三维数组彩色或者一位数组黑白所以我们只需利用数组的拼接方法就可以达到我们的目的。代码如下## 拼接公司logo成为5*10的拼图i 0 for filename in os.listdir(./公司logo): file_loc D:/爬虫/看准/公司logo/filename img mpimg.imread(file_loc)[:,:,0:3] img cv2.resize(img, (180,180),interpolationcv2.INTER_AREA) if i % 10 0: row_imgimg elif i 9: row_imgnp.hstack((row_img,img)) all_img row_img elif i % 10 9: row_imgnp.hstack((row_img,img)) all_img np.vstack((all_img,row_img)) else: row_imgnp.hstack((row_img,img)) i i1plt.imshow(all_img) plt.axis(off) ## 拼接大佬头像成为7*7的拼图i 0 for filename in os.listdir(./CEOlogo): file_loc D:/爬虫/看准/CEOlogo/filename img mpimg.imread(file_loc)[:,:,0:3] img cv2.resize(img, (500,500),interpolationcv2.INTER_CUBIC) if i % 7 0: row_imgimg elif i 6: row_imgnp.hstack((row_img,img)) all_img row_img elif i % 7 6: row_imgnp.hstack((row_img,img)) all_img np.vstack((all_img,row_img)) else: row_imgnp.hstack((row_img,img)) i i1plt.imshow(all_img) plt.axis(off)下面就是我们的效果图不知道大家是否能一眼就把所有的logo都认全最后是各位大佬的拼图不知道大家第一眼看到的是哪位大佬第一眼看到的大佬或许就是你未来的老板作者介绍徐麟目前就职于上海唯品会产品技术中心哥大统计数据狗从事数据挖掘分析工作喜欢用RPython玩一些不一样的数据文章来源数据森麟ID:shujusenlin完1.微信群添加小编微信tangguoyemeng备注“进群姓名公司职位”即可加入【云计算学习交流群】和志同道合的朋友们共同打卡学习2.征稿投稿邮箱lijycsdn.net微信号tangguoyemeng。请备注投稿姓名公司职位。推荐阅读为什么阿里飞猪、滴滴、携程都被质疑滥用大数据杀熟云漫圈 | 计数排序你真的了解么我们研究了1.5万场活动换个大城市生活可能对你有用大数据揭秘: 原来单身女生有这些特点...放弃培训班自学编程9 个月后我成为年薪 6 位数的软件工程师82岁的北大教授证明了黎曼猜想继承变量覆盖及构造函数失配竟然会导致这些漏洞35岁IT老兵转型AI我做错了吗↓↓↓ 点击【阅读原文】查看「CSDN云计算」往期精彩内容