东莞市微网站官方网站,wordpress全静态化,美工培训班学校,石家庄网站建设模板服务原标题#xff1a;3行Python代码就能获取海量数据#xff1f;一谈起数据分析#xff0c;首先想到的就是数据#xff0c;没有数据#xff0c;谈何分析。毕竟好的菜肴#xff0c;没有好的原材料#xff0c;是很难做的#xff5e;所以本期小F就给大家分享一个获取数据的方…原标题3行Python代码就能获取海量数据一谈起数据分析首先想到的就是数据没有数据谈何分析。毕竟好的菜肴没有好的原材料是很难做的所以本期小F就给大家分享一个获取数据的方法只需三行代码就能搞定。「GoPUP」大佬造的轮子大概有100的免费数据接口。GitHubhttps://github.com/justinzm/gopup使用文档http://doc.gopup.cn/#/README主要有指数数据、宏观经济数据、新经济数据、微博KOL数据、信息数据、生活数据、疫情数据等。# 安装gopuppip install gopup --upgrade安装成功后就能使用了。01 微博指数获取指定关键词的微博指数。# 微博指数importgopup asgpdf_index gp.weibo_index(word 马保国, time_type 1month)print(df_index)time_type1month; 1hour, 1day, 1month, 3month 选其一。三行Python代码实现数据获取。02 百度指数获取指定关键词的百度搜索指数。# 百度指数importgopup asgpcookie 此处输入您在网页端登录百度指数后的 cookie 数据index_df gp.baidu_search_index(word 马保国, start_date 2020-11-15, end_date 2020-11-25, cookiecookie)print(index_df)需要登陆百度指数获取你的Cookie。设置关键词时间起始就能获取到马保国老师的热度数据了。后面还有百度资讯、媒体、需求图谱、人群年龄、性别、兴趣分布数据接口就不一一介绍了。感兴趣的同学可以自行去查看文档。03 头条指数获取指定关键词的头条指数。接口挂了不知为何还有相关性、情感、地域、城市、年龄、性别、用户阅读兴趣分析数据等接口。04 谷歌数据需要通过代理才能使用不过上面这三类已经完全够用了。# 谷歌数据importgopup asgpindex_df gp.google_index(keyword 马保国, start_date 2020-11-15T10, end_date 2020-11-25T23)print(index_df)05 宏观经济数据有一个杠杆率的数据可以使用。# 杠杆数据importgopup asgpdf_index gp.marco_cmlrdprint(df_index)不懂经济学所以不明觉厉。06 新经济数据这个数据倒是蛮有趣的主要是公司数据。比如独角兽和倒闭公司的数据。# 独角兽公司数据importgopup asgpdf_index gp.nicorn_companyprint(df_index)一共是240家独角兽公司。蚂蚁、字节、阿里云、滴滴都是行业中的大佬。# 倒闭公司数据importgopup asgpdf_index gp.death_companyprint(df_index)倒闭的公司一共有6921家。看到不少P2P的公司。剩下还有有一个特许经营许可数据好像是吊牌销售的意思。前段时间看到一篇文章讲的就是南极人吊牌销售的事情南极人都不自己搞生产而是代工。07 KOL数据信息数据主要是微博的KOL所以没啥用。# KOL数据importgopup asgpg gp.pro_api(token ……)df_index g.weibo_user(keyword 雷军)print(df_index)信息数据是新闻联播文字稿。08 中国油价数据包含汽油和柴油的调价信息数据。# 油价数据importgopup asgpdf_index gp.energy_oil_histprint(df_index)时间从2000年直到2020年细数20年油价变化。09 百度迁徙数据可以用来做飞线图或者OD图。单次返回100个城市的数据。10 影视数据实时电影票房数据最近又有病例出现数据应该也比较惨淡。这里需要一个WebDES.js文件才能请求成功。# 实时电影票房数据importgopup asgpdf_index gp.realtime_boxofficeprint(df_index)「如果声音不记得」当日1千万的票房太少了。单日影院数据今年影院能倒闭一大堆。# 单日影院数据importgopup asgpdf_index gp.day_cinema(date 2020-12-08)print(df_index)得到票房前100的数据。最高应该是8万多的收入。实时电视剧播映指数天气冷了选个好剧或者综艺窝在被窝刷起来。# 电视剧数据importgopup asgpdf_index gp.realtime_tvprint(df_index)大秦赋小F也在看感觉还不错。还有实时综艺播映指数、艺人商业价值、流量价值等数据。11 全国高等学校数据普通高等学校名单包含名称、主管部门所在省市、所在地、办学层次等信息。# 普通高等学校数据importgopup asgpdf_index gp.universityprint(df_index)一共是2631所高校。还有成人高等学校以及高等学校详情数据。有网易、丁香园、百度三家的疫情数据。# 世界历史累计确诊数据importgopup asgpcovid_163_df gp.covid_163(indicator 世界历史累计数据)print(covid_163_df)目前累计207个国家有疫情出现。全世界总共就233个国家和地区快接近90%了。由于数据接口太多了小F就不一一介绍了。查看文档 http://doc.gopup.cn/#/data/index_data返回搜狐查看更多责任编辑