一、批量处理数据
1.读取文件,如下所示(参数:low_memory指确保数据类型不混淆;converters这里是将work_demand的数据类型转换为str类型)
2.删除工作岗位中包含实习生的行数据,删除工作岗位为空的数据并更新
3.提取薪资单位统一为K,只得到数字
最终job_salary列的数据均为float型的平均值数字
二、数据可视化
1.展示Java各项技能占比
(1)先取出Java工作岗位的技能要求
(2)再按逗号为分割,取出排名前六的数据,形成以字典为元素的列表
(3)再将元素为字典的列表拆分,得到符合前端传值要求的类型
2.取出java在各地区的薪资图,一定将地区与工作类型java类分组
3.取出不同学历下的薪资值
4.采用render方法将上述结果传递到前端页面的Javascript中,采用生成Javascript对象的方式渲染到浏览器上。最后采用echarts将数据可视化出来。详细代码见第一章。
参考链接
groupby函数详解:https://www.cnblogs.com/Yanjy-OnlyOne/p/11217802.html
https://blog.csdn.net/weixin_42782150/article/details/90716533
python拉勾网职位分析:https://nbviewer.jupyter.org/github/China-LuoYaxiong/ipynb/blob/master/%E6%8B%89%E5%8B%BE%E7%BD%91%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E8%81%8C%E4%BD%8D%E5%88%86%E6%9E%90.ipynb#%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E6%8A%80%E8%83%BD%E8%AF%8D%E4%BA%91%E5%9B%BE
python中map函数和lambda函数:https://blog.csdn.net/weixin_43283397/article/details/95627104