职场薪资一直是求职者最关心的话题之一。脉脉作为中国最大的职场社交平台,汇聚了大量真实的薪资爆料和公司评价数据。本文将带你用 Python 爬取脉脉薪资数据,完成从数据采集、清洗到行业洞察分析的全流程实战。
一、项目概述
1.1 目标
- 爬取脉脉平台的薪资爆料数据,覆盖互联网、金融、制造业等多个行业
- 提取职位名称、公司、薪资范围、工作年限、学历要求等关键字段
- 构建本地 SQLite 数据库实现增量存储
- 利用 pyecharts 完成薪资分布、行业对比等多维可视化
1.2 技术栈
| 模块 | 用途 |
|---|---|
| DrissionPage | 浏览器自动化 + XHR 拦截</ |