求职意向
实习经历
移动抓取与收录研发工程师
百度在线网络技术(北京)有限公司
工作内容:
- 参与团队海量数据分布式爬虫采集系统的建设,攻克高性能、高并发、高可用性等技术挑战
- 完成高质量的开发、自测及项目文档编写,攻克特定场景下的抓取难题
工作业绩:
- 构建数据质量监控与反馈系统,数据解析准确率从 88% 提升至 97%
- 完成 HTTP 爬虫向 Headless Chrome 渲染爬虫架构演进,移动端页面抓取数量提升 40%
- Vue.js、React 等动态内容网站覆盖率从 60% 提升至 95%
爬虫实习生
北京国信创新科技股份有限公司
工作内容:
- 熟悉 Python 语法及 HTML、CSS、JS,编写网络爬虫代码,研究网页接口规律
- 利用 PySpider、Selenium、Requests 等框架进行数据抓取和打包处理
- 对缺失数据的网站进行栏目和 URL 的添加并运行
工作业绩:
- 数据获取效率提升超过 50%
- 使用代理 IP 池规避反爬虫机制,保障数据稳定性
- 应用爬虫技术到 API 接口调用和社交媒体内容抓取等多个领域
- 采用并发请求和异步执行技术,提升爬虫性能
- 结合机器学习实现智能爬取策略,提高数据抓取精准度
数据解析实习生
北京百炼智能科技有限公司
工作内容:
- 熟悉 MySQL、ES 数据库、Pandas 解析库,对数据进行解析和封装
- 数据源排查和添加,解析数据波动原因,每周向管理层汇报趋势与异常
- 使用 SQL、ES 查询和 Python 脚本进行 EDA,输出为 Excel
工作业绩:
- 优化 SQL 查询逻辑,运行时间从 30 分钟缩短至 5 分钟
- 解析 3000+ 条会话日志,发现支付页按钮点击率异常,推动 UI 优化 → 支付转化率提升 15%
- 搭建自动化数据监控脚本,错误排查效率提升 60%,减少运营团队 20% 人工巡检量
- SQL 和 Python 配合使存储数据准确率达到 98%
项目经历
电影市场票房情况分析与可视化系统
2024.1 - 2024.7通过艺恩娱数 API 获取中国大陆电影票房排行榜数据,使用 Pandas 进行数据处理,Matplotlib 绘制饼图和折线图展示年度占比和趋势。
自动获取小说工具
个人项目基于 Python 的数据抓取脚本,通过小说网站 API 和 XPath 获取小说数据,利用 While 循环实现并打包成 TXT 文件。
基于 SpringBoot 的个人健康监测平台
毕业设计采用 Java 技术建设个人健康信息管理系统,基于 B/S 架构和 MVC 三层设计模式,实现人性化、高效率、便捷的健康管理平台。
教育背景
燕京理工学院
软件工程专业 · 全日制本科
2021.9 - 2025.7
主修课程:数据结构、Java、Python、数据库原理、软件测试技术、Web 企业级开发、Linux 系统、计算机组成原理
在校荣誉:担任红衫志愿者协会实践部部长,获优秀志愿者荣誉证书、高级软件工程师证书、Web 安全渗透测试证书、鸿蒙 OpenHarmony 人才认证
技能专长
requests、urllib、pyspider、BeautifulSoup、正则表达式、Selenium、Scrapy
Pandas、MySQL、MongoDB、ES、数据清洗、数据转换、CSV/Excel 处理
Java 基础、Maven、SpringBoot、MVC 架构、MyBatis
HTML、CSS、JavaScript、Vue.js、学成在线网页项目
Git、IDEA、Linux、Office、Photoshop、短视频剪辑
个人优势
曾参加 Python 开发培训,精通 Python 及前端框架,深入理解 HTTP 协议
熟练处理 Cookies、Headers,精通 requests、urllib、pyspider 等库
掌握 Selenium、PhantomJS 处理 JavaScript 渲染的动态页面
熟悉数据存储到 MySQL、MongoDB,擅长数据清洗和转换
具备 Java 基础调试能力,熟悉 Maven 环境搭建和 SpringBoot 项目
爱好短视频剪辑、PS,对电子产品(特别是手机硬件)了解通透
自我评价
软件工程专业本科应届生,拥有 1年 Python 实习经验(爬虫、数据解析),曾在 百度 任职实习生。扎实的 Python 编程基础,熟悉数据结构与算法。
在校期间开发了校园二手交易平台,负责后端 API 设计和数据库交互模块,应用 Pandas 进行数据分析。积极学习 Flask、NumPy、Git 等工具,对 Web 开发和数据分析方向充满热情。
获得过 校级 Python 编程竞赛奖项。学习能力强,渴望在实战中快速提升 Python 工程化能力。