ID:22750
司浩   爬虫工程师  
公司信息:
工作经验: 15年
薪资价格:200/天
所在区域: 北京
浏览次数:243次
登录次数:94次
最近登录:2025-05-13
认证情况:
掌握技能: 其他  
立即预约
立即收藏
沟通需求
程序员接单发单

微信扫码,联系客服沟通需求

个人介绍
1. 熟练使用 Python 语言和常见的第三方库;有良好的代码风格及编程能力
2. 熟悉使用正则表达式、Xpath 和 BeautifulSoup 等相关网页提取技术
3. 熟悉 Scrapy 框架的使用,同时有过 Scrapy-redis 分布式爬虫经验
4. 熟悉 Fiddler、AirtextIDE 等 app 爬虫工具
5. 熟悉 MySQL、redis 等数据库
6. .熟悉常见的反爬机制,如验证码识别、IP 封禁、UA 监测和 cookie 认证等;了解加密数据的处理
7. 了解 web 框架 Django 和 Flask
8. 了解多进程多线程和协程的相关使用
9. 了解代码管理工具 git
10. 了解多进程多线程和协程的相关使用
11. 了解前端 HTML,CSS,JS,AJAX 等相关前端知识
12. 了解 Linux 操作系统,熟悉其基本操作
13. 了解数据清洗,能够使用 NumPy、Pandas 等工具进行数据处理
项目经验
航空机票信息查询
项目描述:
应客户需求,对某国外航空公司网站进行机票信息爬取,然后把数据交给用户,供用户平台使用。
责任描述:
使用 Scrapy 框架,主要进行页面分析、 数据采集、数据清洗、数据保存等处理
1. 登录验证码的处理-该网站验证码比较简单,采用 Scrapy 自带的验证码处理模块
2. 由于只能使用国外 IP,使用代理 IP,并添加 user-agent 和延时规避反爬
3. 使用 Xpath、正则和 lxml 的 etree 模块进行页面解析与数据提取
4. 使用 Mongodb 数据库保存爬取数据
发布需求
点击发布需求,客服审核通过后会展示订单,程序员会在任务下报名,招聘专员也会在1小时内与您联系,帮助您精准找到符合要求的程序员!
接单发单客服
程序员接单客服微信
添加客服微信,接单发单快人一步!
相关程序员推荐
袁宇 0年经验
接本科水平订单; 可使用C/C++、Python编程,OpenCV图像处理,QT开发上位机,STM32单片机开发; 可使用SolidWorks进行建模,CAD绘制图纸,Protues/Multisim电路仿真; 参加多项工科类竞赛,均为教育部认可A类竞赛;
王于辰 全栈开发工程师 3年经验
擅长写vue springboot 项目以及微信小程序 uniapp
码农 5年经验
五年后端开发经验,一年前端开发经验,精通php开发语言,精通uniapp,vue2,做过许多类型的项目,分销商城类,erp类,展示类,同城陪玩,企业管理,家教,充电桩,合同签约,借贷,租房,医疗器材等
接外包 0年经验
本人已经工作五年 1.熟练使用U3d引擎 2.熟练使用c#、xLua、Shader Graph 3.各种插件 4.熟悉数据结构与算法 5.熟练使用设计模式
杭州紫冰科技有限公司 AI、前后端开发 4年经验
我们是一支来自阿里、美团由软件高级工程师、算法工程师组成的高端软件研发团队。团队小而精,自2022年成立以来,为客户提供十几个软件解决方案。设计领域为门户网站、CRM系统、智能化系统、AI大模型、计算机视觉领域。已经有大量的项目开发经验。
立即预约
意见反馈