1. 熟练使用scrapy编写爬虫程序,熟悉国外中大型电商网站海量数据爬取,能够充分利用代 理ip资源进行高效爬取 2. 熟练构建分布式爬虫,增量爬虫、多线程爬虫、Linux下的定时启动爬虫 3. 掌握基本的数据结构与算法 4. 熟悉各个网站常见反爬策略,能根据网页分析出常见反爬手段 5. 熟悉从结构化与非结构化网页中提取所需内容 6. 熟悉html/csss/js,能简单使用bootstrap,vue搭建页面,可以通过前端代码分析目标网站 真实request地址和response内容 7. 熟练使用 PyV8,JS2PY 或直接手写 python 代码去解析 JS 代码 8.熟悉nodejs和puppeteer框架开发 8. 熟悉主流的验证码识别技术(tesseract、selenium+pillow、第三方打码平台)
个人介绍
项目经验
使用技术: 1. 使用Scrapy_Redis搭建分布式爬虫框架 2. 使用 Re+XPath+Jsopath提取数据 3. 使用js2py或者pyv8来执行js相关代码,获取数据。 4. js环境比较复杂,无法完全找到js包,那么可以使用selenium配合浏览器,使用driver执行js代码,获取相关数据 5. 使用 Selenium+Headless Chrome无头浏览器爬取页面数据 6. 使用nodejs实现淘宝的自动登录 7. 使用elasticsearch保存数据 便于搜索查询数据 项目一:淘宝系网站相关爬虫 爬取阿里系的各类商家服务网站的数据,需要商家的账号登录。 项目二:淘宝自动登录 使用puppeteer进行自动登录操作,批量登录淘宝商家账号,并获取淘宝商家后台、直通车、钻展、超级推荐等网站的登录信息,为数据爬取提供支持
接单发单客服

添加客服微信,接单发单快人一步!
相关程序员推荐
dqzboy 高级运维工程师 7年经验
我是一名拥有超过7年运维经验的工程师,专注于容器技术、K8s集群管理以及DevOps流程。在互联网企业中,我负责过多个项目的方案规划和搭建维护,具备丰富的技术敏感度和故障排查经验。我熟悉阿里云、腾讯云、AWS等主流云服务平台,并对新兴技术保持浓厚兴趣,成功在多个项目中实现技术落地。
leon 5年经验
本人擅长Python、Golang等后端Wev开发;擅长多种数据库操作;擅长小程序、网络、算法相关的项目开发;并且有一群靠谱且技术过硬的小伙伴;本人崇尚合作精神,是一个遵守规则的人。
接外包 0年经验
本人已经工作五年
1.熟练使用U3d引擎
2.熟练使用c#、xLua、Shader Graph
3.各种插件
4.熟悉数据结构与算法
5.熟练使用设计模式
袁宇 0年经验
接本科水平订单;
可使用C/C++、Python编程,OpenCV图像处理,QT开发上位机,STM32单片机开发;
可使用SolidWorks进行建模,CAD绘制图纸,Protues/Multisim电路仿真;
参加多项工科类竞赛,均为教育部认可A类竞赛;
码农 5年经验
五年后端开发经验,一年前端开发经验,精通php开发语言,精通uniapp,vue2,做过许多类型的项目,分销商城类,erp类,展示类,同城陪玩,企业管理,家教,充电桩,合同签约,借贷,租房,医疗器材等