ID:22794
黄明 爬虫工程师 14年经验
2025-06-11
个人介绍:网络协议和页面解析:了解HTTP/HTTPS协议和网页HTML结构,能够利用网络请求库发送请求并解析返回的页面内容。 数据抓取与存储:熟练使用Python编程语言,能够编写爬虫代码实现数据的自动抓取,并灵活运用正则表达式或解析库(如Beautiful Soup)提取所需数据。同时,对于大规模数据的处理和存储也具备相关能力。 动态页面处理:熟悉浏览器自动化工具(如Selenium),能够模拟用户行为、加载动态页面、执行JavaScript脚本,实现对JavaScript生成内容的抓取。 反爬技术应对:了解常见的反爬机制,如验证码、IP封禁、限制访问频率等,能够运用代理、用户代理池、随机请求头等技术绕过反爬手段,提高爬取效率和稳定性。 分布式爬虫与调度:具备分布式爬虫框架(如Scrapy)的使用经验,能够设计和搭建分布式爬虫系统,并进行任务调度、数据去重、分布式存储等工作。 数据清洗与预处理:具备数据清洗和预处理的能力,能够针对爬取的数据进行去重、格式转换、缺失值处理等操作,确保数据的准确性和一致性。 爬虫策略优化:能够分析网站结构和爬虫需求,制定合理的爬取策略,包括请求频率控制、代理IP的选择、登录验证处理等,提高爬虫效率和稳定性。
项目经验:爬取网易新闻并保存数据 全权负责可公开数据爬取 会使用js逆向技术 运用fillder软件 运用postman软件 字体解密操作 专业,负责
技      能: 其他  
¥900 / 8小时
立即预约
ID:22329
杨岩 人工智能工程師 15年经验
2025-06-08
个人介绍:作为一名顾问,我拥有广泛的技术能力和专业知识,以满足各种需求。以下是我掌握的一些关键技术: 编程语言:我精通Python、R、VBA、SQL、JavaScript和C++等多种编程语言。这些语言可以用于开发各种应用和解决方案,从数据分析到机器学习和人工智能。 机器学习和数据分析工具:我熟练使用Scikit-Learn、PyTorch、OpenCV、StanfordNLP和LangChain等机器学习工具包。这些工具包提供了丰富的算法和功能,用于数据预处理、特征工程、模型训练和评估等任务。 网页和应用开发:我具备HTML、CSS、MongoDB、AWS、Vue.js、Plotly.Dash、Streamlit和Kivy等Web和应用开发技术。我可以设计和构建交互式的网页应用、数据可视化工具和移动应用程序,以满足客户的需求。 数据分析和自动化:我熟练运用Python、VBA和数据分析工具进行数据处理和分析。我可以设计和构建数据管道,从数据采集到数据分析和报告生成,提高团队的工作效率。 人工智能和深度学习:我在人工智能领域有丰富的经验,包括深度学习、计算机视觉和自然语言处理。我可以应用深度学习算法进行图像识别、目标检测和语言处理等任务。 以上是我所掌握的一些关键技术。作为一名顾问,我将利用这些技术为客户提供专业的咨询和解决方案,帮助他们实现业务目标并取得成功。
项目经验:项目1:基于深度学习的音乐特征分析和排名系统 在某前十科技公司音乐AI团队的工作期间,我参与了一个项目,利用深度学习技术对10,000首歌曲进行音乐特征分析,并对歌手的声音能力进行排名。通过构建深度学习模型,我们能够提取音乐的各种特征,如音调、节奏、情感等,并通过算法对歌手的表现进行评估和排名。该系统为音乐产业提供了一个客观的评估工具,并为音乐制作人和唱片公司提供参考,以优化音乐创作和推广策略。 项目2:智能制造部门的大型语言模型系统 在某财富500强排行榜前十名的公司(FAANG)的人工智能学习工作期间,我负责开发一个类似于ChatGPT和Microsoft Copilot的大型语言模型系统,用于增强该公司部门的效率。我与团队合作,整合智能工具和嵌入式数据库,并实现了一个全栈数据网站,用于实时数据监控和智能工具的无缝集成。此外,我构建了计算机视觉流水线,用于该公司部门产品线的检测和分析,节省了超过10万美元的机器学习供应商费用。我还开发了一套智能工具,包括搜索引擎、数据完整性检查器和电子看板等,与网站和语言模型系统无缝集成。这个项目为该公司部门提供了高效的工具和系统,提升了生产效率和质量控制。 项目3:智能监狱系统的AI应用方案 在某地政府的AI研究工作期间,我提出了一份AI应用方案,用于智能监狱系统的进一步改进。我通过研究和分析智能监狱系统的需求和挑战,提出了一系列的AI应用,预计可以将整个部门的效率提升40%。我的提案被该地政府采纳并正在实施。这个项目展示了我在AI领域的专业知识和解决问题的能力,为该地政府提供了创新的解决方案,以提高监狱系统的效率和安全性。 以上项目展示了我的技术实力和在不同领域的应用能力。通过这些项目,我展示了我的编程、数据分析、深度学习和解决问题的能力,为客户提供创新的解决方案和业务价值。
技      能: 其他  
¥1100 / 8小时
立即预约
ID:22731
华鹏 算法工程师 5年经验
2025-06-05
个人介绍:编程语言:python 深度学习:熟悉分类、检测、分割等领域的主流算法,熟悉pytorch、mxnet训练框架,熟悉算法调研->数据准备->模型训练->模型评估->模型发布->模型部署等完整流程 性能优化:熟悉onnx、tensorrt、triton等推理部署开发工具 常用库:openmmlab、paddledet、opencv等 软技能:具备较强的分析解决实际问题的能力以及良好的沟通、学习和协作能力
项目经验:异源路网结点相似度计算 1. 基于规则的结点相似度计算只考虑与结点直接关联的信息,泛化性较差;基于图神经网络的结点相似度计算只考虑了结构相似性而丢失了空间信息;基于图像分类模型可以综合考虑结点的结构和空间位置信息,此外,鉴于传统CNN模型捕捉全局信息能力较差,而结点相似度计算需要建模长距离的依赖关系,因此选择vit模型,accuracy从90%提高至96.1% 2. 鉴于输入图片的通道为异源路网信息,其各通道重要性并不相同,通过添加通道注意力机制,accuracy从96.1%提高至96.5% 3. 鉴于正负样本分布不均衡的问题,通过动态采样、focal loss等方式将accuracy提高至97%,最终帮助线匹配accuracy从85%提高到91% 车牌识别算法落地 背景:丰富算法组人工智能平台的应用能力 1. 传统车牌识别需要预先将车牌中的字符分割、然后再对分割出的字符进行分类,鲁棒性较差,因此选用LPRNet 2. 鉴于实际场景下的车牌存在多种的形变情况,通过在LPRNet中加入STN模块,accuracy从92%提高到92.7% 3. 鉴于实际场景中多存在双行车牌的情况,通过将LPRNet分层并将上下层拼接以进行最后预测使其自适应单双行车牌识别,accuracy从92.7%提高到93.6% 表格重建算法落地 1. 目前业内表格重建解决方案主要分为1)基于分割网络提取表格线然后构建单元格 2)基于端到端的生成html/xml序列 这两种方案,而html/xml序列方案基于大量的表格数据,且目前主要为英文场景下的数据集,难以迁移到中文场景、中文识别率低,遂采用分割方案(基于unet模型) 2. 鉴于单元格合并频率较高而通过表格线之间的关系生成规则的方法较为复杂难以覆盖所有合并的情况,遂在常见场景下表格线提取准确率为99%的基础上应用轮廓提取方案以获得表格单元格坐标 3. 鉴于单元格内无字区域较多且常有多行文本现象而传统opencv方案鲁棒性较差,遂采用文字检测坐标与单元格坐标匹配方案提高了单元格内容accuracy15% 身份证信息识别算法落地 1. 独立解决图片中身份证位置不固定影响的文字识别准确率不高的问题,通过正倒分类、倾斜矫正等使文字识别accuracy提高5% 2. 参与解决图片质量不佳、模型误差导致的文字识别率下降问题,通过利用监督信息对结果校正,使文字识别accuracy提高4% 3. 参与解决身份证数据被水印污染的问题,通过加入gan网络去水印将文字检测mAP提高了3.7%
技      能: 其他  
¥200 / 8小时
立即预约
ID:22650
雷刚 算法工程师 2年经验
2025-05-28
个人介绍:(1)熟悉常用的LR、FM、GBDT等机器学习算法 (2)熟悉常用的MLP、CNN、RNN、word2vec、doc2vec等深度学习算法 (3)熟练使用tensorflow深度学习平台,有MLP、CNN等深度模型研发、落地实践经验 (4)熟练掌握hadoop、spark等大数据处理工具,处理过亿级别的分布式大数据 (5)精通python、shell等编程语言 (6)熟悉linux开发环境、git代码管理工具
项目经验:项目一:死链研判系统迭代升级 (1)工作内容:使用深度学习算法提升死链系统研判精度 (2)主要职责:基于深度学习算法textCNN训练文本分类模型,配合工程部署上上线 (3)工作成果:死链系统研判精度提升3个百分点,荣获百度2021-Q3死链业务卓越冲锋奖 项目二:推荐系统召回通路研发 (1)工作内容:基于Embedding技术,实现推荐推荐基于内容和基于用户协同过滤的召回服务 (2)工作职责:基于物品的标题、摘要和关键词等文本数据,使用doc2vec训练物品的语义向量;根据用户行为历史,制定用户向量表达公式;使用faiss近邻搜索工具,实现线上内容和用户协同过滤召回服务 (3)工作成果:推荐系统UV点击率绝对提升5个百分点,项目荣获A+等级评分 项目三:学术论文 已发表2篇推荐系统方向国际学术论文 项目四:专利 已公开发表1项推荐系统方向专利
技      能: 其他  
¥300 / 8小时
立即预约
ID:22561
白飞 架构师 15年经验
2025-05-25
个人介绍:※有较强的研究分析、总结能力;较强的文章撰写能力;并且对新技术兴趣浓烈,善于处理解决问题,成熟稳重,责任感强。 ※具有扎实的Java基础以及面向对象编程思想,熟悉常用的设计模式、Linux常用命令以及服务配置,熟练使用Shell脚本,熟练※使用Maven、Svn,Git等版本管理工具 ※语言:java,.net,python,golang ※技术:spring boot,spring cloud 基于spring cloud 开发的微服务平台,其他略 ※容器:docker,docker swarm,k8s,gitlab CICD,容器化部署,容器编排承载100+微服务全生产环境持续集成搭建、管※理、运维、监控日志分析等。具有容器开发,中间件开发经验。 ※中间件:MQ,redis,zk,es,solr等,在业务上广泛应用。 ※数据库: sql server,mysql,oracle ※存储:glasterfs,NFS,fastdfs ※互联网技术:100万并发,互联网架构等 ※开发过的项目:新媒体平台,宣传指挥调度,采编联动平台,爬虫系统,SOA平台,微服务项目,SSO,智能机器人项目等 ※熟练使用常用服务器Tomcat、jetty、Apache、Nginx并能进行调优配置、搭建正向代理、反射代理、动静分离、负载均衡策略 ※熟悉应用压力测试、安全测试、渗透测试、回归测试等测试场景以及等保、分保相关标准并根据要求改造应用 ※具备较好的团队领导能力,有良好的沟通与团队合作技巧,能适应较大的工作压力,有较强的分析解决问题的能力,熟练使用visio、project、xmind等工具 ※熟悉Html、CSS、Javascript、Jquery、JqueryUI、EasyUI、Bootstrap,vue.js等前端技能.
项目经验:项目描述: “绿色国网”将作为国家电网公司综合能源服务主入口,对接省级智慧能源服务平台,集成智慧车联网、国网商城、分布式光伏云网、供应链金融服务系统等平台的相关应用和数据,围绕产品服务、交易撮合、信息资讯、创新孵化、产业联盟、服务云市场等服务,为综合能源服务相关主体引流赋能,为用户提供全方位的能源服务,同时对产业链上下游各方面资源进行有效汇聚,促进全社会清洁能源消纳,支撑综合能源生态圈建设。 个人职责: 担任项目架构师,负责需求文档、概要设计、技术方案、集成方案的设计和编写;负责项目架构设计规划、负责指导技术方案落地、负责大数据业务开发设计… 同类项目: 网上国网
技      能: 其他  
¥900 / 8小时
立即预约
立即预约
意见反馈