ID:22588
路平 数据分析师 4年经验
2025-04-08
个人介绍: 熟练应用 Python 及其相关库(如 Pandas、Numpy、Matplotlib 等)。  熟悉数据分析全流程,熟练掌握各种数据分析常见工具。  熟练 Excel 函数应用(如:vlookup、sumif、countif 等)、Mysql 数据库语句、PowerBI 等工具进行数据分析及 可视化操作。  具备一定的数据挖掘能力,能够使用 SKlearn 等常见科学计算库进行分类、回归、聚类、降维、词向量分析等创 建数据模型,完成对数据的分析及预测。
项目经验:信用卡交易欺诈风险预测 项目背景:为了预测持卡人是否会发生信用卡被盗刷,通过利用信用卡的历史交易数据,进行机器学习,构建信用卡 反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 工具:Python(Pandas、Numpy、Matplotlib、逻辑回归、随机森林、XGboost 模型、Bagging 算法)。 主要职责:  数据提取与清洗:获取用户信息数据,对数据基本情况、统计值等进行查看。  特征工程:(1)对这两列特征进行标准化处理;(2)查看特征值与因变量标签之间的关系以及对数据进行共线 性筛查;(3)对数据分类标签查看被盗刷与未被盗刷比例失衡情况,被盗刷占所有交易的 0.172%,因此采用 随机过采样方法平衡数据集。  模型和调优:选取逻辑回归、随机森林、XGboost 和 Bagging 算法进行交叉验证训练,对比模型效果,并使 用网络搜索找到相应的最优超参数。  模型迭代和评估:(1)将各模型对应的最优超参数带入对应模型中,并计算出准确率、精确率、召回率、 F1_score 和 AUC 曲线面积;(2)选出 AUC 面积值最大的两个模型(逻辑回归和 XGboost)再进行 VotingClassifier 集成学习。 项目成果:  该集成学习模型最终预测准确率、精确率、召回率都达到 90%以上,基于此模型对信用卡交易数据进行预 测能找出更多的信用卡被盗刷的持卡人,有助于平台对危险用户进行识别和处理,降低风险。
技      能: 其他  
¥1500 / 8小时
立即预约
ID:22511
宋冬梅 数据开发工程师 11年经验
2025-04-08
个人介绍:1. 对接运营/产品的需求,快速理解需求,利用SQL进行数据开发,产出报表。 2. 熟练掌握大数据技术的应用,DataX,spark,hive,flink,kafka等。 3. 掌握数据仓库建模和分层,能搭建高质量数据模型。 4. Python处理数据,包含json,excel等。 5. 有一定的SpringBoot开发能力,有UDF函数开发经验。
项目经验:项目描述: (携程大住宿数据分析平台) 数据源为携程海内外各渠道母子酒店的订单信息,对数据进行清洗入仓 之后, 追踪酒店间夜数计算业务指标,并进行可视化报表展示。 项目职责:  数据研发: 计算携程酒店业务指标, 开发极速查询 BI 报表。  基于 Spark(Java)实现随机抽取算法计算指标,并设计 DQC 任务监控数据浮动, 保证数据质量。  基于 Spark Streaming + Redis 生成实时动态黑名单, 并从 Redis 中获取黑名单过滤数据。  将数据写入 StarRocks,根据需求设计 StarRocks 模型,并创建物化视图,索引优化来加快查询。  建立抽象数据模型,并设置人酒权限, 开发 ArtNova BI 报表。  任务优化: 优化批处理和报表任务,保证集群稳定。  对 Spark 进行内存调优(JVM) , 优化占用集群资源多和执行速度慢的 Spark 任务。  对 StarRocks 和 Hive 数据集进行分布式 SQL 调优,加快报表查询速度。 涉及技术: Spark, StarRocks, Hive, Presto, Datax, Redis 项目描述: 为了区分不同的本体关系在计算相似度时的特征,进行相关性分析。为了对海量文本进行自动分 类,结合大数据引擎设计了相似度并行算法,提高计算效率并具有很强扩展性。 项目职责:  相似度算法 (DIF): 基于相关性分析不同语义链接, 设计特征相似度计算方法, 结果准确度达到 94% 。  文本并行算法: 基于 MapReduce 引擎, 设计文本相似度并行算法。  结合 DIF 预先计算本体所有特征间的相似度。  将点对点相似度转化成特征对文本相似度,然后聚合得到文本间相似度,结果计算效率提升 70 倍。 涉及技术: Hive, Hadoop, Sklearn, Spss
技      能: 其他  
¥800 / 8小时
立即预约
ID:22403
黄秀兰 软件开发 6年经验
2025-04-08
个人介绍:精通C语言编程技术,MFC语言以及MATLAB;可熟练运用C语言中的串口、线程、线程锁、动态释放分配内存、缓冲区、文件等操作,能够掌握基本的算法,例如队列、二叉树等;对于MFC能够熟练运用其中的CDC绘图在UI设计上,并且能够掌握其中的各种控件的操作;对于MALAB,可熟练编写各种测试代码,熟练掌握文件操作、图像分析等;并且还能够能够熟练运用Qt编程语言、同样也能够熟练运用Qt中的串口、界面绘图等操作;熟悉了解Javascript语言、python、SDK以及Verilog等语言;有过两年工作经验,有坚实的代码编写基础、曾独立开发过一款Windows软件并且取得软件著作权。
项目经验:一:基于RTKLIB开源软件二次开发,开发出“GNSS精密定位及仿真分析软件”并且取得软件著作权,其中算法修改及测试、UI界面设计及交互、算法梳理以及逻辑梳理等均由个人完成,历时六个月,对于我来说该项目收获最大的就是能够更加熟练的运用线程操作并且掌握了更多的代码编写技巧、增强了代码编写得到严谨性; 二:在团队项目中精度验收测试代码由本人独立攥写并且成功验收; 三:在团队中完成过各种小模块,例如百度地图交互模块、数据统计绘图模块以及协议解析模块;其中百度地图控件交互模块在运用到MFC控件的同时还需要运用到Javascript语言、数据统计绘图模块则需要运用到MFC中的CDC类绘图、协议解析模块则是缓冲区操作中的取帧、读帧、判断帧操作。这些都让我受益匪浅。
技      能: 其他  
¥200 / 8小时
立即预约
ID:22505
吴梅 算法工程师 12年经验
2025-04-06
个人介绍:熟悉图像处理算法(比如双线性插值算法、滤波算法、模板匹配等),可熟练使用OpenCV、Halcon等视觉计算库。 熟悉深度学习的经典模型(比如AlexNet、VGGNet、Inception V3、Inception V4),熟悉物体检测算法(比如Faster-RCNN、YOLO-v3、EfficientNet、EfficientDet等),熟悉语义分割算法(比如FCNN、U-net),熟悉GANs网络并了解它的演化模型。 熟悉传统机器学习算法,比如k-means、决策树、随机森林、XGBoost等。 能熟练使用C++、Java、Python、Matlab等多种语言进行项目预研和应用开发,并且具有一定的编程能力,曾在软件开发比赛中获得省级奖项。 熟悉Caffe、Keras、Pytorch、TensorFlow等多种框架,曾应用这些框架完成了多个项目,曾协助导师指导2018届本科生完成基于深度学习实现帧间预测的项目。
项目经验:2020/6月-2023/11月 主要参与工业视觉应用平台开发和企业级应用项目落地 1、参与工业级无代码视觉应用平台开发,包括数据扩增模块开发、模型训练功能模块开发,参与模型推理模块开发包括前处理和后处理以及传统算法开发(比如基于阈值分割定位、基于ncc的模板匹配、对比度计算等) 2、先后负责Nokia手机玻璃表面缺陷检测、LED面板拼接算法开发(已被某知名LED厂商采购并投入使用)、LED坏点表面缺陷检测(已验收)、触控板表面缺陷检测(已完成项目验收并获得多个果链客户采购订单);参与透析管表面缺陷检测(已达到客户预期待验收)、车载玻璃表面缺陷检测(已验收) 2019/07-2020/05 基于改进型Faster-RCNN的CT肺结节检测 对预处理和后处理方案做出了一些适当的改进和优化,同时设计出了基于Faster-RCNN的CT肺结节检测的改进方案,显著提高了检测率,降低了假阳性(不高于5%),并且线上运行良好,获得用户广泛赞许 2016/09- 2017/02 基于树莓派开发板的双目视觉客流统计系统 主要利用视差测距的原理来进行上下车乘客的识别。虽然该系统需要花费3~5分钟的时间才能够统计出人数,无法做到人数的实时统计,但是可以在公交车到达下一站之前完成客流统计并且能够应对多人同时上下车等复杂情形。
技      能: 其他  
¥1500 / 8小时
立即预约
立即预约
意见反馈