ID:22772
王海燕 数据分析师 13年经验
2025-06-03
个人介绍:基于信贷数据实现xxx银行智能风险控制系统,本人主要负责大数据处理和算法研究开发工作,参与平台前后端开发。工作期间申请相关专利15个,2021年在《中国金融电脑》期刊(核心期刊)发表文章一篇,2020年申报的算法项目获得2020年IBM代码集结号竞赛全球前50强,大中华区第2名,具有丰富的算法和数据分析经验。
项目经验:1、智能运维是运维的高阶实现,本项目包括数据归集、算法平台开发、智能运维场景挖掘,智能运维平台开发。目前开发的场景包括智能异常检测、智能报警收敛、日志模式诊断、智能根因定位、临界资源预测等。智能异常检测实现自适应的异常检测,可以根据不同时间段动态调整阈值,报警的精度提高到96.7%,减少了大量误报和漏报;智能报警收敛利用关联性规则和分时段有效报警信息提取,实现报警量的压缩,压缩量达91.8%;智能投产验证实现投产智能决策和验证,帮助应用快速发现投产异常;智能根因分析实现5分钟内精准发现故障根因,故障定位速度提高95.8%;临界资源预测,可实现提前1天感知资源的使用情况,从而避免资源的扩缩容不合理以及资源耗尽情况。 2、智能风控项目 基于银行信贷数据,利用机器学习算法和判定规则,实现了银行业风控能力的提升,将基于规则判定的风控准确度由73%提升到86%
技      能: 其他  
¥1200 / 8小时
立即预约
ID:22752
杨秀芳 DBA 8年经验
2025-05-24
个人介绍:1、掌握各种版本Oracle数据库在各种操作系统平台的安装,创建用户、角色、表空间等数据库元素; 2、掌握数据库的备份与恢复,熟练使用rman、exp,imp数据泵等工具对数据库备份还原及迁移操作; 3、使用ADG和OGG建立物理和逻辑备用数据库等灾难防护技术,充分保障数据库系统无间断运行; 能进行各种,并利用该技术进行同平台或者跨平台的数据库迁移,以缩短停机窗口时间; 4、掌握集群软件的服务及ASM磁盘组手动管理、调试; 5、了解oracle 11g到19c的特性,及RAC的原理、安装、实施,配置; 6、了解Oracle数据库体系结构及锁机制,给出优化建议; 7、掌握Linux及AIX操作系统vg及lvm等磁盘管理操作; 8、有一定shell编程基础,可以写一些脚本来运用在工作,减少重复性工作。 数据库:Oracle、mysql、DB2、PG 中间件:Weblogic、MQ、WAS、Tuxedo 系统层:Linux(RHEL、CentOS)、AIX 虚拟化:ESXI、hyper-v
项目经验:金融类 某银行运维项目,负责数据迁移,及平台搭建,涉及oracle9i到19c,技术要点包括数据泵,ADG,OGG等 某农商银行采购项目,项目经理,涉及vSan超融合。 医疗类 某医院运维项目,电子病历及历史数据库二线支持 某研究院,电子病历数据库二线支持 等
技      能: 其他  
¥1100 / 8小时
立即预约
ID:22727
程梅 大数据开发工程师 12年经验
2025-05-12
个人介绍:1、熟悉数仓建模,做过大型项目的数仓开发经验。 2、精通sql,做过很多复杂的sql指标运算,包括MR、spark作业调优。 3、熟悉bi工具,可以做报表展示。 4、熟悉spark,可以用spark计算指标。 5、熟悉python,掌握常用的python方法,负责过数据治理功能的开发,包括但不限于(数据产出监控,数据质量监控,hdfs和yarn运行资源的监控,自动化开发工具等) 6、掌握数据治理理论,包括元数据管理和数据管理,数据地图,数据血缘开发等。
项目经验:一、网盘核心数仓表全链路迭代 项目背景:出于公司降本指标,核心指标稳定性问题频发,故迭代升级历史核心任务链路(包括:sql 链路调优,spark 性能参数调优,表功能迭代)。 主要职责: 1、调研需要迭代的指标数量,分析各个计算链路存在问题,并设计优化方案。 2、优化上游调用表链路,拉取更合理的分区,以及 sql 调整减少 shuffle ,调整 spark 参数提高性能,并通过 sapark web 观察 stage 的实际产出效能,调整 executor 、core partition 数量,以及内存的大小等参数来提高效能,并尽量精确节约计算资源降低成本。 3、测试优化后的链路是否通路,并校验数据的准确性,并对比优化前后的成本和效能。 项目业绩: 1、提高了任务链路例行成功率,做到除系统故障外几乎0失败。 2、 降低了计算资源成本35%,提高了计算效率20%。 二、网盘部门计算资源治理系统开发 背景:部门确少全局的资源和任务监管系统,很多队列存在资源浪费和作业不规范的情况,故 ,开发网盘队列资源和作业相关的监管系统,实现全局治理计算资源。 项目职责: 个人开发 1、通过对 队列资源信息的抓取,实现队列稳定性相关的监控。 2、通过一些策略对队列任务进行管控,保证队列资源的稳定性和规范性 3、 提取队列上的作业的核心信息入库并通过可视化展示查询。(包括各个时间作业运行时间,是否触发报警,各个作业运行在哪个队列,消耗多少内存以及 core ,并统计资源占用 top榜,各个时间段的队列资源占比,以及各个时间各队列作业数量统计等相关维度展示) 项目业绩: 大盘上实现了网盘队列和作业的稳定性和规范性。 通过该监控系统,节约大盘计算资源成本 20%。 可以全盘监控和统计网盘运行作业的信息,对后续网盘业务链路迭代提供了数据基础。 三、网盘埋点数据用户pv uv 留存的全链路开发和可视化 1、协同 PM 确认数据口径和需求指标。 2、 从数据库和埋点数据进行采集 etl 处理入 ods层。 3、对数据纬度进行加工聚合,行转列降维成 dws 层宽表,方便 ads 指标取数。 4、 对各个埋点类型的用户(包括 tool、card 、资源位、小飞机、电商、push 等多渠道)进行分类统计 展现 pv,uv 点击 pv,uv 和留存,留存率,ads 层指标。 5、将指标数据通过开发 shell 倒库脚本导入到数据库。 6、 通过 bi 可视化展示收益指标
技      能: 其他  
¥1400 / 8小时
立即预约
立即预约
意见反馈