ID:22634
董秀梅 自然语言处理算法工程师 6年经验
2025-05-22
个人介绍:1. 掌握语言:python 2. 工作方向:机器学习,深度学习,数据处理,数据挖掘,自然语言处理,大语言模型微调 3. 开发经验: 3.1 数据处理:熟悉python及常用数据处理库,包括numpy,pandas,re等;熟练使用matplotlib和seaborn绘图库; 3.2 模型开发:熟悉sklearn,lightgbm,使用过异常处理算法LOF,CBLOF,IForest, COPOD,采样算法随机降采样,随机上采样,ENN,SMOTE等;熟悉pytorch和tensorflow深度学习框架,开发过CNN,RNN,LSTM等基础模型,T5, ChatGLM2-6B,Llama-7B预训练模型微调(ChatGLM2-6B + ptuningv2, ChatGLM2-6B + lora, Llama2 + lora),复现过Yolo v5,Ernie-layout开源模型; 3.3 Demo开发:开发过基于python+django框架的web展示,有linux系统深度学习开发经验。
项目经验:项目1:Multi-Model Machine Reading Comprehension2023/1-2023/9 项目描述: 项目介绍:为了优化三星各类产品用户的用户体验,本项目基于三星产品手册,通过预训练模型微调,在下游完成多个任务,即对用户问题答案的页面检索与答案生成,其中答案包括与该问题相关的手册页面所在区域以及基于此区域信息的生成内容。本课题目前已通过总部验收。工作内容如下: 1.负责机器阅读理解任务数据重构。开发 pdf 文档自动化标注工具,抽取 pdf 文档中的文本和图片数据,在注入 QA 问题答案对之后转换成模型训练所使用的 jsonl 格式; 2. 负责对 QA 问题答案对数据增强。主要通过基于三星内部的 Utrans 翻译工具的回译和基于 Meta 开源的 llama 大语言模型 zero-shot 生成新的 qa对,以扩展数据,帮助模型提升泛化能力;设置生成 QA 问题答案对的任务,使用基于 llama2-7B在原数据集上进行微调出 llama2-pm-7B,再基于 llama2-pm-7B zero-shot 在三星22本家电类别产品手册上生成 QA 问题对; 2.负责机器阅读理解模型 -基于T5预训练模型的开发和调优。在基础T5模型的基础上增加适用于本任务的三个模块,分别是基于输入问题的页面检索、基于输入问题和金标页面的文本问答以及输入问题和金标页面的视觉问答。并尝试将检索结果 top 3拼接后输入后两者进行训练和推理; 3.基于 django在 aws 搭建前端 demo 。开发模块如下:指定文档问答、上传文档自动解析、已上传文档管理。 项目成果: 1. 数据增强:通过实验发现,基于 Utrans 回译优于基于 Llama-7B zero-shot 方法。将基于 Utrans 回译生成的数据按照与原训练集1:1的比例扩充,同时通过回译扩充测试集。经过训练后,在该测试集上 Bleu 4相比于不使用数据增强的模型提升1.7; 2. pdf 文档自动化标注工具能从未人工标注的产品手册中抽取文本和图片数据,并可直接进行推理。基于 llama2-pm-7B的 zero-shot 数据训练的模型在页面检索任务 top 1准确率上提升5.4%; 3. Web端 demo 通过中期项目验收;测试集页面检索准确率和 Bleu 4分数达到项目验收要求。 项目2:三星健康抑郁症检测2022/1-2022/7 项目描述: 1.负责清洗实验者监测数据,包括缺失值填充; 2.负责数据预处理,将离散的结构化数据提取成为期5天的时序数据; 3.利用Tensorflow搭建双向lstm三任务网络,实现一次输入同时预测用户抑郁、焦虑以及压力水平。 项目成果: 1. 发表论文,并出席完成汇报 Zhang, S., Tu, M., Yan, Y., Zhuang, Y., Ge, L., Wei, G. (2022). Detecting Depression, Anxiety and Mental Stress in One Sequential Model with Multi-task Learning. In: Duffy, V.G., Gao, Q., Zhou, J., Antona, M., Stephanidis, C. (eds) HCI International 2022 – Late Breaking Papers: HCI for Health, Well-being, Universal Access and Healthy Aging. HCII 2022. Lecture Notes in Computer Science, vol 13521. Springer, Cham.
技      能: 其他  
¥200 / 8小时
立即预约
ID:22709
刘平 实施工程师 8年经验
2025-05-20
个人介绍:1、熟悉oracle数据库,rac,adg.dg ,拥有初级 DBA能力,会简单的sql调优 2、熟悉中间件 weblogic,tuxedo,nginx,tomcat ,单机集群 3、熟悉linux操作系统,按照红帽redhat中级认证标准化学习 4、熟悉整个web项目的搭建,从0—1完成项目部署 5、了解华为云,阿里云,云部署,了解 docker,k8s 6、良好的英语读者能力,能看懂简单的英文文档 7、了解 java,c++,能看懂java代码,良好的shell 脚本编写能力 8、熟悉jmeter测试工具
项目经验:1、负责营销业务应用系统,市场化系统,四表合一系统 2、为服务器做巡检,协助开发完成程序部署,查看 weblogic,tuxedo 日志 3、负责 oracle 数据库运维,表空间调整,tns 配置,账号授权,sql 调优,数据库异常处理 4、管理几百上千台服务器 5、华为云账号分配,微服务部署 6、熟悉网络,机房路由器 7、渝快办项目,linux+weblogic+java 程序包+oracle 完成项目实施部署 8、现货交易项目,linux+tuxedo+c语言程序包+oracle 完成项目实施部署 9、电力公安项目,linux+tomcat+Java 程序包+oracle 完成项目实施部署 10、负责大型系统的性能测试和压力测试 1、协助 linux 操作系统的安装 2、协助 linux 操作系统破密 3、协助 oracle 数据库维护 4、安装部署整个 web 项目 5、熟悉 linux 操作系统 6、熟悉 nginx,tomcat 中间件 7、编写服务器巡检脚本,编写数据库巡检脚本 8、负责公司的 crm 系统部署 9、负责公司的 ai 系统部署 10、熟悉网络(交换机设备) 11、熟悉桌面运维软件安装 12、熟悉打印机,UI设备调试
技      能: 其他  
¥1100 / 8小时
立即预约
ID:22716
岳红 数据负责人 7年经验
2025-05-19
个人介绍:1、oracel、Mysql等数据库,SQL精通 2、PowerBI、FineReport 开发 3、Kettle使用 4、影刀RPA 5、数仓建设 6、BI报表开发与运维经验 7、用友NC管理运维经理,对用友数据库了解
项目经验:一、BI报表项目 使用帆软FineReport搭建公司BI报表体系,完成0至1建设,除了投入人力,公司未投入额外资金。利用半年时间,满足了业务、财务类的基本数据需要。 1、对接多个系统,使用ETL工具将不同来源数据(如MYSQL、ORACLE、SAP/SAP BW等,涉及中台、SHR、SAP等系统)抽取至报表数据库; 2、根据相关需求进行计算输出结果,进行可视化展示; 3、PC端、移动端展示(含可视化数据大屏展示) 二、RPA项目 1、使用影刀RPA软件,从京东、天猫、苏宁等平台提取了日销、流量、库存、竞争等相关数据,结合内部自有数据,设计开发了电商运营数据看板, 2、电商财务对账RPA运用。 3、财务共享RPA运用场景开发,如:“自动审单”,“合并报表数据下载、数据填报,上报”,“银行回单下载,余额对账等” 三、营销中台项目 1、主导了系统上线过程中4大重要专题事项; 2、作为主要管理人员对业务需求分析与方案评审; 3、营销中台与SAP对接事项协调; 4、负责数据清洗项目组,对客商、商品等主数据清洗; 5、负责上线中台及外围系统业务切换方案; 6、新旧系统数据切换及数据准备工作;
技      能: 其他  
¥1100 / 8小时
立即预约
ID:22419
丁旭 数据库开发 10年经验
2025-05-19
个人介绍: 熟练常用的oracle、星环大数据、华为 LibrA、greenplum 数据库。  熟练使用smartbi等报表开发工具  熟练使用ETL调度配置,银行数据抽取、加工、分析,日常跑批调度。  熟练shell语言,有大量的shell脚本开发经验  精通SQL语言,有丰富的数据库开发、数据仓库分层、数据建模经验  了解JAVA面向对象编程语言,有良好的编码习惯和逻辑思维能力。  了解JQuery、JavaScript、Ace_admin等技术。  了解Spring、Mybatis等开源框架。  了解Tomcat/Oracle/MyEclipse搭配的开发环境下,进行项目开发。  了解在Window、Linux环境下编程,开发和环境的搭建,以及服务器的搭建和部署。
项目经验:项目名称:某银行CRM系统 系统环境:Windows 开发工具:华为libra、plsql 采用技术:shell 、sql、taskctl调度项目描述: Crm系统是通过对零散的、不同系统的客户信息进行收集、整理、加工成为相对集中于完整的客户信息,而后根据客户的行为特点与规律提供客户服务,满足客户个性化需求。 责任描述: 需求分析,沟通需求,后台表结构设计。 1. 需求分析,沟通需求:需求讨论,文档编写,供后续开发使用。调查、收集整理相关资料,制定初步计划, 2. 模型设计:根据需求,分层设计模型。 3. 模型开发:根据设计的模型进行开发。 4. 数据测试:根据业务要求验证模型数据是否正确。 项目收获: 锻炼自己的沟通应变能力,同时巩固了数据库、shell知识,提升自己的模型设计开发能力。提升自身对银行数据的敏感度,加深对银行业务的了解。 项目名称:某银行数据仓库 系统环境:Windows 开发工具:星环大数据、greenplum 采用技术:shell 、sql 项目描述: 数据仓库是为企业业务分析、市场营销、成本控制、战略决策提供所需要的数据支持。数据仓库汇聚了银行主要系统的客户、业务、财务等数据,为银行的日常运营分析、市场营销、风险控制、财务分析、内部审计、监管报送提供数据支持和服务。 责任描述: 需求分析,沟通需求,后台表结构设计。 1. 需求分析,沟通需求:根据银行内部要求编写需求文档,调查、收集整理相关资料,制定初步计划。 2. 模型设计:根据数据架构设计对应的模型。 3. 模型开发:根据设计的模型进行开发、加工对应的标签。 4. 数据测试:根据要求验证模型数据是否正确。 银行数仓主题层:公共,客户,机构,财务,渠道,协议,事件,产品,资产
技      能: 其他  
¥1300 / 8小时
立即预约
立即预约
意见反馈