职位描述
1、岗位职责:
(1)深入理解自然语言处理和大模型预训练技术,研究并掌握最新的大模型训练技术发展;
(2)有较长期的大模型训练经验,负责预训练模型、训练方案设计与实现,特别是大语言模型的训练;
(3)对于大模型训练的高质量数据构造、清洗、数据比例配比有丰富经验;
(4)对于金融领域的场景任务,能够熟练分析对大模型能力的要求,并能够完成相应的数据构建、大模型再训练任务。
2、职位要求:
(1)博士及以上学历毕业生,计算机、人工智能、机器学习等相关专业;
(2)扎实的深度学习、NLP算法基础,熟悉强化学习、蒙特卡洛搜索等类似算法;
(3 熟练掌握C++和python语言,具备较强的代码工程能力,至少熟练掌握tensorflow、pytorch中一个深度学习框架,熟悉常见的机器学习和深度学习算法,能快速复现前沿算法;
(4)有Megtron/Deepspeed等多机多卡训练框架经验优先,有量化/蒸馏等推理优化经验优先;
(5)具备大规模预训练模型、多模态学习等领域深厚的理论基础和丰富的实现经验;
(6)熟悉LORA、QLORA等大模型微调技术,大模型Prompt 工程;
(7)发表过AI领域的顶级会议或期刊论文优先;
(8)具备良好的分析解决问题能力,优秀的学习能力,善于沟通和交流,有强烈的进取心、责任心和创新意识。
(1)深入理解自然语言处理和大模型预训练技术,研究并掌握最新的大模型训练技术发展;
(2)有较长期的大模型训练经验,负责预训练模型、训练方案设计与实现,特别是大语言模型的训练;
(3)对于大模型训练的高质量数据构造、清洗、数据比例配比有丰富经验;
(4)对于金融领域的场景任务,能够熟练分析对大模型能力的要求,并能够完成相应的数据构建、大模型再训练任务。
2、职位要求:
(1)博士及以上学历毕业生,计算机、人工智能、机器学习等相关专业;
(2)扎实的深度学习、NLP算法基础,熟悉强化学习、蒙特卡洛搜索等类似算法;
(3 熟练掌握C++和python语言,具备较强的代码工程能力,至少熟练掌握tensorflow、pytorch中一个深度学习框架,熟悉常见的机器学习和深度学习算法,能快速复现前沿算法;
(4)有Megtron/Deepspeed等多机多卡训练框架经验优先,有量化/蒸馏等推理优化经验优先;
(5)具备大规模预训练模型、多模态学习等领域深厚的理论基础和丰富的实现经验;
(6)熟悉LORA、QLORA等大模型微调技术,大模型Prompt 工程;
(7)发表过AI领域的顶级会议或期刊论文优先;
(8)具备良好的分析解决问题能力,优秀的学习能力,善于沟通和交流,有强烈的进取心、责任心和创新意识。
- 城市招聘:
- 青岛招聘 新余招聘 嘉兴招聘 衡水招聘 长春招聘 岳阳招聘 湘西土家族苗族自治州招聘 泰安招聘 博尔塔拉蒙古自治州招聘 太原招聘
- 热门职位:
- JavaScript招聘 测试开发招聘 网络安全招聘 C#招聘 技术文档工程师招聘 芯片测试工程师招聘 售前技术支持招聘 数据通信工程师招聘 电路设计招聘 软件测试招聘 数据采集招聘 全栈工程师招聘 C/C++招聘 机器学习招聘 电子维修技术员招聘 其他后端开发招聘 DFT工程师招聘 光网络工程师招聘 宽带装维招聘 射频工程师招聘 大模型算法招聘 需求分析工程师招聘 项目助理招聘 Cocos招聘 嵌入式软件工程师招聘 深度学习招聘 电子工程师招聘 核心网工程师招聘 PCB工程师招聘 搜索算法招聘
- 推荐公司:
- 一米互联 联桩新能源 帮徳服务 菲提亚 张家口广德建筑工程有限公司 合肥新梦想教育招聘 山西华军伟业工贸有限公司 保定梦炫箱包制造有限公司 贵州高雄物资有限公司 安徽拓泰机电有限公司 深圳丝贝亮美发用品招聘 上海澜兴建筑装饰有限公司 郑州造价预算岗招聘 廊坊市广阳区邦豆美容院招聘 航天海鹰集团IT首席专家招聘 技术文员白杨招聘 富锦市鑫源粮食贸易有限公司 上海尊喆贸易有限公司 西安Kamon咔萌招聘 莱汇(上海)润滑科技有限公司 东莞市其美新材料有限公司 青岛恒信通达商贸有限公司 上海康穆实业有限公司 悦尚美容养生馆美容师美甲美睫师招聘 湖州品梵文化传播有限公司 广州硕辰科技有限公司 长沙星沙佧茜文服装店招聘 聊城贵凯物资有限公司 中安矿盛(北京)科技有限公司 泰安市海康信息技术有限公司
更新于:2025-01-22