职位描述
岗位职责
1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求;
2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效;
3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。
任职要求
1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算法工作经验;
2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型;
3、精通大模型微调、自监督学习、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术;
4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架;
5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题;
6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务;
7、具备超大规模(集群千卡+/大模型100B+)训练、调优经验者优先;
8、在英文期刊和学术顶会上发表过学术论文者优先。
1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求;
2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效;
3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。
任职要求
1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算法工作经验;
2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型;
3、精通大模型微调、自监督学习、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术;
4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架;
5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题;
6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务;
7、具备超大规模(集群千卡+/大模型100B+)训练、调优经验者优先;
8、在英文期刊和学术顶会上发表过学术论文者优先。
- 热门职位:
- 网络安全招聘 集成电路IC设计招聘 技术总监招聘 技术合伙人招聘 电源工程师招聘 电路设计招聘 移动开发招聘 系统安全招聘 数据治理招聘 芯片测试工程师招聘 Android招聘 JavaScript招聘 项目经理/主管招聘 射频工程师招聘 其他技术职位招聘 数据通信工程师招聘 运维开发工程师招聘 SLAM算法招聘 iOS招聘 GIS工程师招聘 自动驾驶系统工程师招聘 软件测试招聘 全栈工程师招聘 数字IC验证工程师招聘 数据架构师招聘 硬件项目经理招聘 算法研究员招聘 .NET招聘 DBA招聘 性能测试招聘
- 推荐公司:
- 汇财通 隆马尚品 尚市房产 柚丁科技 夏加儿思达教育 万合隆企业管理 祥云联合智能科技 集成文化发展 培英教育 伊盾能源科技 snh48招聘 愿者上钩华南店厨房切配招聘 北京钰晟国际贸易有限公司 广西洲源碳能源开发有限公司 西安华大水务科技有限公司 吉林耀强新能源有限公司 帷幕(北京)网络科技有限公司 成都长生桥调味品有限公司 驹马企业物流运营招聘 深圳市创百天劲贸易有限公司 上犹县晟宇广告传媒店招聘 天津棒棒糖酒店管理有限公司 昆明奥唯斯文化传播有限公司招聘 济南仓管物流招聘 男装设计招聘 绣花镭射激光招聘 贵州星辉劳务有限公司 兰陵县王小雅蔬菜有限公司 成都学林宏发建材有限公司 吉林蓝能投资管理有限公司
更新于:2024-12-17