90-100K·15薪

AI性能资深系统架构师 猎头职位

代招公司:某大型互联网通信上市公司 已上市

上海10年以上本科

性能优化 AI编译器 算子开发 集群部署
立即沟通
冯女士
感兴趣

慧仕达·猎头顾问

职位描述

1. 负责AIGC大模型训练和推理部署及算子加速优化;
2. 负责AIGC大模型异构GPU芯片的软硬件技术平台的设计和算子加速优化;
3. 负责AI大模型训推优化的前沿技术研究和产品落地。
1、硕士研究生6年以上工作经验,本科8年以上工作经验
2、3年及以上NVIDIA GPU开发和性能优化经验,熟悉pytorch,tensorflow开发框架,并熟练掌握GPU性能分析工具(Nsight System/Compute)以及算子性能理论分析模型;
3、熟悉英伟达AI 套件全栈软件(熟悉各种加速库,含CUDA,NCCL,Tools,及各种调优,部署工具)
4、满足以下至少2条设计和开发经验要求:
---CUDA和NCCL的优化工作
---GPU集群部署的性能优化工作,了解GPU互联,IB网络
---AI大模型相关的训推融合算子优化
---AI编译器图层和算子层优化的设计
5、有大模型训推经验和架构性能优化经验优先;
更新于:2025-02-13
下载APP确定

已安装?在APP中 直接打开