50-80K·16薪

多模态算法专家/高级专家 猎头职位

代招公司:某大型互联网平台公司

北京5-10年本科

多模态 大模型 预训练
立即沟通
李先生
感兴趣

BOSS直聘猎头·猎头顾问

职位描述

岗位职责
1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。
2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。
3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。
4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。
岗位基本需求
1. 对大模型有技术热情,熟悉GPT/BERT/T5等模型的原理;
2. 熟悉Python,熟练使用TensorFlow/PyTorch/Megatron/Triton等深度学习训练或推理框架,熟悉java/C++中的一种。
具备以下者优先
1. 有SIGIR、ACL、WWW等NLP/搜索领域顶会论文发表经验;
2. 有KDDCup、RecSys、Kaggle、天池等机器学习比赛获奖经验;
3. 有主流多模态大模型(跨视觉/语音/文本模态,Gemini、GPT-4o、Chameleon、Tortoise TTS等)相关的研究或工作经历
岗位亮点
1. 团队资源丰富,技术审美优秀,在MoE、原生多模、scaling law、self-play等技术方向都有较为前沿的探索经验。
2. 原生多模统一理解与生成,探索空间巨大,能力天花板高。团队在原生多模领域起步较早,具有充分的实践经验和行业一流的认知。
更新于:2024-12-12
下载APP确定

已安装?在APP中 直接打开