80-110K·16薪

大模型算法专家 猎头职位

代招公司:某大型互联网OTO平台上市公司 已上市

北京经验不限硕士

大模型 算法
立即沟通
罗先生
感兴趣

上海博得人力资源服务·猎头顾问

职位描述

职位描述:基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责
1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。
2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。
3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。
4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。
岗位基本需求
1. 对大模型有技术热情,熟悉GPT/BERT/T5等模型的原理;
2. 熟悉Python,熟练使用TensorFlow/PyTorch/Megatron/Triton等深度学习训练或推理框架,熟悉java/C++中的一种。
具备以下者优先
1. 有SIGIR、ACL、WWW等NLP/搜索领域顶会论文发表经验;
2. 有KDDCup、RecSys、Kaggle、天池等机器学习比赛获奖经验;
3. 有主流多模态大模型(跨视觉/语音/文本模态,Gemini、GPT-4o、Chameleon、Tortoise TTS等)相关的研究或工作经历
岗位亮点
1. 团队资源丰富,技术审美优秀,在MoE、原生多模、scaling law、self-play等技术方向都有较为前沿的探索经验。
2. 原生多模统一理解与生成,探索空间巨大,能力天花板高。团队在原生多模领域起步较早,具有充分的实践经验和行业一流的认知。
更新于:2025-01-24
下载APP确定

已安装?在APP中 直接打开