30-60K·15薪

算法工程师 - 剪映/Capcut商业化(北京)

北京3-5年硕士

Tensorflow 多模态 python C++ fine-tuning PyTorch LLM训练 强化学习
立即沟通
彭女士
感兴趣

字节跳动 ·人力资源HR

职位描述

【职责】:负责剪映/CapCut的多模态模型的偏好对齐算法,使用SFT/RLHF/post-training 等技术对视频创作进行领域知识建模,提升视频创作Agent大模型的增强模型和安全能力的指令遵从能力、提升pre-trained Model在视频创作的能力,构建行业领先的视频创作专家的智能Agent。
【要求】
1. 数学、计算机、控制科学、软件工程、人工智能等相关学科硕士及以上学位;
2. 熟悉大模型的相关基础知识,具备大语言模型大规模相关训练或推理的基础知识;
3. 熟悉LLM的训练或fine-tuning的方法,例如SFT/RLHF经验,或熟悉强化学习(RL)概念深入了解PPO相关算法知识;
4. 扎实的Python或者C++编程功底,了解PyTorch,Tensorflow,Deepspeed,Megatron,vLLM等大模型训练、推理技术栈;
5. 对技术有热情,乐于follow大模型最新研究和论文,对大模型的应用有兴趣;
6. 有独立解决问题的能力,有良好的技术沟通及协作能力,并乐于推动项目中问题的解决;
加分项
- 参与过知名大模型项目的相关RLHF工作
- 深入了解对齐算法工程实践,能够优化RLHF相应框架训推效率
- 了解多模态大模型的对齐,了解步骤监督学习相关内容

公司介绍

字节跳动成立于2012年3月,公司使命为“Inspire Creativity, Enrich Life(激发创造,丰富生活)”。公司业务覆盖150个国家和地区,拥有15万名员工。
字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书、Lark、PICO、剪映、TikTok等。截至2021年6月,字节跳动旗下产品全球月活跃用户数超过19亿。

工作地址

北京海淀区抖音大钟寺广场1号楼大钟寺
字节跳动

互联网D轮及以上 10000人以上

更新于:2025-03-18
下载APP确定

已安装?在APP中 直接打开