-
岗位描述:
1. 负责研发大语言模型强化学习算法,提升大模型在强化学习阶段的训练效率,以及提升大模型在数学、代码等自然科学领域的推理能力
2. 负责研发奖励和评
-
【工作职责】
1.负责设计、开发和优化强化学习算法,优化现有算法,解决复杂的决策和控制问题,在模拟环境或实际场景中测试和验证算法性能;
2.根据实际业务需求,构
-
职位描述
我们正在寻找一名经验丰富的强化学习算法专家,负责设计、实现和优化先进的强化学习算法,以解决复杂的决策与控制问题。您将与跨学科团队合作,将算法应用于
-
岗位职责:
1、开发通用型具身智能算法并应用于机械臂和人形机器人场景,实现多场景多任务的泛化;
2、实现模仿学习或强化学习的前沿技术在实际场景的快速验证,并提出
-
岗位职责:
1、负责基于强化学习/模仿学习的双足运动控制算法的研发和调试,确保算法的高效性和稳定性;
2、在自研机器人平台上进行训练模型的部署与调试,深入分析并
-
团队主要负责蚂蚁集团的大语言模型语料优化、千亿基座训练,图机器学习,知识图谱、知识增强大模型等基础算法方向。团队研发了超大规模图学习系统AGL,并将其落地于金融
-
工作职责职位描述:
探索下一代端到端自动驾驶系统的强化学习训练范式,构建高效稳定的大规模强化学习闭环训练框架,提升强化学习的数据效率、训练效率、稳定性、场景泛化
-
1. 负责自动驾驶方向VLA/VLM/端到端算法的研究和落地;
2. 负责强化学习在真实量产问题中的解决方案开发。
职位要求
1. 具备大模型(VLM,VLA
-
可base上海/深圳/杭州/苏州
工作职责:
1、负责搭建机器人强化学习仿真训练平台,开发基于学习的机器人控制策略,并与传统控制方案互补,提升机器人整体控制效
-
岗位职责:
1.负责双足人形机器人步态控制算法的研究与开发部署,提升机器人运动能力与稳定性,包括全身运动和抗扰动控制算法。
2.负责算法策略的训练和移植部署,实
-
职位描述
岗位职责:
1、负责多模态、大语言模型等相关算法在得物业务场景的预研工作;
2、包括但不限于如下方向:多模态、大语言模型、自监督预训练、迁移学习等;
-
岗位职责:
1. 负责运动控制算法的研究、开发与优化,确保系统性能达到预期标准;
2. 设计并实施算法测试流程,验证算法在不同场景下的稳定性和效率;
3. 与硬
-
1、负责淘宝闪购即时物流算法的配送时间预估算法体系;
2、基于业务问题,持续迭代算法模型和特征工程,提升整体业务指标;
3、参与创新性算法的研究以及开发工作,充
-
岗位职责:
1、负责端到端智驾大模型的算法预研,算法突破与验证工作;
2、负责城区自动驾驶纯模型方案的量产落地,产品性能提升与交付;
3、负责端到端智驾大模型方
-
岗位职责
1)模型应用落地:负责Prompt设计、Few-shot/Zero-shot优化、Continual Pretrain、SFT/RL、RAG链路搭建
-
Job Description:
1、负责交通参与者(车辆、行人等)的轨迹/意图预测、自动驾驶车辆轨迹规划的AI模型研发;
2、负责AI预测/规划模型的代码实现
-
工作职责
1、负责智能驾驶核心模块(感知/预测/决策)云端算法设计与优化,主导云端方案、云端建模、云端训练完整闭环,对精度、鲁棒性和实时性指标负责;
2、解决复
-
【千里智驾-千里马计划:寻找年薪百万的你!】
【此岗位发简历必回,全流程跟踪。】
【校招、社招均可投递】
岗位职责:
1. 核心算法研发:负责L4级Robot
-
岗位职责:
1、基于强化学习(RL)算法(如PPO、SAC、MuZero、GRPO、DPO等)研发自动驾驶决策与控制模型,优化车辆在复杂场景下的行为策略。
2、
-
职位描述:
1.作为强化学习领域的专家,主导和推动理想汽车自动驾驶系统中的核心强化学习算法的研发和优化。
2.设计和实现创新的强化学习模型,针对复杂的自动驾驶场
-
工作职责:
1、负责基于AIGC技术、多模态技术和强化学习技术打造移动影像下一代计算成像算法架构,对最终效果竞争力负责。
2、负责基于上述架构的核心图像算法的规
-
职位描述
参与实验室书生大模型后训练阶段多模态、多任务强化学习技术研发迭代与工程规模化。具体工作内容包括:
1. 骨干参与超大/超稀疏、多模态混合专家模型的大规
-
岗位描述
1、研发智能体的进化引擎:
-架构设计: 主导设计并构建一个基于强化学习的通用智能体训练平台,决定Agent如何学习任务规划、工具使用和复杂推理策略
-
工作职责:
优化机器人大规模训练任务,提高训练效率,实现高效、稳定的大模型训练。
利用深度学习、强化学习等先进技术,解决复杂场景下的机器人应用问题。
分析并优化
-
岗位职责:
1.垂直领域大模型技术体系构建:负责基于通用基座大模型结合领域数据构建垂直领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,
-
职位描述
1、负责SFT(监督微调)、DPO(直接偏好优化)、RL(强化学习)等大模型后训练算法的研究与开发,优化模型训练流程,提升模型在各类任务中的性能与表现
-
工作职责
1、负责开发 UI 界面智能感知与自动交互系统,涵盖视觉识别、OCR 文字识别、UI 结构解析、UI交互逻辑推理、用户行为预测、交互事件模拟等核心能力
-
岗位职责:
1. 算法开发与优化
- 设计并实现自动驾驶路径规划与运动控制算法,包括全局路径搜索(A*、D*、RRT等)、局部轨迹优化(Lattice P
-
岗位职责:
1、负责 VLA大模型的研究和开发工作,并在复合机器人领域的落地应用。
2、设计和优化模型架构,包括对模型的数据处理、训练以及真机部署等工作,确保模
-
部门介绍
Marketplace Intelligence and Data 团队的使命是建立先进的大规模数据和智能产品来促进Shopee电商业务的发展。团队负