高级算法工程师 (J250901034)
Didi
Beijing, China
Posted on Sep 1, 2025
职位描述
在打车场景中,POI是用户目的地的数字化表达,是最基础的数据之一,直接影响用户能不能找到目的地、正确到达目的地。传统的数据更新依赖人工,现实的快速变化带来了更新成本剧增和更新速度降低。但这些在LLM时代迎来了转机,LLM更强的特征表达能力、更智能的规划能力让数据更新迎来了新的机会。在这你将迎来以下挑战:
1、追踪LLM/Agent的前沿技术:通过海量人工反馈资料,训练Agent替代人工,完成数据的自动化更新,降低成本、加快效率、提升质量
2、研究落地最新多模态对齐方案:在常见的图像、文本之外,我们场景中还包括位置信息(坐标),多模态对齐工作,对充分发挥数据价值,提升模型性能至关重要,是业内持续投入的重点&难点方向
任职要求
1、熟悉NLP算法,熟悉PPO、GRPO等强化学习算法
2、有大模型PEFT相关算法经验,有Full Fine-Tuning 经验优先
3、追踪LLM/Agent的前沿技术,持续提升自动化处理质量