|
|
| |
| |
强化学习算法工程师-【自动驾驶 点击:12次
工作编号:1823917
|
41666-83333/月 |
|
广州造父智能科技有限公司 查看企业资料及职位
|
2026-2-11 |
| 广州市-海珠区 无经验 | 硕士研究生 | 招5人 | 全职 |
|
| |
职位描述 用小程序查看更多 |
|
设计并实现面向自动驾驶的强化学习训练框架,提升端到端大模型在稀疏场景下的训练效率和泛化能力; 研发适用于驾驶决策、路径规划与交互博弈的强化学习算法,包括但不限于GRPO、PPO和DPO等,解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。 |
|
| |
|
|
| |
|