工多多-星外工多多-强化学习算法工程师-【自动驾驶-设计并实现面向自动驾驶的强化学习训练框架

　星外工多多 [切换] 客服微信

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　企业信息页　　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	职位描述　用小程序查看更多
	设计并实现面向自动驾驶的强化学习训练框架，提升端到端大模型在稀疏场景下的训练效率和泛化能力；研发适用于驾驶决策、路径规划与交互博弈的强化学习算法，包括但不限于GRPO、PPO和DPO等，解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。

职位照片

尚未上传照片。

马上投简历　　收藏　　复制网址　　投诉下架

谁看过此职位

只显示非匿名用户

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服