|
|
| |
| |
工作地址 |
|
|
|
|
(广州市南沙区环市大道南2号之广州南沙资讯科技园霍英东研究院2004室)
用小程序查
用百度查
|
| |
职位描述 用小程序查看更多 |
|
岗位职责: 为大型语言模型(LLM)微调任务,完成多源数据的采集、清洗、去噪与格式化处理。 构建并维护结构清晰、高质量的指令微调和预训练数据集。 参与并优化SFT全流程,包括数据准备、质量评估与效果分析。 编写高效的数据处理脚本与自动化工具,持续提升数据准备效率。
任职要求: 精通 Python 及主流数据处理库(如Pandas、NumPy等),能独立完成大规模数据清洗与加工。 深入理解大语言模型微调(尤其是 SFT)的数据需求,掌握Prompt构建、数据标注格式设计等方法。 熟悉至少一种主流微调框架(如Hugging Face Transformers、PEFT等)。
加分项: 有实际参与大语言模型或深度学习模型微调项目的经验。 能熟练使用AI编程助手或聊天AI辅助代码编写、团队协作与问题排查。 具备快速学习并提炼陌生领域(如医疗、康复等)知识的能力。 |
|
| |
|
|
| |
|